英偉達(dá)發(fā)布全新 AI 音頻模型 Fugatto
編譯/前方智能
英偉達(dá)近日推出了一款名為 Fugatto(全稱為 Foundational Generative Audio Transformer Opus 1)的 AI 音頻模型。這款模型不僅能通過文字提示生成音樂和音效,還能對現(xiàn)有音頻進(jìn)行修改和轉(zhuǎn)換,創(chuàng)造出前所未有的聲音組合。

圖源:英偉達(dá)
據(jù)英偉達(dá)介紹,F(xiàn)ugatto 具備多項獨(dú)特功能,比如可以將鋼琴演奏的音樂轉(zhuǎn)換為人聲演唱,能夠調(diào)整語音的口音和情緒,甚至可以創(chuàng)造出"尖叫的薩克斯"或"犬吠般的小號聲"等超現(xiàn)實(shí)音效。該模型采用了創(chuàng)新的 ComposableART 技術(shù),能夠?qū)⒂?xùn)練過程中分別出現(xiàn)的音頻特征進(jìn)行組合,從而產(chǎn)生全新的聲音效果。
在技術(shù)層面,研究團(tuán)隊使用了來自全球多個開源數(shù)據(jù)集的約 2000 萬個音頻樣本進(jìn)行訓(xùn)練,形成了一個擁有 25 億參數(shù)的大規(guī)模模型。該項目由來自印度、巴西、中國、約旦和韓國等多個國家的研究人員共同開發(fā),這種多元化的團(tuán)隊構(gòu)成也使得模型在處理多語言和多重口音方面表現(xiàn)出色。
英偉達(dá)應(yīng)用深度學(xué)習(xí)研究副總裁 Bryan Catanzaro 表示,生成式 AI 技術(shù)將為音樂、游戲和普通創(chuàng)作者帶來全新的創(chuàng)作可能性。不過,考慮到生成式技術(shù)可能帶來的潛在風(fēng)險,英偉達(dá)目前尚未計劃對外發(fā)布這項技術(shù)。
原文標(biāo)題 : 英偉達(dá)發(fā)布全新 AI 音頻模型 Fugatto
發(fā)表評論
請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
-
即日-5.20立即下載>> 【限時免費(fèi)】物理場仿真助力生物醫(yī)學(xué)領(lǐng)域技術(shù)創(chuàng)新
-
精彩回顧立即查看>> 【直播】 智測未來·2026海克斯康春季產(chǎn)品創(chuàng)新日
-
精彩回顧立即查看>> 【線下論壇】新唐科技×芯唐南京 2026 年度研討會
-
精彩回顧立即查看>> OFweek 2026(第十五屆)中國機(jī)器人產(chǎn)業(yè)大會
-
精彩回顧立即查看>> 維科杯· OFweek 2025中國機(jī)器人行業(yè)年度評選
-
精彩回顧立即查看>> 【在線會議】液冷服務(wù)器信號完整性及冷卻液關(guān)鍵電參數(shù)測試
推薦專題
- 1 特斯拉Optimus Gen3量產(chǎn)在即,哪些環(huán)節(jié)最具確定性?
- 2 OpenAI深夜王炸!ChatGPT Images 2.0實(shí)測:中文穩(wěn)、細(xì)節(jié)炸,設(shè)計師慌了
- 3 AI狂歡遇上油價破百,全球股市還能漲多久? | 產(chǎn)聯(lián)看全球
- 4 6000億美元估值錨定:字節(jié)跳動的“去單一化”突圍與估值重構(gòu)
- 5 Tesla AI5芯片最新進(jìn)展總結(jié)
- 6 連夜測了一波DeepSeek-V4,我發(fā)現(xiàn)它可能只剩“審美”這個短板了
- 7 熱點(diǎn)丨AI“瑜亮之爭”:既生OpenClaw,何生Hermes?
- 8 2026,人形機(jī)器人只贏了面子
- 9 AI界的殺豬盤:9秒刪庫跑路,全員被封號,還繼續(xù)扣錢!
- 10 AI Infra產(chǎn)業(yè)鏈卡在哪里了?
- 高級軟件工程師 廣東省/深圳市
- 自動化高級工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級銷售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術(shù)專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結(jié)構(gòu)工程師 廣東省/深圳市


分享













