OpenAI展示新音頻工具 可朗讀文本并模仿聲音
該公司分享了名為“語音引擎”(Voice Engine)的文本轉(zhuǎn)語音模型小規(guī)模試用的早期演示和用例,據(jù)發(fā)言人介紹,目前約有10家開發(fā)商可使用該模型。OpenAI在3月早些時候向記者介紹了這一功能,但決定暫不大規(guī)模發(fā)布。
OpenAI的發(fā)言人說該公司在收到政策制定者、行業(yè)專家、教育工作者和創(chuàng)意人士等利益相關(guān)方的反饋后決定縮減發(fā)布規(guī)模。據(jù)早前的新聞發(fā)布會介紹,該公司原本計劃通過申請流程向多達100家開發(fā)商發(fā)布該工具。
其他AI技術(shù)已經(jīng)在某些情境下被用來偽造聲音。今年1月,一通自稱喬·拜登(Joe Biden)總統(tǒng)打來的以假亂真的電話呼吁新罕布什爾州居民不要在初選中投票,這一事件在全球關(guān)鍵選舉前加劇了對AI的恐懼。
與OpenAI過去生成音頻的功能不同,語音引擎可以創(chuàng)建聽起來像具體個人的聲音,并完整呈現(xiàn)特有的語調(diào)和語氣。該軟件只需要一段15秒的錄音,即可重現(xiàn)一個人的聲音。
“只要音頻設(shè)置得當(dāng),基本就能得出人類水準(zhǔn)的聲音。”OpenAI產(chǎn)品負責(zé)人杰夫·哈里斯(Jeff Harris)說,“這種技術(shù)質(zhì)量非常了不起。”但哈里斯也表示,“準(zhǔn)確模仿人類語音的能力顯然存在很多安全上的不確定性。”
非營利性醫(yī)療系統(tǒng)Lifespan旗下的Norman Prince Neurosciences Institute是OpenAI目前的開發(fā)合作伙伴之一,該機構(gòu)正在利用此項技術(shù)幫助患者恢復(fù)聲音。例如,據(jù)OpenAI的博客文章,該工具被用于恢復(fù)一位因腦瘤失去清晰說話能力的年輕患者的聲音,方法是復(fù)制她此前為一個學(xué)校項目錄制的發(fā)言。
OpenAI的自定義語音模型還可將生成的音頻翻譯成不同語言。這對于音頻行業(yè)公司非常有用,比如Spotify Technology SA。Spotify已經(jīng)在自己的試點計劃中利用該技術(shù)來翻譯萊克斯·弗里德曼(Lex Fridman)等熱門主持人的播客節(jié)目。OpenAI還宣傳了該技術(shù)的其他有益應(yīng)用,例如為兒童教育內(nèi)容創(chuàng)建更多樣化的聲音。
在測試計劃中,OpenAI要求合作伙伴同意其使用政策,即在使用原始聲音前征得聲音主人的同意,并告知聽眾他們聽到的是AI生成的聲音。該公司還加入了聽不見的音頻水印,以判斷哪些音頻由其工具創(chuàng)建。
OpenAI表示在決定是否大范圍發(fā)布該功能前,正在征求外部專家的反饋。該公司在博文中表示:“讓全球人民了解這項技術(shù)的發(fā)展方向至關(guān)重要,不論我們最終是否親自廣泛部署它。”
OpenAI還寫道,希望其軟件的試用能“激發(fā)增強社會韌性的需求”,以應(yīng)對更先進的AI技術(shù)帶來的挑戰(zhàn)。例如,該公司呼吁銀行逐步停止將語音身份驗證作為訪問銀行賬戶和敏感信息的安全措施。它還尋求開展公眾教育,幫助大家了解欺騙性的AI內(nèi)容,并開發(fā)更多技術(shù)來檢測音頻內(nèi)容是否由AI生成。
網(wǎng)友評論
智能應(yīng)用排行
- 網(wǎng)易 UU 加速器完成鴻蒙原生應(yīng)用開發(fā),上線 HarmonyOS
- 蘋果官方認(rèn)可“越獄”術(shù)語:特殊版iPhone罕見現(xiàn)身 用于查找
- 京東11.11再次發(fā)力數(shù)字人:成本更低、直播流量傾斜,成電商
- 釘釘公布數(shù)據(jù):用戶數(shù)7億 軟件付費企業(yè)數(shù)12萬
- AI大模型讓智慧交通“更聰明” 海信亮相2024世界人工智能大
- 沃爾瑪?shù)娜斯ぶ悄芰闶鄣暌严蚬婇_放
- 歐瑞博攜手南方科技大學(xué)打造智能新能源住宅技術(shù)聯(lián)合實驗室
- 都是科技的狠活?2024中國國際消費電子博覽會即將全新亮相
- 百度:智能云業(yè)務(wù)Q1營收47億元,生成式AI貢獻比例達6.9%
延伸閱讀
- OpenAI推出ChatGPT“克星”:可識別文章是否人工智能代筆
- 游戲聊天社區(qū)Discord整合OpenAI技術(shù) 推出多項新功能
- Zoom引入OpenAI生產(chǎn)力功能 推出數(shù)字助手
- “微軟+OpenAI”聯(lián)手的新一站:網(wǎng)絡(luò)安全
- 日本政府或引入人工智能技術(shù) OpenAI考慮開設(shè)日本辦公室
- 歐盟官員將于6月會見OpenAI CEO:討論人工智能法規(guī)
- OpenAI:超智能AI或在這個十年出現(xiàn),將加大資源應(yīng)對
- Meta正在開發(fā)更強大的AI系統(tǒng) 對標(biāo)OpenAI
- 微軟據(jù)悉正自主研發(fā)AI模型 降低對OpenAI的依賴
- OpenAI發(fā)布首個視頻生成模型Sora:將AI戰(zhàn)場引向好萊塢
最新智能應(yīng)用
- 京東11.11再次發(fā)力數(shù)字人:成本更低、直播流量傾
- 歐瑞博攜手南方科技大學(xué)打造智能新能源住宅技術(shù)聯(lián)
- 網(wǎng)易 UU 加速器完成鴻蒙原生應(yīng)用開發(fā),上線 H
- 都是科技的狠活?2024中國國際消費電子博覽會即將
- 百度沈抖:百舸4.0升級發(fā)布,模型訓(xùn)練有效時長達
- 華為云發(fā)布AI原生云基礎(chǔ)設(shè)施架構(gòu)CloudMatrix,新
- 阿里CEO吳泳銘:AI算力需求滲透率已超50%,正主導(dǎo)
- 羅技發(fā)布 G PRO 2 LIGHTSPEED(GPW4 朱雀)
- 華為:將啟動“鴻蒙生態(tài)伙伴及開發(fā)者見非凡體驗計
- 華為運動健康發(fā)布玄璣感知系統(tǒng) 華為手表或?qū)⒅С?/a>