OpenAI發(fā)布新人工智能系統(tǒng):根據(jù)文字生成圖像

2021-01-07 09:48:44   來源:新浪   評論:0   [收藏]   [評論]
導(dǎo)讀:  舊金山人工智能研究公司OpenAI已經(jīng)開發(fā)了一種新系統(tǒng),能根據(jù)短文本來生成圖像! penAI在官方博客中表示,這個新系統(tǒng)名為DALL-E,名稱來源于藝術(shù)家薩爾瓦多·達利(Salvador Dali)和皮克斯的機器人英雄瓦
  舊金山人工智能研究公司OpenAI已經(jīng)開發(fā)了一種新系統(tǒng),能根據(jù)短文本來生成圖像。

  OpenAI在官方博客中表示,這個新系統(tǒng)名為DALL-E,名稱來源于藝術(shù)家薩爾瓦多·達利(Salvador Dali)和皮克斯的機器人英雄瓦力(WALL-E)的結(jié)合。新系統(tǒng)展示了“為一系列廣泛的概念”創(chuàng)造圖像的能力,創(chuàng)作的作品包括牛油果形狀的扶手椅等。

  通過神經(jīng)網(wǎng)絡(luò)去生成圖像,這種技術(shù)并不新穎。此前,生成對抗網(wǎng)絡(luò)(GAN)已被廣泛用于創(chuàng)建真實的人、寵物、租賃房產(chǎn)和食物的照片。

  不過,DALL-E的獨特之處在于可以根據(jù)輸入的文本來創(chuàng)作圖像。該系統(tǒng)基于文字生成系統(tǒng)GPT-3的一個版本,該系統(tǒng)此前被用于撰寫詩歌和新聞文章等。利用配對好的文本和圖像數(shù)據(jù)集進行訓(xùn)練,DALL-E可以根據(jù)新的文字提示生成圖像,此外還展示了創(chuàng)造多種風(fēng)格圖片的能力。

  OpenAI還發(fā)布了圖像識別系統(tǒng)Clip。Clip通用性比當(dāng)前針對單個任務(wù)的系統(tǒng)更好,可以用網(wǎng)上公開的文字圖像配對數(shù)據(jù)集來訓(xùn)練。

  DALL-E還需要繼續(xù)優(yōu)化。OpenAI指出,DALL-E目前的可靠性還存在問題,對類似“glass”等有多個含義的名詞常常會混淆,文字中不同的語法也可能會造成不同的結(jié)果。

  此外還有更深層次的問題需要解決。OpenAI表示:“我們注意到,涉及生成模型的工作可能會產(chǎn)生重大而廣泛的社會影響。”未來可能的舉措包括研究對就業(yè)崗位的影響,生成結(jié)果的偏見,以及技術(shù)的長期道德挑戰(zhàn)。

  長期以來,公眾一直擔(dān)心人工智能生成的媒體內(nèi)容被濫用,例如神經(jīng)網(wǎng)絡(luò)被用來制造虛假的音視頻和圖像,用于不道德的目的,例如政治上的假信息和欺詐活動等。

分享到:
責(zé)任編輯:zsz

網(wǎng)友評論