OpenAI發(fā)布首個(gè)視頻生成模型Sora:將AI戰(zhàn)場(chǎng)引向好萊塢

2024-02-17 09:09:32   來(lái)源:新浪科技   評(píng)論:0   [收藏]   [評(píng)論]
導(dǎo)讀:  OpenAI今日發(fā)布了一款新的AI產(chǎn)品Sora,用戶(hù)只需輸入文本,即可生成一段極其逼真且富有想象力的視頻,從而將戰(zhàn)事正酣的AI競(jìng)賽引向好萊塢。  OpenAI旗下的ChatGPT可以在不上法學(xué)院的情況下通過(guò)律師考試,而S...
  OpenAI今日發(fā)布了一款新的AI產(chǎn)品Sora,用戶(hù)只需輸入文本,即可生成一段極其逼真且富有想象力的視頻,從而將戰(zhàn)事正酣的AI競(jìng)賽引向好萊塢。

  OpenAI旗下的ChatGPT可以在不上法學(xué)院的情況下通過(guò)律師考試,而Sora則希望在不上電影學(xué)院的情況下拍攝電影。OpenAI稱(chēng),Sora能夠根據(jù)文本指令生成一段60秒的視頻,同時(shí)保持視覺(jué)質(zhì)量。

  它對(duì)語(yǔ)言有深刻的理解,能夠準(zhǔn)確領(lǐng)會(huì)提示,生成令人信服的角色。Sora可生成具有多個(gè)角色、特定類(lèi)型運(yùn)動(dòng)、精確主題和背景細(xì)節(jié)的復(fù)雜場(chǎng)景。還可以在單個(gè)生成視頻中創(chuàng)建多個(gè)鏡頭,準(zhǔn)確保留角色和視覺(jué)風(fēng)格。

  OpenAI今日還分享了幾個(gè)樣本視頻,證明了通過(guò)文本生成視頻的可能性。分析人士稱(chēng),這是一個(gè)新的研究方向,也是2024年值得關(guān)注的一個(gè)趨勢(shì)。OpenAI科學(xué)家Tim Brooks表示:“建立一套大模型,能夠理解視頻,理解我們世界中所有這些非常復(fù)雜的交互,是未來(lái)所有AI系統(tǒng)的重要一步。”

  動(dòng)畫(huà)場(chǎng)景中有一個(gè)短小的毛茸茸的怪物蹲在融化的紅色蠟燭旁的特寫(xiě)鏡頭。藝術(shù)風(fēng)格是3D和逼真的,重點(diǎn)是照明和紋理。這幅畫(huà)的氣氛是一種驚奇和好奇,因?yàn)楣治锉牬笱劬蛷堥_(kāi)嘴巴凝視著火焰。它的姿勢(shì)和表情傳達(dá)出一種天真無(wú)邪和嬉戲的感覺(jué),仿佛它是第一次探索周?chē)氖澜。暖色和戲劇性燈光的使用進(jìn)一步增強(qiáng)了圖像的舒適氛圍。

  一個(gè)渲染精美的紙制珊瑚礁世界,到處都是五顏六色的魚(yú)和海洋生物。

  幾只巨大的毛茸茸的猛犸象在白雪覆蓋的草地上走近,它們長(zhǎng)長(zhǎng)的毛茸茸的皮毛在風(fēng)中輕輕飄動(dòng),遠(yuǎn)處是白雪覆蓋的樹(shù)木和山脈。下午三點(diǎn)左右的光線(xiàn),遠(yuǎn)處的一縷云彩和高處的太陽(yáng),創(chuàng)造了溫暖的光芒。

  美麗、白雪皚皚的東京市熱鬧非凡。鏡頭穿過(guò)熙熙攘攘的城市街道,跟蹤幾個(gè)人享受美麗的下雪天氣,并在附近的攤位購(gòu)物。絢麗的櫻花花瓣和雪花隨風(fēng)飄揚(yáng)。

  盡管這些視頻已經(jīng)足夠驚艷,但Sora還有一個(gè)沒(méi)有展示的功能,OpenAI團(tuán)隊(duì)可能在很長(zhǎng)一段時(shí)間內(nèi)也不會(huì)發(fā)布,那就是從單個(gè)圖像或一系列幀生成視頻的能力。Brooks說(shuō):“這將是提高講故事能力的另一種很酷的方式。”

  它可以準(zhǔn)確地畫(huà)出你腦海中的東西,然后讓它栩栩如生。OpenAI意識(shí)到這一功能有可能產(chǎn)生深度假冒和錯(cuò)誤信息。Sora項(xiàng)目的研究人員Bill Peebles稱(chēng):“對(duì)于這方面的影響我們非常小心。”

  預(yù)計(jì)與Dall-E 3一樣, OpenAI將在暴力和色情等方面對(duì)Sora的內(nèi)容進(jìn)行限制。還有一個(gè)潛在的問(wèn)題是,Sora制作的視頻內(nèi)容是否會(huì)侵犯他人的版權(quán)作品。

  從“文字生成視頻”要威脅到實(shí)際的電影制作,可能還需要很長(zhǎng)一段時(shí)間。盡管OpenAI所展示的視頻令人印象深刻,但它們無(wú)疑都是精心挑選的,展示了Sora最好的一面。在沒(méi)有更多信息的情況下,很難知道它們對(duì)模型的典型輸出有多大的代表性。

  而且,也不能簡(jiǎn)單地將120個(gè)一分鐘長(zhǎng)的Sora片段拼接在一起來(lái)制作連貫的電影,因?yàn)槟P筒粫?huì)以完全相同的方式對(duì)提示做出反應(yīng),連續(xù)性難以保持。

  但不管怎樣,Sora已經(jīng)開(kāi)啟了新的征程,并且勢(shì)必將對(duì)娛樂(lè)和內(nèi)容創(chuàng)作行業(yè)帶來(lái)沖擊。市場(chǎng)研究公司ABI research高級(jí)分析師Reece Hayden稱(chēng),像Sora這類(lèi)AI模型將對(duì)數(shù)字娛樂(lè)市場(chǎng)產(chǎn)生重大影響,新的個(gè)性化內(nèi)容將在各個(gè)渠道傳播。

分享到:
責(zé)任編輯:zsz

網(wǎng)友評(píng)論