OpenAI發(fā)布首個(gè)視頻生成模型Sora：將AI戰(zhàn)場(chǎng)引向好萊塢

2024-02-17 09:09:32 來(lái)源：新浪科技評(píng)論：0 [收藏] [評(píng)論]

導(dǎo)讀：　　OpenAI今日發(fā)布了一款新的AI產(chǎn)品Sora，用戶(hù)只需輸入文本，即可生成一段極其逼真且富有想象力的視頻，從而將戰(zhàn)事正酣的AI競(jìng)賽引向好萊塢。　　OpenAI旗下的ChatGPT可以在不上法學(xué)院的情況下通過(guò)律師考試，而S...

　　OpenAI今日發(fā)布了一款新的AI產(chǎn)品Sora，用戶(hù)只需輸入文本，即可生成一段極其逼真且富有想象力的視頻，從而將戰(zhàn)事正酣的AI競(jìng)賽引向好萊塢。

　　OpenAI旗下的ChatGPT可以在不上法學(xué)院的情況下通過(guò)律師考試，而Sora則希望在不上電影學(xué)院的情況下拍攝電影。OpenAI稱(chēng)，Sora能夠根據(jù)文本指令生成一段60秒的視頻，同時(shí)保持視覺(jué)質(zhì)量。

　　它對(duì)語(yǔ)言有深刻的理解，能夠準(zhǔn)確領(lǐng)會(huì)提示，生成令人信服的角色。Sora可生成具有多個(gè)角色、特定類(lèi)型運(yùn)動(dòng)、精確主題和背景細(xì)節(jié)的復(fù)雜場(chǎng)景。還可以在單個(gè)生成視頻中創(chuàng)建多個(gè)鏡頭，準(zhǔn)確保留角色和視覺(jué)風(fēng)格。

　　OpenAI今日還分享了幾個(gè)樣本視頻，證明了通過(guò)文本生成視頻的可能性。分析人士稱(chēng)，這是一個(gè)新的研究方向，也是2024年值得關(guān)注的一個(gè)趨勢(shì)。OpenAI科學(xué)家Tim Brooks表示：“建立一套大模型，能夠理解視頻，理解我們世界中所有這些非常復(fù)雜的交互，是未來(lái)所有AI系統(tǒng)的重要一步。”

　　動(dòng)畫(huà)場(chǎng)景中有一個(gè)短小的毛茸茸的怪物蹲在融化的紅色蠟燭旁的特寫(xiě)鏡頭。藝術(shù)風(fēng)格是3D和逼真的，重點(diǎn)是照明和紋理。這幅畫(huà)的氣氛是一種驚奇和好奇，因?yàn)楣治锉牬笱劬蛷堥_(kāi)嘴巴凝視著火焰。它的姿勢(shì)和表情傳達(dá)出一種天真無(wú)邪和嬉戲的感覺(jué)，仿佛它是第一次探索周?chē)氖澜�。暖色和戲劇性燈光的使用進(jìn)一步增強(qiáng)了圖像的舒適氛圍。

　　一個(gè)渲染精美的紙制珊瑚礁世界，到處都是五顏六色的魚(yú)和海洋生物。

　　幾只巨大的毛茸茸的猛犸象在白雪覆蓋的草地上走近，它們長(zhǎng)長(zhǎng)的毛茸茸的皮毛在風(fēng)中輕輕飄動(dòng)，遠(yuǎn)處是白雪覆蓋的樹(shù)木和山脈。下午三點(diǎn)左右的光線(xiàn)，遠(yuǎn)處的一縷云彩和高處的太陽(yáng)，創(chuàng)造了溫暖的光芒。

　　美麗、白雪皚皚的東京市熱鬧非凡。鏡頭穿過(guò)熙熙攘攘的城市街道，跟蹤幾個(gè)人享受美麗的下雪天氣，并在附近的攤位購(gòu)物。絢麗的櫻花花瓣和雪花隨風(fēng)飄揚(yáng)。

　　盡管這些視頻已經(jīng)足夠驚艷，但Sora還有一個(gè)沒(méi)有展示的功能，OpenAI團(tuán)隊(duì)可能在很長(zhǎng)一段時(shí)間內(nèi)也不會(huì)發(fā)布，那就是從單個(gè)圖像或一系列幀生成視頻的能力。Brooks說(shuō)：“這將是提高講故事能力的另一種很酷的方式。”

　　它可以準(zhǔn)確地畫(huà)出你腦海中的東西，然后讓它栩栩如生。OpenAI意識(shí)到這一功能有可能產(chǎn)生深度假冒和錯(cuò)誤信息。Sora項(xiàng)目的研究人員Bill Peebles稱(chēng)：“對(duì)于這方面的影響我們非常小心。”

　　預(yù)計(jì)與Dall-E 3一樣， OpenAI將在暴力和色情等方面對(duì)Sora的內(nèi)容進(jìn)行限制。還有一個(gè)潛在的問(wèn)題是，Sora制作的視頻內(nèi)容是否會(huì)侵犯他人的版權(quán)作品。

　　從“文字生成視頻”要威脅到實(shí)際的電影制作，可能還需要很長(zhǎng)一段時(shí)間。盡管OpenAI所展示的視頻令人印象深刻，但它們無(wú)疑都是精心挑選的，展示了Sora最好的一面。在沒(méi)有更多信息的情況下，很難知道它們對(duì)模型的典型輸出有多大的代表性。

　　而且，也不能簡(jiǎn)單地將120個(gè)一分鐘長(zhǎng)的Sora片段拼接在一起來(lái)制作連貫的電影，因?yàn)槟Ｐ筒粫?huì)以完全相同的方式對(duì)提示做出反應(yīng)，連續(xù)性難以保持。

　　但不管怎樣，Sora已經(jīng)開(kāi)啟了新的征程，并且勢(shì)必將對(duì)娛樂(lè)和內(nèi)容創(chuàng)作行業(yè)帶來(lái)沖擊。市場(chǎng)研究公司ABI research高級(jí)分析師Reece Hayden稱(chēng)，像Sora這類(lèi)AI模型將對(duì)數(shù)字娛樂(lè)市場(chǎng)產(chǎn)生重大影響，新的個(gè)性化內(nèi)容將在各個(gè)渠道傳播。

分享到：

責(zé)任編輯：zsz

更多相關(guān)搜索：

新聞
圖片
下載
專(zhuān)題

返回產(chǎn)品頻道

快速導(dǎo)航：新聞立場(chǎng) 角度消費(fèi) 服務(wù) 產(chǎn)品

OpenAI發(fā)布首個(gè)視頻生成模型Sora：將AI戰(zhàn)場(chǎng)引向好萊塢

網(wǎng)友評(píng)論

智能應(yīng)用排行

延伸閱讀

最新智能應(yīng)用