中國(guó)婦女報(bào)全媒體記者 高越
●Sora實(shí)現(xiàn)了從文字能力向多模態(tài)能力的橫空出世重大提升,可能成為OpenAI整合旗下各模型、何科構(gòu)造人工智能模型服務(wù)體系的橫空出世best365官網(wǎng)app下載開始,是何科其向通用人工智能邁進(jìn)的重要一步
●大眾傳媒可能是最先受Sora影響的領(lǐng)域,它強(qiáng)大的橫空出世語(yǔ)言理解能力極大降低了視頻的制作門檻,普通人也可以將內(nèi)心的何科構(gòu)思體現(xiàn)在連續(xù)的畫面中。同時(shí),橫空出世電影行業(yè)、何科創(chuàng)意產(chǎn)業(yè)、橫空出世數(shù)字娛樂(lè)和仿真產(chǎn)業(yè)同樣應(yīng)當(dāng)關(guān)注Sora的何科潛力
●Sora的出現(xiàn)可能帶來(lái)一定的知識(shí)產(chǎn)權(quán)侵權(quán)問(wèn)題。當(dāng)前,橫空出世有關(guān)輸入端數(shù)據(jù)涉及他人知識(shí)產(chǎn)權(quán)的何科,是橫空出世否屬于合理使用范圍;輸出端生成內(nèi)容的知識(shí)產(chǎn)權(quán)歸用戶還是歸模型方的問(wèn)題尚存爭(zhēng)議,各國(guó)未達(dá)成統(tǒng)一認(rèn)識(shí)

一名穿著時(shí)尚的何科女士在繁華的街道上散步、兩艘海盜船在咖啡杯里航行……只要輸入一段這樣簡(jiǎn)單的橫空出世文字,就能一鍵生成一段效果逼真的高質(zhì)量視頻。近日,美國(guó)開放人工智能研究中心(OpenAI)推出的視頻生成模型Sora一經(jīng)發(fā)布,便引發(fā)了全球震驚和廣泛熱議。Sora的發(fā)布意味著什么?將會(huì)影響哪些行業(yè)?存在哪些風(fēng)險(xiǎn)和隱患?中國(guó)婦女報(bào)全媒體記者就此采訪了相關(guān)專家。
向通用人工智能邁進(jìn)的best365官網(wǎng)app下載重要一步
Sora在其技術(shù)報(bào)告中表示模型可以生成最長(zhǎng)一分鐘的視頻,并且展示了數(shù)個(gè)畫面連貫、邏輯清晰的片段。中國(guó)信息通信研究院政策與經(jīng)濟(jì)研究所高級(jí)工程師程瑩認(rèn)為,Sora實(shí)現(xiàn)了從文字能力向多模態(tài)能力的重大提升,可能成為OpenAI整合旗下各模型、構(gòu)造人工智能模型服務(wù)體系的開始,是其向通用人工智能邁進(jìn)的重要一步。
程瑩認(rèn)為,Sora展現(xiàn)出了優(yōu)異的視頻生成性能,可能應(yīng)用于媒體行業(yè)、創(chuàng)意產(chǎn)業(yè)、游戲產(chǎn)業(yè)、元宇宙等領(lǐng)域,“有觀點(diǎn)指出Sora或許能同時(shí)參與到電影行業(yè)的腳本編寫、選角協(xié)助、鏡頭規(guī)劃和剪輯輔助等領(lǐng)域中?!蹦壳?,Sora已經(jīng)能模擬一定的物理交互性,并成功表現(xiàn)出與世界的一定互動(dòng),可能會(huì)從虛擬中創(chuàng)造出無(wú)限接近現(xiàn)實(shí)的內(nèi)容。
中國(guó)政法大學(xué)數(shù)據(jù)法治研究院教授、博士生導(dǎo)師張凌寒表示,Sora在生成時(shí)長(zhǎng)和質(zhì)量的表現(xiàn)超越了pika、runway等類似模型。開發(fā)團(tuán)隊(duì)披露Sora結(jié)合了兩種模型架構(gòu),并且采取了獨(dú)特的訓(xùn)練數(shù)據(jù)組織方式,可見(jiàn)Sora的問(wèn)世建立在技術(shù)創(chuàng)新的不斷積累上。OpenAI將Sora定位為“對(duì)物理世界的模擬”,這意味著OpenAI不僅想要占據(jù)多媒體生成領(lǐng)域的技術(shù)優(yōu)勢(shì)地位,還意圖整合旗下各模型功能創(chuàng)造出完整的虛擬世界、繼續(xù)探索通用人工智能的技術(shù)進(jìn)路。
張凌寒認(rèn)為,大眾傳媒可能是最先受Sora影響的領(lǐng)域,它強(qiáng)大的語(yǔ)言理解能力極大降低了視頻的制作門檻,普通人也可以將內(nèi)心的構(gòu)思體現(xiàn)在連續(xù)的畫面中。同時(shí),電影行業(yè)、創(chuàng)意產(chǎn)業(yè)、數(shù)字娛樂(lè)和仿真產(chǎn)業(yè)同樣應(yīng)當(dāng)關(guān)注Sora的潛力?!癝ora開發(fā)團(tuán)隊(duì)透露,Sora能夠模擬出數(shù)字游戲,在控制游戲角色進(jìn)行操作的同時(shí)渲染游戲世界,這對(duì)小團(tuán)隊(duì)開發(fā)者而言是降本增效的利器?!?/p>
“除了關(guān)注到它生成的視頻時(shí)間長(zhǎng)、質(zhì)量高、對(duì)于物理世界的模擬表現(xiàn)好以外,Sora呈現(xiàn)出多模態(tài)能力,文字、圖像、視頻等綜合能力都很強(qiáng),其整合模型還可能進(jìn)一步具備強(qiáng)大的聲音能力?!蓖瑵?jì)大學(xué)法學(xué)院助理教授、上海市人工智能社會(huì)治理協(xié)同創(chuàng)新中心研究員朱悅認(rèn)為,在如今內(nèi)容消費(fèi)碎片化背景下,它在短視頻行業(yè)的發(fā)展會(huì)有很大潛力,但如果將其用于時(shí)長(zhǎng)更長(zhǎng)、更嚴(yán)肅的生產(chǎn),還需要待完全對(duì)外發(fā)布后才能進(jìn)行判斷。
那它是不是完美的呢?朱悅認(rèn)為,從細(xì)節(jié)分析,Sora仍然存在一些明顯問(wèn)題,如對(duì)于物理規(guī)律并不能完全準(zhǔn)確地反映,光線陰影等細(xì)節(jié)設(shè)計(jì)并不完美,一些與生活認(rèn)知不一致的情況仍然會(huì)發(fā)生等。程瑩也同樣認(rèn)為,Sora的表現(xiàn)固然讓人興奮,但它不是完美的。Sora生成的視頻雖然在大體上符合邏輯,但同樣會(huì)出現(xiàn)如“人物咬過(guò)餅干后餅干仍然保持完整”的常識(shí)性錯(cuò)誤。開發(fā)團(tuán)隊(duì)也承認(rèn)Sora還欠缺精確推理事件發(fā)展的能力,例如電影中流暢的鏡頭變換對(duì)Sora而言就相對(duì)困難。
“眼見(jiàn)為實(shí)”將面臨更大的挑戰(zhàn)
Sora可能會(huì)有哪些風(fēng)險(xiǎn)和隱患?專家們一致表示,可能會(huì)存在侵犯知識(shí)產(chǎn)權(quán)、侵犯隱私、虛假視頻等隱患。
張凌寒認(rèn)為,圖像生成模型的訓(xùn)練數(shù)據(jù)集包含大量圖像素材,如果未經(jīng)審查就任意收集、使用相關(guān)素材的確可能侵犯知識(shí)產(chǎn)權(quán)和個(gè)人隱私。Sora生成的視頻雖然還不能完美地反映真實(shí)物理關(guān)系,但其已經(jīng)表現(xiàn)出使人誤解的可能。通常認(rèn)為修改和偽造視頻的技術(shù)難度較高,高性能視頻生成模型的問(wèn)世無(wú)疑降低了這種門檻?!把垡?jiàn)為實(shí)”的觀念即將面臨更大的挑戰(zhàn)。
例如近日,據(jù)香港媒體報(bào)道,中國(guó)香港警方發(fā)現(xiàn)有詐騙分子利用人工智能深度偽造技術(shù),通過(guò)公司的YouTube視頻和從其他公開渠道獲取的媒體資料,成功地仿造了英國(guó)公司高層管理人員的形象和聲音,在網(wǎng)上會(huì)議中冒充多名人士,騙取財(cái)務(wù)職員2億港元。
“深度合成的內(nèi)容越逼真,虛假視頻的風(fēng)險(xiǎn)就越高?!敝鞇傉J(rèn)為,從以往經(jīng)驗(yàn)來(lái)看,還有可能存在侵犯隱私、商標(biāo)侵權(quán)、出現(xiàn)冒犯性內(nèi)容等問(wèn)題,“如果在生成視頻中的訓(xùn)練素材中包含構(gòu)成隱私或者個(gè)人信息的真實(shí)生活的視頻,這些視頻是否會(huì)在后續(xù)輸出中完全重現(xiàn)是值得關(guān)注的問(wèn)題。”
程瑩表示,Sora的出現(xiàn)可能帶來(lái)一定的知識(shí)產(chǎn)權(quán)侵權(quán)問(wèn)題。當(dāng)前,有關(guān)輸入端數(shù)據(jù)涉及他人知識(shí)產(chǎn)權(quán)的,是否屬于合理使用范圍;輸出端生成內(nèi)容的知識(shí)產(chǎn)權(quán)歸用戶還是歸模型方的問(wèn)題尚存爭(zhēng)議,各國(guó)未達(dá)成統(tǒng)一認(rèn)識(shí)。例如OpenAI因知識(shí)產(chǎn)權(quán)問(wèn)題已受到紐約時(shí)報(bào)等多家企業(yè)訴訟,國(guó)內(nèi)法院近期也針對(duì)大模型服務(wù)侵權(quán)問(wèn)題作出探索。程瑩也認(rèn)為,Sora可能被濫用于虛假信息生成,進(jìn)而影響輿論政治生態(tài)、加劇電信詐騙的規(guī)?;珳?zhǔn)化等問(wèn)題。OpenAI公司承認(rèn),2024年美國(guó)總統(tǒng)大選前,參選各方有可能利用Sora等大模型技術(shù),釋放“煙霧彈”迷惑各地選民。
Sora是否存在性別歧視問(wèn)題?在張凌寒看來(lái),內(nèi)容歧視向來(lái)備受人工智能治理界的關(guān)注,性別歧視和偏見(jiàn)問(wèn)題則或多或少地存在于很多模型中,這并不以視頻生成模型為限。在不加干預(yù)的情況下,模型會(huì)接納事實(shí)上存在的歧視與偏見(jiàn),并可能在生成內(nèi)容中體現(xiàn)。Sora的開發(fā)團(tuán)隊(duì)承諾會(huì)著手解決內(nèi)容歧視、偏見(jiàn)問(wèn)題,待模型向公眾開放后便可見(jiàn)其成效。
在合法合規(guī)的基礎(chǔ)上發(fā)揮創(chuàng)意
我們應(yīng)該如何應(yīng)對(duì)這些風(fēng)險(xiǎn)和隱患?程瑩認(rèn)為,一是進(jìn)行定期審查評(píng)估。包括在數(shù)據(jù)標(biāo)注、清洗等訓(xùn)練數(shù)據(jù)處理環(huán)節(jié)進(jìn)行可信、公平性、準(zhǔn)確性等審查。二是提升透明度。推動(dòng)企業(yè)探索研發(fā)穩(wěn)定、不可篡改的數(shù)字水印技術(shù),在生成圖片或視頻中嵌入“AI生成”顯性水印,提示用戶辨別虛假信息,同時(shí)在內(nèi)部嵌入人類肉眼不可見(jiàn)的隱性水印,用于追蹤虛假內(nèi)容、版權(quán)侵權(quán)來(lái)源等。同時(shí)向政府披露訓(xùn)練數(shù)據(jù)來(lái)源、安全評(píng)估、模型權(quán)重等信息,加強(qiáng)政企間風(fēng)險(xiǎn)交流和互動(dòng)。三是采用以技治技思路。利用紅隊(duì)測(cè)試、人類反饋強(qiáng)化學(xué)習(xí)等技術(shù)工具手段,廣泛發(fā)動(dòng)跨學(xué)科專家力量,有效發(fā)現(xiàn)并優(yōu)化漏洞風(fēng)險(xiǎn)問(wèn)題。同時(shí)創(chuàng)新“版權(quán)盾”“人工智能憲法計(jì)劃”等企業(yè)責(zé)任方案,優(yōu)化治理生態(tài)。
在張凌寒看來(lái),從訓(xùn)練數(shù)據(jù)這個(gè)關(guān)鍵點(diǎn)出發(fā),建立開放、可信的訓(xùn)練數(shù)據(jù)審計(jì)制度和數(shù)據(jù)正向干預(yù)機(jī)制是值得探索的方向。生成內(nèi)容管理上,敏感提示詞過(guò)濾器和圖像判別器通常被認(rèn)為是模型服務(wù)必不可少的安全機(jī)制,Sora團(tuán)隊(duì)同樣表示會(huì)在模型服務(wù)開放前持續(xù)改進(jìn)相關(guān)機(jī)制的判別準(zhǔn)確率。
朱悅認(rèn)為,目前從法律層面來(lái)看,國(guó)內(nèi)已有法規(guī)出臺(tái)對(duì)各項(xiàng)風(fēng)險(xiǎn)進(jìn)行回應(yīng),如《生成式人工智能服務(wù)管理暫行辦法》《互聯(lián)網(wǎng)信息服務(wù)深度合成管理規(guī)定》等,在技術(shù)層面,目前仍在探索在模型上進(jìn)行價(jià)值對(duì)齊,讓它更接近于人們對(duì)公序良俗和良善的理解。同時(shí),還可以通過(guò)對(duì)關(guān)鍵詞進(jìn)行識(shí)別與屏蔽,對(duì)輸出內(nèi)容進(jìn)行識(shí)別和攔截,提高用戶的素質(zhì)素養(yǎng)等方式進(jìn)行治理,“我們可以期待更多相關(guān)案例的出現(xiàn),從而導(dǎo)向更完善和全面的人工智能立法,讓人們?cè)谝婪ㄒ酪?guī)、符合公序良俗的底線之上發(fā)揮想象和創(chuàng)意,向善使用人工智能技術(shù)?!?/p> 【責(zé)任編輯:李丹萍】
(作者:產(chǎn)品中心)