行業(yè)洞察 | 誰(shuí)動(dòng)了藝術(shù)家的奶酪?
發(fā)布時(shí)間 : 2022-11-24 閱讀量 : 1548
近年來(lái),網(wǎng)絡(luò)短視頻逐步取代以報(bào)紙雜志為代表的紙媒。以視頻、音樂(lè)為代表的視頻媒體傳遞成為當(dāng)下的主流傳播媒體。但是你有沒有想過(guò),也許你刷到的短視頻是AI創(chuàng)作的?
AI生成短視頻
AIGC(Artificial Inteligence Generated Content)即人工智能生產(chǎn)的內(nèi)容。隨著AIGC的蓬勃發(fā)展,Meta和Google相繼推出文本生成視頻的黑科技。用戶可以根據(jù)自身需要輸入描繪某個(gè)場(chǎng)景的文本信息,即可生成與文字相匹配的短視頻,內(nèi)容生動(dòng)有趣。
樣例網(wǎng)站:https://make-a-video.github.io/

AI生成圖像
AI除了制作短視頻,還能進(jìn)行作畫、作曲、作詩(shī)等藝術(shù)創(chuàng)作,AIGC如一夜春風(fēng)般,席卷文化領(lǐng)域。未來(lái),AIGC、NFT和VR/AR或?qū)⒊蔀樵钪婧蚖eb3.0的三大基礎(chǔ)設(shè)施。隨著數(shù)據(jù)積累、算力提升和算法迭代,人工智能在逐步滲透在寫作、編曲、繪畫和視頻制作等創(chuàng)意領(lǐng)域。圖片來(lái)源Midjourney - Community Showcase

AI虛擬人
其實(shí)一直火爆全球的虛擬人,也是AIGC的作品。例如百度的AI數(shù)字人——希加加。不同于傳統(tǒng)的數(shù)字人,希加加的面部表情、形體表達(dá)、語(yǔ)音表述、回答內(nèi)容、肢體反應(yīng)、情緒反饋等外在表現(xiàn)和交互內(nèi)容,都是由AI實(shí)時(shí)生成的。其互動(dòng)效果和智能性更高,用戶體驗(yàn)感更好。圖片來(lái)源:百度 - AI數(shù)字人 希加加

AIGC底層創(chuàng)作原理
AIGC是以人工智能技術(shù)為核心,多項(xiàng)關(guān)鍵技術(shù)共同整合加持而成,其中包括多模態(tài)交互技術(shù)、3D數(shù)字人建模、機(jī)器翻譯、語(yǔ)音識(shí)別、自然語(yǔ)言理解等技術(shù)能力。AIGC 技術(shù)主要涉及兩個(gè)方面:自然語(yǔ)言處理 和 AIGC 生成算法。
自然語(yǔ)言處理:作為實(shí)現(xiàn)人與計(jì)算機(jī)之間如何通過(guò)自然語(yǔ)言進(jìn)行交互的手段,讓機(jī)器聽懂人的訴求,根據(jù)訴求生成符合要求的內(nèi)容,是AICG的第一步。
AIGC生成算法:目前主流的包括生成對(duì)抗網(wǎng)絡(luò)和擴(kuò)散模型。擴(kuò)散模型有潛力成為下一代圖像生成模型的代表,它具有高精度、以及可擴(kuò)展性和并行性等優(yōu)勢(shì),無(wú)論是質(zhì)量還是效率均有所提升,其快速發(fā)展成為 AIGC 增長(zhǎng)的拐點(diǎn)性因素。
同時(shí),在機(jī)器學(xué)習(xí)的過(guò)程中,需要通過(guò)大量的訓(xùn)練來(lái)實(shí)現(xiàn)更準(zhǔn)確的結(jié)果,目前以英偉達(dá) A100 為主,對(duì)于底層算力需求將有飛速增長(zhǎng)。決定AIGC創(chuàng)作作品質(zhì)量的三大核心因素是:生成算法、NLP算法以及高質(zhì)量的數(shù)據(jù)。算法的研究需要科研工作者的不懈努力,而高質(zhì)量的數(shù)據(jù)需要數(shù)據(jù)公司的貢獻(xiàn)。
Annotator 智能化標(biāo)注工具
由于AIGC算法的本質(zhì)是基于深度神經(jīng)網(wǎng)絡(luò)模型的,對(duì)數(shù)據(jù)量的要求自然也非常高。目前,由于缺乏帶有海量、高質(zhì)量標(biāo)注信息的數(shù)據(jù),成為制約AIGC發(fā)展的壁壘,而Magic Data智能化標(biāo)注平臺(tái)Annonator將能夠更好的助力研究人員。該平臺(tái)能夠?qū)崿F(xiàn)面向場(chǎng)景的多模態(tài)標(biāo)注,包括語(yǔ)音、視頻、文本、3D點(diǎn)云等各類功能。在節(jié)省人力物力財(cái)力的同時(shí),為構(gòu)建AIGC領(lǐng)域堅(jiān)實(shí)的數(shù)據(jù)基石。


Annotator智能化標(biāo)注平臺(tái) SaaS個(gè)人版 免費(fèi)申領(lǐng)通道