合成媒體因其操縱感知的能力而受到廣泛關(guān)注,尤其是通過深度偽造。然而,它不僅僅是深度造假。合成媒體是使用人工智能生成的任何媒體,例如視頻、圖片、聲音、文本或虛擬對(duì)象。
隨著越來越多的企業(yè)高管充分發(fā)揮合成媒體的潛力,它的使用將極大地改變各個(gè)行業(yè)和應(yīng)用程序,展示出驚人的效果。2021 年全球合成媒體市場(chǎng)規(guī)模估計(jì)為 178.22 億美元,預(yù)計(jì)到2027年將達(dá)到35620.9 億美元,復(fù)合年增長(zhǎng)率為 12.23%。
本文探討了合成媒體、其各種類型、應(yīng)用以及創(chuàng)建和使用合成媒體的一些倫理考慮。
什么是合成媒體?
合成媒體,通常稱為 AI 生成的媒體,是指使用 AI 算法生成或操縱的數(shù)字媒體。它是使用人工智能技術(shù)生成的虛擬內(nèi)容的尖端形式。合成媒體擁有高度的真實(shí)感和沉浸感,通常使內(nèi)容與現(xiàn)實(shí)世界的媒體無法區(qū)分。
它可用于多種用途,包括娛樂、廣告、新聞和研究。例如,零食品牌 Lays 使用 deepfake 技術(shù)(深度學(xué)習(xí) + fake = deepfake),讓足球迷可以發(fā)送定制視頻,讓梅西在簡(jiǎn)單直觀的視頻體驗(yàn)中直呼朋友的名字。
主要類型
公司越來越多地投資于人工智能驅(qū)動(dòng)的內(nèi)容創(chuàng)作,挖掘合成媒體的巨大潛力。專家預(yù)測(cè),到2025 年,90% 的在線內(nèi)容將由人工智能生成。讓我們看一下 4 種主要形式。
1. 合成文本生成
它指的是使用人工智能,包括自然語言處理(NLP),來生成書面內(nèi)容,例如文章、新聞、故事和社交媒體帖子。
例如,GPT 3(Generative Pre-Trained Transformer 3)是 OpenAI 開發(fā)的一種語言模型,可以生成類人文本并回答你的問題。
2.合成圖像生成
合成成像是一種使用數(shù)學(xué)算法和數(shù)據(jù)生成二維視覺圖像的計(jì)算方法,而不是使用相機(jī)或光學(xué)器件捕獲光波的傳統(tǒng)攝影技術(shù)。人工智能的進(jìn)步使得生成具有無與倫比的真實(shí)感的合成圖像成為可能。這些圖像引起了極大的關(guān)注,并在廣泛的領(lǐng)域找到了應(yīng)用,從創(chuàng)建 NFT 藝術(shù)到生成逼真的庫(kù)存照片。
例如,現(xiàn)代電影,如《阿凡達(dá)》、《星球大戰(zhàn)》和《復(fù)仇者聯(lián)盟》,使用計(jì)算機(jī)生成的圖像 (CGI) 來創(chuàng)建逼真的世界或添加現(xiàn)實(shí)中不可能制作的特效。
3.合成音頻生成
合成音頻生成是生成模仿人聲或樂器聲音的音頻或使用人工智能改變?cè)悸曇舻倪^程。這是通過使用不同的技術(shù)實(shí)現(xiàn)的,例如將文本轉(zhuǎn)換為音頻的文本到語音 (TTS) 算法或機(jī)器學(xué)習(xí)以生成類似于現(xiàn)有音頻模式的新音頻。
合成音頻生成有多種應(yīng)用,包括虛擬助手、視頻游戲和殘障人士輔助工具。例如,用戶可以使用 Resemble.ai 等工具在他們的數(shù)字化身中克隆聲音。
4. 合成視頻生成
合成視頻是使用計(jì)算機(jī)圖形人工創(chuàng)建的視頻類型。它模擬真實(shí)場(chǎng)景和環(huán)境,并可以生成新的或虛構(gòu)的視頻。它的不同應(yīng)用包括 deepfake、數(shù)字化身和 AI 影響者。
另一種合成視頻是人臉表演,其中一個(gè)人控制目標(biāo)人物的面部表情。這項(xiàng)技術(shù)的另一個(gè)突破是文本到視頻的生成。這已經(jīng)通過文本到圖像 CogView2 背面的CogVideo (文本到視頻 AI 工具)等工具成為商業(yè)話語的一部分。
真實(shí)世界的合成媒體應(yīng)用
合成媒體可以通過開辟新的可能性和機(jī)會(huì)來徹底改變多個(gè)行業(yè)。讓我們仔細(xì)看看它是如何影響各個(gè)行業(yè)的。
娛樂產(chǎn)業(yè)
娛樂業(yè)是合成媒體已經(jīng)掀起波瀾的地方。這項(xiàng)創(chuàng)新技術(shù)正被用于虛擬現(xiàn)實(shí)和增強(qiáng)現(xiàn)實(shí),以及電影和電視制作,以產(chǎn)生令人驚嘆的視覺效果和其他引人入勝的內(nèi)容。
博彩業(yè)
游戲行業(yè)也見證了合成媒體采用的激增。從生成逼真的環(huán)境到創(chuàng)建不可玩角色 (NPC) 以及改進(jìn)游戲圖形和音頻,它增強(qiáng)了游戲體驗(yàn)。
商業(yè)
人工智能聊天機(jī)器人和虛擬助手在電子商務(wù)、醫(yī)藥、銀行和房地產(chǎn)等多個(gè)行業(yè)發(fā)揮著重要作用。它改變了企業(yè)處理客戶服務(wù)、銷售和溝通的方式,同時(shí)為營(yíng)銷和廣告活動(dòng)提供有價(jià)值的數(shù)據(jù)。
教育
教育是另一個(gè)受益于合成媒體的領(lǐng)域,因?yàn)樗锌赡芡ㄟ^為學(xué)生提供更具吸引力和互動(dòng)性的學(xué)習(xí)體驗(yàn)來徹底改變教育的提供和接受。此外,它還可用于創(chuàng)建多種語言的教育內(nèi)容,使更多的受眾能夠訪問教育材料。
此外,它還被用于開發(fā) AI Teacher 來幫助學(xué)生完成工作。例如,CodeBrainer開發(fā)了一個(gè)名為 Cobie AI 的軟件,它可以解釋內(nèi)容、跟隨學(xué)生并幫助他們。
合成媒體——道德和社會(huì)后果
有許多現(xiàn)實(shí)世界的場(chǎng)景會(huì)產(chǎn)生倫理和社會(huì)影響。例如:
它可以通過deepfake音頻和視頻更快地傳播錯(cuò)誤信息,對(duì)個(gè)人和組織造成傷害。
隱私問題可能會(huì)出現(xiàn),因?yàn)楹铣擅襟w可以在未經(jīng)個(gè)人同意的情況下創(chuàng)建逼真的個(gè)人模仿。
某些行業(yè)采用合成媒體可能會(huì)導(dǎo)致大量失業(yè),因?yàn)闄C(jī)器可以在客戶服務(wù)和內(nèi)容創(chuàng)建等角色中取代人工。
組織將創(chuàng)造將人工任務(wù)與人工智能相結(jié)合的新工作,從而需要提高全球勞動(dòng)力的技能。
了解這項(xiàng)先進(jìn)技術(shù)的潛在影響并采取措施減輕它可能對(duì)社會(huì)產(chǎn)生的任何負(fù)面影響至關(guān)重要。
合成媒體:數(shù)字創(chuàng)作的未來
合成媒體正在改變我們創(chuàng)建和消費(fèi)內(nèi)容的方式。它在真實(shí)性和易用性方面正在迅速改進(jìn),并提供了出色的結(jié)果。隨著合成媒體的進(jìn)步,潛在的好處可能很多,包括增強(qiáng)可訪問性和創(chuàng)建更具吸引力的內(nèi)容,以及個(gè)性化的學(xué)習(xí)體驗(yàn)。