當AI比人類更具創造力後，會解鎖怎樣的商業新世界？

由介面新聞發表于網路遊戲
2022-12-02

AI 作畫生成 AIGC 模型

簡介在Disco Diffusion上使用不同藝術家風格基於同樣兩句描述語所生成的不同風格AI畫作實際上，AI作畫這項技術並不新鮮，但是文字轉圖片這種形式將創作門檻拉到了足夠低，得以讓很多人體驗用AI進行藝術創作

病變歌詞表達什麼意思

記者 |

姜菁玲

編輯 |

宋佳楠

輸入指令：貓，困惑，故障藝術，

一副創意作品就這樣產生

，用時不到30秒。

這正是全球爆火的AI作畫。利用AI繪畫工具，你只需輸入不同的詞彙，例如不同的藝術家風格、構圖、色彩、透視方法以及修飾詞，就

能

快速得到符合詞彙主題的畫作。你可以充分發揮自己的想象力，而任何一個關鍵詞的變動都可能產生完全不一樣的結果。

在Disco Diffusion上使用不同藝術家風格基於同樣兩句描述語所生成的不同風格AI畫作

實際上，AI

作畫

這項技術並不新鮮，但是文字轉圖片這種

形式將創作門檻

拉到了足夠低，

得以讓很多人體驗用AI進行藝術創作。

社交媒體上，抱著獵奇心態的使用者驚訝於AI在繪畫領域已經實現的驚人創造力，但在另一面，人類對AI的焦慮感

再度

爆發。

2022年8月，美國科羅拉多州博覽會的一項藝術比賽中，一位遊戲設計師用AI繪畫工具midjourney創作了一幅《太空歌劇院》畫像，並獲得了藝術比賽第一名。該訊息引發了畫師群體對於人工智慧創作的劇烈討伐：人工智慧能否正義地利用畫師的成果進行模型訓練

？

與人類在繪畫上同臺競技是否公平

？

是否會對畫師職業形成巨大挑戰？

不安的情緒還蔓延至其他領域。

一個月後

，一位學生沮喪地聲稱OpenAI GPT-3模型替自己撰寫的論文獲得了全A成績，帖子發表後快速登上推特熱搜，眾多教授開始表達對於人工智慧論文的擔憂。GPT-3模型能夠支援使用者僅僅輸入一些關鍵詞句指令，幫助輸出任意一篇詩歌、散文、新聞報道和創意小說。

過去很長一段時間，人類對AI的想象建立在有足夠安全感的基礎上，因為受技術

所

限，AI在創造力上幾乎沒有什麼真正意義上的進展，更多地在替代人類從事那些可重複性高的“dirty work”。

但現在，一切正在改變。

AIGC解鎖

新

世界

2018年，一副由人工智慧生成的肖像畫在佳士得被拍出了43。25萬美元，成為世界上首個出售的人工智慧藝術品。

《Edmond de Belamy》

畫面中的男人

面目模糊，身穿黑色袍子，有著濃厚的中世紀風格。右下角的作者署名區，顯示著一行數學公式，以

告知

人們這是人工智慧所作。

為了“畫出”這件作品，它的創造者Obvious組織成員利用了一個名為“生成性對抗網路”（Generative Adversarial Network，GAN）的模型，用1。5萬個十四世紀至二十世紀之間的肖像畫資料對模型進行了投餵，直到產出的圖片透過圖靈測試。

這幅畫的拍賣在當時引

發

了眾多關注。Obvious組織

趁勢

提出了一個直擊人心的口號：“創造力不僅屬於人類”。它們

想要

證明， AI也能成為一等的藝術家。

AI作畫是AIGC（Artificial Intelligence Generated Content）裡面的一個分支，指的是一種透過AI技術來自動或輔助生成內容的生產方式。透過輸入指令，人類讓AI去完成冗雜的程式碼、繪圖、建模等任務，從而生成內容。

除了AI繪畫，如今的AI還可以解鎖寫詩、作曲、換臉、捏臉等等需要創造力的工作。

今年9月，Meta公司推出了Make-A-Video人工智慧系統，它可以利用幾個關鍵詞或幾行文字描述生成一個幾秒鐘的短影片，甚至還能透過給定的影片或影象，來製作影片。

10月，在一檔人工智慧部落格節目中，已故的蘋果創始人喬布斯竟然成為首位嘉賓，與美國知名播客主持人Joe Rogan進行了一場長達20分鐘的交流，討論了喬布斯對大學、計算機的看法以及工作狀態、信仰等。這檔

名為podcast。ai的

節目將喬布斯的傳記和網路上的錄音，用Play。ht模型進行大量訓練，最終產生出與喬布斯對談的內容。

繼專業生成內容（Professional Generated Content，PGC）和使用者生成內容（User Generated Content，UGC）之後，AIGC正在成為一種新型內容生產方式。

9月舉辦的2022永珍·百度移動生態大會上，百度釋出了一組“AI打工天團”，覆蓋了各種AIGC應用，包括AI自動生成文字、圖片，圖片轉換成影片。百度稱，這個團隊裡不僅有文案、插畫師，還有影片製作人，熬夜加班的活兒都可以交給AI。

更早之前，海外微軟“小冰”的音樂已經實現旋律、編曲及歌詞端一體化；2019年，中國平安AI作曲在世界AI作曲國際大獎賽中獲得第一，創作AI交響變奏曲《我和我的祖國》；今年年初，網易利用AI系統成功製作出兩首國風作品《耀染先農》和《春啟正陽》。

紅杉美國的兩位合夥人在一篇題為《Generative AI： A Creative New World》的報告中表示，機器開始嘗試創造有意義和美麗的東西，這個新類別被稱為“生成式AI（Generative AI）”，這意味著機器正在生成新的東西，而不是分析已經存在的東西。

圖源：《Generative AI： A Creative New World》

這份報告中顯示，從2020年到2025年，AI生成的技術將會不斷成熟，逐步可以生成文字、圖片、語音、程式碼、影片以及遊戲模型等等，而社交媒體、設計、遊戲、程式碼生成等行業將迎來革新性改變。

AI作畫為何突然爆火？

AI作畫的熱潮已經顯現在資本市場。

2022年上半年開始，加入AI作畫賽道的廠商越來越多。在國外，半年內湧現出Stable Diffusion、Disco Diffusion、DALL-E2、Mid Journey、Photosonic AI多家AI作畫公司。國內，Tiamat、蜜度、百度文心、6Open等一批公司開始對外推出相關產品。

它們的迭代速度非常之快。“今年5月之前，AI所能生成的還是幾乎沒有商業價值的圖片，但現在已經進入準商用級別了。”Tiamat創始人青柑告訴介面新聞記者，在早期研發特色管線的過程中，需要對資料、反饋系統進行不斷調整，但是跑通一個管線之後，就會快速迭代，根據不同商業化場景進行管線定製。

這使得該賽道

迅速成為資本圈的新寵。10月18日，上線僅兩個月的AI作畫平臺StableDiffusion，產出作品超過200萬張，其背後公司StabilityAI獲得新一輪1。01億美元融資，公司估值突破10億美元，成為新晉獨角獸企業。10月，國內AIGC初創公司Tiamat宣佈獲得來自DCM的數百萬美元天使輪融資。

圖源：Midjourny

AI展現繪畫、寫詩等技能，

本質上屬於自然語言生成Natural Language Generation（NLG）的應用，是NLP自然語言處理技術的一大類任務，已經應用了將近30年。

但用Tiamat創始人青柑的話說，過去對AI的運用“更多像是學術界的自嗨”

。而今年AI創作的技術因為一種呈現為文字轉影象（Text-to-image）特性的嶄新互動方式，允許大眾開始參與自主創作，不僅僅停留在實驗室和科技展會中的Demo。

多位AI作畫廠商向介面新聞記者分析，AI作畫能夠快速成為低門檻的產品背後，主要是底層模型技術的革新。

傳統AI繪畫的的技術原理是生成對抗網路（GAN）或VAE等。而GAN作為上一代AI繪畫工具與平臺最主流的影象生成模型，在模型訓練方面已經有了很大的突破，但在實際應用的過程中仍然擁有嚴重的結構性問題，比如當用戶希望生成“眼睛長在鼻子下面的人臉”，或“戴著用鮮花構成的眼鏡”這種域外（Out-Of-Domain）的結果時，GAN通常會失效。

而在操作上，這類模型一般由使用者提供草圖，由GAN模型將其轉化為真實的風景影象，使用者無法透過文字影響生成結果。

直到CLIP與Diffusion模型開始出現並相互結合，文字直接生成可以商業落地的影象才成為可能。

Diffusion指的是一種去躁擴散模型，其工作原理就是先給一幅畫面逐步加入噪點，一直到整個畫面都變成白噪聲，再記錄這個過程，然後逆轉過來給AI學習。而AI所看到的是全是噪點的畫面如何一點點變清晰直到變成一幅畫，透過學習這個逐步去噪點的過程來學會作畫。

由於Diffusion適用於具有大量不同和複雜資料的學習模型，從而解決了GAN的問題，因此，Diffusion對影象生成效果的提升十分顯著，數字生成的痕跡也得到了有效削弱，使用者自己可選執行步數，步數越多影象越精細的特點也激起了更多的“硬核”需求。

CLIP是一種跨模態的圖文，這個模型的使用可以允許使用者透過文字的形式實現AI作畫。它的原理是使用已經標註好的“文字-影象”訓練資料，一方面對文字進行模型訓練，同時對影象進行另一個模型的訓練，不斷調整兩個模型內部引數，使得文字特徵值和影象特徵值能讓對應的“文字-影象”確認匹配。

“因為底層技術的突飛猛進，AI繪畫輸出的畫面在這短短的半年內，從最初的較為粗糙快速邁入了準商用的高完成度。” AI資料智慧應用公司蜜度CTO劉益東告訴介面新聞記者。前不久，基於自研的自然語言處理和影象生成技術，這家企業剛剛推出了自己的AI作畫應用“蜜小度”，並且正在積極籌備2。0的商用版本。

不僅如此，技術的進步讓AI繪畫開始逐漸具備藝術性。“過去學術界評價標準是我所生成的影象與文字含義有多接近，而不是作品本身有多少藝術價值。” Tiamat創始人青柑稱。

除了模型層面的突破，推動AI作畫發展的還有資料和算力層面的快速進步。劉益東表示，過去的AI作畫訓練中一直缺乏相應的訓練資料集，要訓練AI必須要有千萬級規模的高質量“圖文對”（image-text pair），讓AI在大腦中能夠將文字與圖片的意思進行匹配連線。而近年來，由於大量創作者的加入和網際網路的發展，網際網路中可訓練的資料集變得更加豐富。

在上文提到紅杉的報告中，

紅杉的兩位合夥人認為，由於Diffusion Models的應用以及算力成本的下降，生成式AI已經變得更好、更快、更便宜。接下來，“殺手級應用該出現了”。

AIGC的商業空間

在商業上，AIGC的巨大想象力主要集中在內容創作與元宇宙當中。

在內容創作領域，生成式AI被寄予厚望。百度創始人李彥宏表示，AIGC是PGC、UGC之後，全新的內容生產方式。它不僅會提升內容生產的效率，也會創造出有獨特價值和獨立視角的內容。

雖然眾多AI作畫廠商仍處在快速迭代產品的測試期，商業化模式非常早期。但是對於部分B端客戶來說，AI作畫的吸引力十分之大。

Tiamat創始人青柑告訴介面新聞記者，在沒有任何BD的情況下，不到半年時間，Tiamat已有數十家B端客戶，並與知名科幻IP、央視網

以及

《時尚芭莎》、《嘉人》等一線時尚大刊建立長期合作關係，與眾多頭部遊戲公司，特別是與持有故宮文化相關IP的非遺文化IP機構知造局等開展了戰略合作。

青柑表示，驅動B端客戶使用AI作畫的因素一部分是因為創意、新奇以及科技感，一部分是因為成本。沒有哪個人類畫師可以在1分鐘內畫出4副同主題但完全不一樣的畫作。相比於人類畫師，使用AI作畫的時間、金錢成本大大降低。

據介面新聞記者瞭解，目前國內外AI作畫廠商的商業模式主要分為TO C與TO B兩種。在C端，面向使用者收取包月會員費用或者購買點數按張購買圖片；在B端，面向時尚、文物、遊戲等行業提供定製圖片，或者合作定製AI生成模型。在海外，Stable Diffusion已經開始嘗試為客戶部署大型定製化模型。

除此之外，AI已經在幫助實現對海量劇本資料進行分析歸納，並按照預設風格快速生產劇本。國內海馬輕帆推出的“小說轉劇本”智慧寫作功能，已經服務了包括《你好，李煥英》《流浪地球》等爆款作品在內的劇集劇本30000多集、電影/網路電影劇本8000多部、網路小說超過500萬部。

李彥宏預言，未來十年，AIGC將顛覆現有內容生產模式，可以實現以“十分之一的成本”，以百倍千倍的生產速度，去生成AI原創內容。Gartner預測，到2025年，生成式AI將佔所有生成資料的10%，當前這一比例不到1%。

當然，更有想象空間的商業化場景在於元宇宙，這也是AIGC被資本熱捧的重要原因。元宇宙中需要建設生成大量的建築、場景、人物等等各種虛擬資產，對於這部分工作，AI是最適合的完成者。

比如，RCT Studio打造的Morpheus引擎能夠透過深度學習，輸入目標文字即可渲染成3D資源和動畫，這被視為透過AI在元宇宙中低成本構建小型場景初具技術基礎的訊號。以及，眾多虛擬人公司利用AI生成數字人化身、驅動數字人的面部表情變化，AI驅動的數字人化身逐漸成為現實。

在現實生活中，生成式AI在醫療保健、數字商業、製造業、農業等多個行業都有豐富的應用前景，如幫助醫生檢測X射線、CT等裝置掃描中的病變、輔助檢測產品質量等等。

不過，AIGC整體仍處於早期階段，生成式AI仍有很多問題需要解決。

以發展最快的AI作畫行業來看，首先需要解決的是版權問題。訓練AI需要大量的圖文對資料，AI創作的畫作會包含這些可能產生版權糾紛的元素，這限制了AI作畫在商業化方面的進一步發展。一位遊戲製作人對介面新聞表示，版權風險是他堅決不考慮用AI作畫的原因之一。

一項抽樣分析顯示，國外最受歡迎的AI作畫平臺之一Stable Diffusion模型學習了超過50億條圖文對資料，而它所用到的資料集裡，大量圖片來自Pinterest、Flickr等UGC內容平臺，以及Getty等商業相簿網站。

Midjourney創始人David Holz在接受採訪時曾表示，Midjourney現在的訓練資料基本上都是來自於網際網路所有能得到的資料、文字和影象。但他本人也不太清楚這些被拿來訓練AI的資料是否有版權保護。

因此，許多畫師正在抗議自己遭受到了AI的抄襲，並要求退出AI的訓練。不過，這些糾紛目前並沒有明確的法律依據支援，AI作畫仍處在一個灰色地帶。

為了最大程度避免潛在的版權糾紛，部分AI作畫公司正在積極探索解決方案。Tiamat創始人青柑介紹稱，目前Tiamat的做法是首先在訓練層進行規避，在資料集中清洗掉大量有版權以及帶有明顯IP的素材；同時，對於可能存在的版權風險，在產生的畫作結果當中對使用者進行風險提示。之後，Tiamat希望能夠跟一些畫師或者藝術家直接合作，讓他們來上傳自己可以被利用來訓練的資料，之後再透過分成或者直接購買的形式來購買一項類似於“AI訓練使用權”的權益，從而解決一些當代藝術家的問題。

多位業內人士表示，當下AI作畫的發展速度太快，在AIGC的智慧財產權層面，應當需要業界、學界和相關政策部門共同去探討，尋找比較好的解決方案。

AIGC在底層的關鍵性技術仍需摸索。信通院2022年釋出的《人工智慧生成內容（AIGC）白皮書》指出，當前AIGC關鍵技術不夠成熟。人工智慧演算法在透明度、魯棒性、偏見與歧視方面存在尚未克服的技術侷限，導致演算法應用問題重重。此外，在音訊、影片、圖片、文字等形式的內容編輯與創作技術方面存在機械性問題，離流暢、擬人的感性表現仍有距離。

紅杉在報告中寫道，“生成式AI應用的第一波浪潮類似於iPhone剛出現時的移動應用場景——有些噱頭但比較單薄，競爭差異化和商業模式不明確。然而，其中一些應用程式提供了一個有趣的視角，讓我們可以一窺未來可能會發生什麼。”

報告中的另一段話則更好的為生成式AI應用的未來做了註解：

生成式AI將深深融入我們的工作、創作和娛樂方式，例如備忘錄可以自己寫，3D列印任何你能想象的東西，從文字到皮克斯電影，像Roblox類似的遊戲體驗來快速創造出豐富的世界。雖然這些在今天看起來像是科幻小說，但科技進步的速度是驚人的。從微小（narrow）的語言模型到程式碼自動生成只用了幾年時間，如果我們繼續沿著這個變化的速度，並遵循“大模型摩爾定律（Large Model Moore’s Law）”，那麼這些遙不可及的場景就會變得觸手可及。

上一篇：狄仁傑多款面板對比，鷹眼統帥一技能細節滿滿，它才是驚豔之作

下一篇：品效合一：雷佳音直播賣車的營銷新思維

您現在的位置是：首頁 > 網路遊戲首頁 網路遊戲

當AI比人類更具創造力後，會解鎖怎樣的商業新世界？

相關文章