“別人家的股票”因為“別人家的女兒”站上了風口。
硅谷AI初創(chuàng)新星Pika爆火,不僅讓“女兒概念股”信雅達收獲兩個漲停,還將這股暖風吹到了A股AI應用板塊。
12月1日(周五)午后,昆侖萬維、萬興科技先后漲停,湯姆貓、福昕軟件、國脈文化等多只個股強勢上漲。
不過,信雅達在12月1日盤后再次發(fā)布公告:截至本公告日,公司沒有人工智能視頻生成類相關(guān)產(chǎn)品和業(yè)務;未投資Pika,也未與Pika有任何業(yè)務往來,Pika開發(fā)團隊創(chuàng)始人之一郭文景未在公司任職。
要充分理解這波“女兒概念股”效應的擴散,首先要理解Pika有何出眾之處。
回到故事的起點Pika,該公司首款產(chǎn)品Pika 1.0是一款視頻生成應用,于北京時間11月29日正式上線。通過輸入文字、圖片,Pika 1.0能夠生成不同風格的3D動畫、動漫、卡通和電影,并支持對于視頻實時編輯和修改。
“文生視頻”是這款應用的核心功能,它與“文生圖”的底層技術(shù)一致,但實現(xiàn)起來難度更高、成本更大,可以看作是文本生成圖像的進階版技術(shù),兩者都屬于生成式AI的多模態(tài)應用。
可以說,Pika的強大功能再次喚起了市場對于AI應用的無限遐想,也點燃了沉寂已久的AI應用板塊。
▌多模態(tài)——AI應用場景拓展的關(guān)鍵
多模態(tài)指的是多種模態(tài)的信息,包括文本、圖像、視頻、音頻等。
AI領(lǐng)域研究一直致力于以技術(shù)實現(xiàn)計算機對于人類認知世界方式的高度效仿。人類具備視覺,聽覺,觸覺,味覺和嗅覺五種模態(tài),單模態(tài)交互顯然是一個局限的、并不完整的模型。所以“多模態(tài)”研究的大勢所趨已十分明朗。
OpenAI發(fā)布的GPT-V4附帶語音和圖像處理功能,標志ChatGPT正式進入多模態(tài)時代,也向外界展示了這家AI龍頭公司打造多模態(tài)AI應用的決心。
與此同時,谷歌、Meta、微軟同樣投入人員和精力參與其中;xAI面向XPremium+用戶推出聊天機器人Grok未來也望發(fā)展圖像生成、圖像識別、語音識別等多模態(tài)能力……
對于公司而言,多模態(tài)能力提高了AI應用的泛化能力,是產(chǎn)品核心競爭力;對于產(chǎn)業(yè)而言,多模態(tài)是AI應用場景拓展的關(guān)鍵,而應用生態(tài)的完善將反哺上游,有望進一步推動硬件端迭代。
中信證券判斷,多模態(tài)會是推動本輪AI熱點繼續(xù)前進的下一個增長點。預計下一代多模態(tài)將會快速拓展目前大語言模型有限的應用場景,顯著提高語言模型的泛化能力,并有望在成本方面展現(xiàn)出對傳統(tǒng)專有模型的優(yōu)勢,從而推動如AI Agent等應用的落地,進而推動自動駕駛、機器人等應用獲得革命性突破。
天風證券表示,多模態(tài)GPT-4V API開放,有望把現(xiàn)有的圖像、視頻等轉(zhuǎn)化為新的訓練數(shù)據(jù),有望結(jié)合LBS、社交等誕生全新應用,而生態(tài)應用的發(fā)展將為硬件端發(fā)展提供有力支撐。
▌頭部公司尚未拉開身位 比賽才剛剛開始
盡管多模態(tài)被賦予了巨大的想象空間,但現(xiàn)實是,相關(guān)應用的優(yōu)化迭代速度和商業(yè)化進程均較慢。
即便如Meta和谷歌這樣的硅谷人工智能巨頭,在文生視頻上同樣進展緩慢,它們分別推出的Make-A-Video和Phenaki均尚未公測;而前期火爆的文生圖領(lǐng)域,雖有Lensa AI、妙鴨相機等出圈,但營收持續(xù)增長能力仍待驗證。Lensa AI推出人像生成功能后,去年12月前12日內(nèi)創(chuàng)收2930萬美元,但2023年7月全球收入已回落為100萬美元;妙鴨相機上線即火爆,半月營收估計超過29萬美元,后續(xù)須上線新模板、新玩法維持營收增長。
技術(shù)不成熟是所有公司面臨的共同問題。以文生視頻為例,其底層模型及技術(shù)仍在優(yōu)化,未篩選出最優(yōu)模型。這也導致當下的熱門應用,如RunwayGen-2、Zero Scope等存在一些共同問題:復雜人物動作生成幀連續(xù)效果較差;非日常場景的視頻架構(gòu)能力連續(xù)能力一般;多主體視頻生成缺乏邏輯連續(xù)性等。
這也正是前文所述的Pika誕生的原因——創(chuàng)始人郭文景和同學認為Runway和Adobe Photoshop當時的AI工具并不算好用,才有了自己做類似工具的想法。頗有些“乾坤未定,你我皆是黑馬”的意味。
▌多模態(tài)AI應用將帶來哪些投資機會?
對于大模型來說,多模態(tài)生成要求的計算量、存儲量遠高于純文本模態(tài)。
中信證券表示,在傳統(tǒng)的純文字語言模型中,24MB的存儲空間可以處理約4000-6000個單詞。如果我們假設使用500個單詞來描述圖片中的全部信息,那么處理圖片所需的算力大約是處理文字的8-12倍。
這只是圖片模態(tài)和文本模態(tài)之間的比較,視頻生成應用的算力、存力需求比圖片生成應用更大。
基于此,AI多模態(tài)加速燃燒算力、存力,將為這兩大產(chǎn)業(yè)鏈帶來更大的想象空間。
國盛證券看好算力儲備大廠在多模態(tài)生成領(lǐng)域的發(fā)展,其以文生圖應用Midjourney為例,該應用日活達1500萬,年收入超1億美元,它推出的多版無限量套餐、高速GPU服務反映出市場對算力的巨大需求。該機構(gòu)分析師認為,目前國內(nèi)文生圖多為計次付費,尚未出現(xiàn)無限量套餐,或因算力受限,具有算力儲備的云服務廠商在發(fā)展視頻生成類應用上具有天然優(yōu)勢。
從應用端來看,多模態(tài)AI工具有望賦能傳媒行業(yè)。
華西證券認為,AI天然具備情感陪伴屬性,多模態(tài)技術(shù)使其能力從文本互動擴大至影視生成。長城證券也表示,多模態(tài)能力的突破有助于拓展AI應用場景,傳媒行業(yè)中游戲、影視、廣告營銷、數(shù)字媒體等板塊均有望受益于AI多模態(tài)能力的提升。
國盛證券宋嘉吉旗幟鮮明地指出,AI文生視頻是多模態(tài)應用的下一站。該分析師稱,文生視頻技術(shù)的日趨成熟和廣泛應用,或?qū)楫斚聼衢T的短劇市場帶來變數(shù),該技術(shù)有望極大降低短劇制作的綜合成本,為解決“重制作而輕創(chuàng)作”的共性問題提供解決方案,短劇制作的重心有望回歸高質(zhì)量劇本創(chuàng)作。
本文僅供讀者參考,任何人不得將本文用于非法用途,由此產(chǎn)生的法律后果由使用者自負。
如因文章侵權(quán)、圖片版權(quán)和其它問題請郵件聯(lián)系,我們會及時處理:tousu_ts@sina.com。
舉報郵箱: Jubao@dzmg.cn 投稿郵箱:Tougao@dzmg.cn
未經(jīng)授權(quán)禁止建立鏡像,違者將依去追究法律責任
大眾商報(大眾商業(yè)報告)并非新聞媒體,不提供任何新聞采編等相關(guān)服務
Copyright ©2012-2023 dzmg.cn.All Rights Reserved
湘ICP備2023001087號-2