走進博大數(shù)據(jù)位于深圳前海的智算中心,一座造型方方正正、藍白相間的建筑格外引人注目。就在這座智算中心的機房里,一排排智算機柜整齊排列,服務器高速運轉(zhuǎn),進行著復雜的數(shù)據(jù)分析與計算任務。
宋春雨/攝
“作為融合算力服務商,我們在自有的算力集群上部署了DeepSeek-R1671B全量版本供客戶使用,通過直接提供AI模型給用戶,創(chuàng)造市場上的算力需求,從而拉動我們智算中心高密機柜和算力服務的銷售?!辈┐髷?shù)據(jù)副總裁白旭告訴證券時報。
隨著國產(chǎn)大模型DeepSeek火爆出圈,最近一段時間以來,來自各行各業(yè)的許多公司宣布部署DeepSeek大模型,應用端的算力需求迎來大爆發(fā)。業(yè)內(nèi)人士分析稱,DeepSeek通過降低AI應用門檻,推動算力需求從“訓練主導”轉(zhuǎn)到“推理主導”。面對嶄新的行業(yè)變局,智算中心需加快轉(zhuǎn)型,從簡單的算力提供商轉(zhuǎn)向?qū)I(yè)服務商,提供覆蓋算力全生命周期的專業(yè)服務,提高算力資源利用效率。
DeepSeek部署熱潮帶動算力需求提升
最近一段時間以來,企業(yè)部署DeepSeek的熱情仍然十分高漲。證券時報注意到,多家上市公司密集宣布已完成DeepSeek大模型的相關部署工作。
例如,??垂煞?月18日在互動平臺表示,公司已在自研的AI智能審核平臺等垂類模型中部署接入DeepSeek模型,對自有平臺進行微調(diào)和優(yōu)化。同日,卓創(chuàng)資訊也發(fā)布消息稱,已完成DeepSeek系列大模型的本地化部署,且正基于DeepSeek-R1模型,運用蒸餾技術,著力打造大宗商品行業(yè)大模型。
“DeepSeek很重要的一個意義,是對普通大眾進行了AI的科普及推廣。各行各業(yè)的人都知曉這款大模型,也紛紛去嘗試使用。這種集中的訪問與使用,帶動了算力需求的爆發(fā)?!敝嘘恍居⒔鉀Q方案架構(gòu)師顧立程在接受證券時報采訪時表示,今年春節(jié)以來,很多客戶都在詢問公司智算中心與DeepSeek的適配情況?!澳壳埃覀兊闹撬阒行囊呀?jīng)能運行DeepSeek模型的各種蒸餾版本,并且表現(xiàn)都是非常不錯的。”顧立程說。
宋春雨/攝
DeepSeek作為一款開源大模型,憑借高性能與低成本的優(yōu)勢,極大地降低了AI應用的門檻,正成為下游許多AI應用公司及終端廠商部署AI模型的優(yōu)先選項。以不久前正式接入DeepSeek-R1大模型的智慧芽為例,該公司是一家科技創(chuàng)新信息服務商,公司技術負責人告訴證券時報,DeepSeek等開發(fā)的開源模型,確實可以幫助企業(yè)降低前期開發(fā)投入,尤其是可以節(jié)省高昂的基礎設施試錯成本。
采訪了解到,企業(yè)的需求不僅是本地化部署DeepSeek大模型,還有許多公司會基于DeepSeek大模型,依托自有行業(yè)數(shù)據(jù)進行定制化開發(fā),訓練垂類模型或構(gòu)建專業(yè)應用。
“印象深刻的是一家律師事務所,客戶希望我們能協(xié)助他們利用自有的行業(yè)數(shù)據(jù)對DeepSeek進行定制化開發(fā),構(gòu)建自有的專業(yè)領域智能應用,我們目前正在協(xié)同合作伙伴努力滿足客戶的需求?!卑仔癖硎?,DeepSeek有助于加速國內(nèi)企業(yè)數(shù)字化轉(zhuǎn)型,政府、金融、制造等行業(yè)客戶因AI應用場景(如智能審批、數(shù)字孿生)的擴展,對高密機柜和邊緣算力設備的需求會大大增加。
從“訓練主導”到“推理主導”,國產(chǎn)算力芯片廠商迎利好
訓練成本低廉,這是DeepSeek區(qū)別于其他大模型的一大核心優(yōu)勢。雖然DeepSeek并未公開R1模型確切的訓練成本,但根據(jù)此前V3模型發(fā)布時發(fā)表的論文,V3訓練成本僅為557.6萬美元,約為Meta開源大模型訓練成本的十分之一。
據(jù)采訪了解,大模型主要分為訓練和推理兩個階段,訓練是指用大量數(shù)據(jù)訓練大模型,通常需要極高的計算能力和存儲資源;推理是指將訓練好的模型應用于實際任務,如提問并生成文本、識別圖片與視頻等。
“傳統(tǒng)大模型訓練如同吞噬算力的黑洞,單次訓練成本動輒數(shù)千萬美元的巨額投入,筑起了只有科技巨頭才能逾越的技術壁壘。算力軍備競賽加劇了全球GPU資源的爭奪戰(zhàn),形成了基礎模型研發(fā)的高度中心化格局?!鄙虾=?jīng)邑產(chǎn)業(yè)數(shù)智研究院副院長沈佳慶向證券時報表示,DeepSeek打破了這種既定的秩序,將推動算力需求的重新分層,過去高度集中的訓練算力需求會開始向應用端的推理算力需求擴散。
“早在去年年初,我們就預判智算中心的算力需求結(jié)構(gòu)將從‘訓練主導’轉(zhuǎn)向‘推理主導’。大模型訓練出來后要做到有用、能用、好用,DeepSeek成功地做到了這一點從而爆火。”白旭表示,目前國產(chǎn)算力芯片廠商與國內(nèi)OEM(原始設備制造)廠商合作推出DeepSeek一體機,國內(nèi)各大云平臺也紛紛上線DeepSeek模型服務,這都大大降低了大模型應用的使用門檻。
除了帶動推理芯片需求增長外,DeepSeek對國產(chǎn)算力芯片廠商的利好,還來自于技術層面。顧立程告訴,在DeepSeek推出以前,國內(nèi)大模型處于一個“百花齊放”的狀態(tài)?!爸嘘恍居⒆鳛橐患褹I芯片設計及國產(chǎn)算力硬件平臺解決方案商,涉及大量的大模型適配需求。而隨著國內(nèi)大模型的逐漸聚焦,會加速我們在算力硬件平臺及軟件大模型全國產(chǎn)解決方案上的定型與市場化?!鳖櫫⒊陶f。
事實上,自1月末以來,從云基礎設施服務商到國產(chǎn)算力芯片廠商,都在緊鑼密鼓地適配DeepSeek大模型。云基礎設施服務商方面,華為云、騰訊云、阿里云、百度云等主流的云廠商均已宣布DeepSeek相關模型上架,可供開發(fā)者部署調(diào)用,中國移動、中國電信、中國聯(lián)通三大基礎電信企業(yè)也全面接入DeepSeek。國產(chǎn)芯片公司也“聞風而動”,據(jù)證券時報不完全統(tǒng)計,包括天數(shù)智芯、摩爾線程、海光信息、云天勵飛、壁仞科技、燧原科技、沐曦、昆侖芯等在內(nèi)的十余家國產(chǎn)芯片公司都已相繼宣布適配DeepSeek模型服務。
從提供算力到專業(yè)服務,智算中心迎轉(zhuǎn)型機遇
DeepSeek的崛起,引發(fā)了人們對于未來算力需求的廣泛關注。最近一段時間以來,二級市場中的算力板塊和相關個股也迎來了較大的波動。
沈佳慶認為,短期內(nèi),由于DeepSeek降低了訓練成本,會使得訓練環(huán)節(jié)對大規(guī)模算力的需求出現(xiàn)下降,從而將資源投入到具體解決方案的研發(fā)?!暗虚L期來看,DeepSeek一是會提升推理、微調(diào)的算力需求,使一部分原來用于訓練環(huán)節(jié)的閑置算力獲得應用;二是會刺激基礎大模型加速迭代,對算力的需求或?qū)⒊霈F(xiàn)增長?!鄙蚣褢c表示。
業(yè)內(nèi)人士普遍認為,DeepSeek對智算中心將構(gòu)成長期利好。但在DeepSeek帶來“潑天富貴”之前,業(yè)內(nèi)對于各地踴躍建設、遍地開花的智算中心卻存有疑慮。據(jù)采訪了解,近年來,由于人工智能產(chǎn)業(yè)的蓬勃發(fā)展,全國掀起了規(guī)劃建設智算中心的熱潮,大大小小的智算中心如雨后春筍般在全國遍地開花。最近,國際數(shù)據(jù)公司(IDC)與浪潮信息聯(lián)合發(fā)布的《中國人工智能計算力發(fā)展評估報告》顯示,2024年中國智能算力規(guī)模同比增長了74.1%,顯示了我國在智算領域的大力投入。
然而,一些智算中心存在著利用程度不高、供需錯配的問題。沈佳慶分析稱,從供應側(cè)來看,為響應國家與地方產(chǎn)業(yè)規(guī)劃的政策導向,加之政府鼓勵,電信、IT軟硬件等領域國央企和大型民企,秉承“適度超前”的原則,開展大規(guī)模的智算中心建設,導致市場供給出現(xiàn)井噴;從需求側(cè)來看,市場需求雖有增長,但沒有出現(xiàn)明顯井噴?!耙皇菄a(chǎn)軟硬件在效能、適用領域等方面還有差距,應用效果不及預期;二是在產(chǎn)業(yè)發(fā)展初期,技術還未成熟,企業(yè)從理性角度出發(fā),購買產(chǎn)品或服務時要考慮多重因素,相對而言會比較謹慎?!鄙蚣褢c說。
算力閑置,曾困擾國內(nèi)不少智算中心,而DeepSeek或有助于緩解這一難題?!熬拖癞斈暌苿踊ヂ?lián)網(wǎng)普及一樣,當大模型真正成為大家習慣使用的工具,到時就將迸發(fā)出非常龐大的算力需求。”顧立程表示,提前布局智算中心,才能保證需求真正爆發(fā)時,智算中心能夠承載得住這“潑天的流量”。
對于智算中心而言,DeepSeek還帶來了新的發(fā)展方向和機遇。據(jù)白旭介紹,智算中心的產(chǎn)品模式已不再局限于高密機柜和算力服務的提供,而是可以直接部署模型應用給企業(yè)使用。
“智算中心應從簡單的以硬件建設為主,轉(zhuǎn)向以提供專業(yè)服務為主的新發(fā)展階段?!鄙蚣褢c認為,算力從一種基礎資源,到真正變成普遍應用的生產(chǎn)力工具,中間還有梗阻,這些也是智算中心能夠發(fā)力的市場機遇?!巴ㄟ^提供覆蓋算力全生命周期的專業(yè)服務,與產(chǎn)業(yè)鏈上不同的主體合作,提供包括算力調(diào)度、計量、優(yōu)化、微調(diào)、封裝、維護、二次開發(fā)等在內(nèi)的一攬子解決方案,將有效推動算力服務在各行各業(yè)的滲透應用,從而擴大整個智算中心的市場需求?!鄙蚣褢c說。
本文僅供讀者參考,任何人不得將本文用于非法用途,由此產(chǎn)生的法律后果由使用者自負。
如因文章侵權(quán)、圖片版權(quán)和其它問題請郵件聯(lián)系,我們會及時處理:tousu_ts@sina.com。
舉報郵箱: Jubao@dzmg.cn 投稿郵箱:Tougao@dzmg.cn
未經(jīng)授權(quán)禁止建立鏡像,違者將依去追究法律責任
大眾商報(大眾商業(yè)報告)并非新聞媒體,不提供任何新聞采編等相關服務
Copyright ©2012-2023 dzmg.cn.All Rights Reserved
湘ICP備2023001087號-2