7月4日,可信大模型公司無限光年(INF)在2024年世界人工智能大會(WAIC)上發(fā)布可信光語大模型及其技術(shù)報告??尚殴庹Z大模型結(jié)合大語言模型與符號推理,有效解決幻覺問題,大幅增強模型可信度,賦能金融服務(wù)、醫(yī)療診斷等垂直領(lǐng)域,讓生成式AI真正成為新質(zhì)生產(chǎn)力工具。在金融和醫(yī)療垂直領(lǐng)域評測中,可信光語大模型超越OpenAI的萬億參數(shù)大模型GPT4-Turbo,同時作為“精?!钡陌賰|規(guī)模大模型,有效提升推理精度,降低服務(wù)成本。通過解決模型幻覺問題對企業(yè)級應(yīng)用的重大挑戰(zhàn),無限光年深入金融、醫(yī)療場景,目前已服務(wù)多家頭部公司和機構(gòu)。
在“人工智能:科研范式變革與產(chǎn)業(yè)發(fā)展”主題論壇上,無限光年聯(lián)合創(chuàng)始人徐盈輝博士表示,幻覺問題是大模型被用作生產(chǎn)力工具的核心挑戰(zhàn)之一:如果大模型生成的內(nèi)容不可控、難以解釋,就很難滿足專業(yè)領(lǐng)域?qū)蚀_性、可靠性、嚴謹性的要求。針對該挑戰(zhàn),無限光年致力于研發(fā)神經(jīng)符號計算等多種創(chuàng)新技術(shù),并在此基礎(chǔ)上打造新一代可信大模型。
徐盈輝博士介紹,人工智能在多年發(fā)展長河中形成了符號學派和聯(lián)結(jié)學派兩種不同的路徑和理念。神經(jīng)符號技術(shù)將符號學派的推理能力與聯(lián)接學派的學習能力有機結(jié)合,大幅提升生成式AI在行業(yè)應(yīng)用中的可信生成能力,降低錯誤率、提高可靠性。正如諾貝爾經(jīng)濟學獎得主丹尼爾·卡尼曼提出的“人類思維有快與慢兩個系統(tǒng)”的理論,符號計算與大模型的結(jié)合不僅能用神經(jīng)網(wǎng)絡(luò)實現(xiàn)快速的“黑盒”概率預(yù)測,更能進行慢思考的“白盒“邏輯推理。這兩個系統(tǒng)的融合代表著通往未來通用人工智能(AGI)的重要技術(shù)方向,也正是無限光年獨特的“灰盒“可信路線。
(無限光年聯(lián)合創(chuàng)始人徐盈輝博士在2024年WAIC上發(fā)布光語垂直領(lǐng)域大模型)
無限光年積極發(fā)展“灰盒”大模型,解決垂直領(lǐng)域的專業(yè)問題。在金融領(lǐng)域,特許金融分析師(Chartered Financial Analyst,CFA)考試是全球投資業(yè)最嚴格、含金量最高的資格認證,分為三級考試,包含豐富的金融類知識問題和計算推理問題?;贑FA數(shù)據(jù)集,無限光年金融大模型在一級和二級考試中準確率均超過GPT4-Turbo和Llama3。在一級和二級考試準確率的表現(xiàn)上,無限光年金融大模型得分分別為0.7772和0.5518,GPT4-Turbo分別為0.7177和0. 5259,Llama3分別為0.6723和0.4812。同時,在公開數(shù)據(jù)集FinanceIQ和Fin-Eval上,無限光年金融大模型的表現(xiàn)也均超過GPT4-Turbo和Llama3。徐盈輝博士同時宣布,無限光年將光語金融大模型API試用,助力大模型在金融行業(yè)的發(fā)展和應(yīng)用。
(無限光年光語大模型在垂直領(lǐng)域測試超越OPENAI的萬億參數(shù)大模型)
此外,光語大模型在4個公開的權(quán)威邏輯推理數(shù)據(jù)集上準確率都超過GPT-4 Turbo,在ProofWriter、FOLIO、ProntoQA和MedExam Grading中的得分分別為0.99、0.58、0.99和0.80,而GPT4分別為0.91、0.56、0.94和0.64。在醫(yī)療領(lǐng)域,無限光年醫(yī)療大模型在權(quán)威醫(yī)療數(shù)據(jù)集MedBench上,API和自測榜雙榜第一,是首家雙榜超過90分的醫(yī)療大模型。API榜綜合得分90.4,在復(fù)雜醫(yī)學推理,醫(yī)學語言理解,醫(yī)療安全與倫理三個維度第一。
自成立以來,基于可信大模型技術(shù),無限光年已在大模型產(chǎn)業(yè)應(yīng)用中取得多方面成果。在金融領(lǐng)域,無限光年與頭部證券公司合作推出AI投研助手。借助新一代可信技術(shù),這一投研助手在國內(nèi)率先實現(xiàn)了用大模型精準、高效、深度解讀企業(yè)財報,為分析師等專業(yè)人士提供包括信息總結(jié)分析、范式寫作和精準搜索在內(nèi)的一站式功能。到目前為止,該產(chǎn)品已被多家證券公司和資管機構(gòu)使用。
在醫(yī)療領(lǐng)域,無限光年與國內(nèi)頭部三甲醫(yī)院合作,共同基于可信技術(shù)創(chuàng)新打造醫(yī)療行業(yè)大模型,在體檢報告解讀方面有效協(xié)助醫(yī)生提升報告效率和準確度。
徐盈輝博士認為,在經(jīng)歷“百模大戰(zhàn)”后,模型的行業(yè)應(yīng)用已成為大模型的發(fā)展重心。但在深入專業(yè)化場景時,當前通用大模型的表現(xiàn)并不理想。無限光年團隊將持續(xù)探索新一代可信的灰盒大模型技術(shù),讓垂直領(lǐng)域大模型更精準、更可信,成為“金融顧問” 、“專業(yè)醫(yī)生”和更多領(lǐng)域的專家,讓AI技術(shù)人人可用、行行受益。
據(jù)了解,無限光年團隊既有來自阿里巴巴、螞蟻集團、字節(jié)跳動、微軟的國際頂尖AI人才,也有來自摩根大通等金融機構(gòu)、協(xié)和醫(yī)院等醫(yī)療機構(gòu)的資深行業(yè)專家?;趯π袠I(yè)需求的深入了解,無限光年開發(fā)AI原生產(chǎn)品與解決方案,為行業(yè)提供多元化的專業(yè)服務(wù),推動“灰盒大模型”和生成式AI技術(shù)在行業(yè)場景的持續(xù)落地。此前,無限光年已完成多輪融資,投資人包括阿里云、啟明創(chuàng)投等頭部投資機構(gòu)。
(公司最新發(fā)布技術(shù)報告下載鏈接
https://s.infly.cn/f/img/pdf/Towards_Trustworthy_LLMs.pdf?20240703)
本文僅供讀者參考,任何人不得將本文用于非法用途,由此產(chǎn)生的法律后果由使用者自負。
如因文章侵權(quán)、圖片版權(quán)和其它問題請郵件聯(lián)系,我們會及時處理:tousu_ts@sina.com。
舉報郵箱: Jubao@dzmg.cn 投稿郵箱:Tougao@dzmg.cn
未經(jīng)授權(quán)禁止建立鏡像,違者將依去追究法律責任
大眾商報(大眾商業(yè)報告)并非新聞媒體,不提供任何新聞采編等相關(guān)服務(wù)
Copyright ©2012-2023 dzmg.cn.All Rights Reserved
湘ICP備2023001087號-2