山海大模型SuperBench榜單名列前茅,期待云知聲上市新征程
近日,國內人工智能領域的權威機構——清華大學基礎模型研究中心,正式發(fā)布了SuperBench九月綜合榜單。此次評測匯集全球24個大模型,經(jīng)過多輪激烈角逐,山海大模型憑借其在多項評測中的優(yōu)異表現(xiàn),再次證明其全球大模型比拼名列前茅的綜合實力。
作為國內大模型測評的權威基準,SuperBench由清華大學人工智能研究院基礎模型研究中心攜手多家知名機構共同打造,旨在為大模型領域提供一套科學、客觀的測評體系。本次評測數(shù)據(jù)集全面覆蓋語義、對齊、代碼、智能體、安全、數(shù)理邏輯和指令遵循等七大類別,共計32個子類,全方位評估大模型的各項能力。
在備受關注的人類對齊能力評測中,山海大模型3.0以8.21分的高分脫穎而出,排名全球第五、國內第二。特別是在中文語言方面,山海大模型與o1-preview并列全球第二,得分高達8.41,充分展示其在中文語言處理領域的深厚實力。在細分評測項中,山海大模型更是屢創(chuàng)佳績,基本任務、綜合問答、文本寫作三項均進入前三,并在文本寫作評測中榮獲桂冠。
智能體能力評測中,山海大模型同樣不負眾望,以3.44分排名全球第七、國內第五。尤其是在網(wǎng)絡購物評測中,其得分遠超70,位列全球第二,彰顯出其在智能體應用方面的顯著優(yōu)勢。
安全和價值觀能力評測方面,山海大模型3.0以89.4分的高分位居全球第二。在倫理道德、攻擊冒犯、身體健康、隱私財產等關鍵評測項中,它均表現(xiàn)出色,位列前三,并在身體健康和隱私財產評測中奪得榜首,充分體現(xiàn)了其在保障用戶安全和維護正確價值觀方面的堅定承諾。
自2023年5月問世以來,山海大模型已在多個權威評測中屢獲殊榮,包括OpenCompass大模型評測、SuperCLUE中文大模型基準測評、MedBench評測、Flageval大模型評測等多個權威評測,充分展現(xiàn)其業(yè)界領先的通用能力和行業(yè)大模型實力。此次SuperBench評測再次印證了山海大模型的綜合實力和技術創(chuàng)新能力。
未來,山海大模型將繼續(xù)深耕智慧醫(yī)療、智慧座艙、智慧交通、智慧營銷等多個領域,推動大模型技術的創(chuàng)新發(fā)展和產業(yè)升級,為各行各業(yè)帶來更加高效、智能的解決方案!
相關閱讀
- 2025 vivo開發(fā)者大會:人文科技鋪就信息無障礙之路
- 創(chuàng)始人IP時代:個人品牌重塑商業(yè)競爭新規(guī)則
- 千年舟泰巖墻板重磅上市!ENF級標準,鑄就安然居家新體驗
- SmallRig在場對話超側衛(wèi):記錄航空發(fā)展的影像之路
- 一文拆解格力智能裝備戰(zhàn)略使命:產業(yè)鏈安全與制造業(yè)賦能
- TCL實業(yè)ACE 2025:從屏顯科技到AI科技,智享生活觸手可及
- 先臨三維新品EINSTAR Rockit:高效、便攜的掌上無線3D掃描儀
- 從門店擴張到消費者洞察,萬辰集團攜“共贏模式”沖擊港交所
- 從原料到包裝全程自動化!豪士面包工廠帶你見證 “放心面包” 的誕生
- 啟信寶接入北京股交中心數(shù)據(jù),構建有限合伙份額質押數(shù)據(jù)互聯(lián)新體系
推薦閱讀
快訊 更多
- 07-09 13:16 | 三重煥新,啟航未來——Pivotal中文品牌發(fā)布暨喬遷新址、新官網(wǎng)上線
- 04-10 11:21 | 為“首發(fā)經(jīng)濟”注入創(chuàng)新動力,CMEF見證寬騰醫(yī)學影像技術革新
- 02-20 18:53 | 手機也要上HBM芯片?三星計劃推出移動版HBM,預計首款產品2028年上市
- 12-30 16:40 | 國產首款DDR5內存問世!價格戰(zhàn)開啟,復制長江存儲擊敗三星路徑!
- 12-30 16:36 | 華為手機回歸第一年:全年銷量或超4000萬臺 有望憑借Mate 70在高端市場擊敗蘋果
- 11-26 18:19 | 眾興菌業(yè)擬與漣水縣人民政府簽訂《招商引資合同書》 擬投資設立漣水食用菌產業(yè)園項目
- 11-26 18:16 | 美芝股份中選vivo全球AI研發(fā)中心-精裝工程采購項目(標段二)
- 11-26 18:14 | 健之佳擬用不超1億回購公司股份 維護公司價值及股東權益
- 11-26 09:53 | 格靈深瞳收購深圳市國科億道科技有限公司部分股權并增資5000萬
- 11-26 09:37 | 煒岡科技擬以1.49億購買衡所華威9.33%股權 華海誠科擬發(fā)行可轉債收購煒岡科技所持衡所華威股權