兩大AI模型性能提升登上國際榜單--星空人工智能美女福利导航網

科技日報訊(記者李禾)近日，由盛大AI團隊研發的模型Watt-tool-70B和Newsbang/homer-72B，登上國際知名AI排行榜榜首。其中，Watt-tool-70B是由盛大旗下Watt團隊研發的旗艦模型，目前位列BFCL Leaderboard總榜單第一。

據悉，榜單BFCL Leaderboard是由加州大學伯克利分校開發的評估LLM工具調用能力基準測試平台。作為目前大語言模型(LLM)最熱門的研究方向之一，工具調用(Function-Calling)是為了讓LLM理解，並能準確使用API(應用程序編程接口)，來執行更複雜而具體的任務。在近期公布的最新一輪評估結果中，Watt的“多輪對話執行能力”相較於排名第二的GPT-4o 領先11分，比排名第十的Gemini-1.5-Pro 領先近40分。

“這個模型將加速大模型落地‘融合’過程。”Watt有關負責人說，還有助於從底層數據標注到人機交互的體係化建設，讓大模型初步實現從“光說不練”到“能文能武”。

此外，由盛大集團NewsBang團隊開發的Newsbang/homer-72B 模型位列Open LLM LeaderBoard v2榜單第一。Open LLM Leaderboard V2是由Hugging Face維護的開源語言模型評測平台升級版本，采用更全麵和嚴格評估標準，對各類開源大語言模型進行多維度測試和排名。Newsbang/homer-72B重視提升模型在推理和思考方麵的能力，通過搭配數據篩選機製等，在多個核心評測維度，該模型性能有了大幅提升。

888(1)(1).jpg

據公開報道，2023年初，盛大集團宣布All in AI戰略，去年10月，聯合多家高校發表了AI與長期記憶方麵的論文，其自研的OMNE大模型多智能體框架登上GAIA 基準測試排行榜榜首;其旗下的天橋腦科學研究院(TCCI)與國際學術雜誌《Science》合作推出全球AI驅動科學大獎，舉辦和支持包括“AI+精神健康”在內的各種高水平國際會議和夏校項目，助力培養跨學科青年AI人才等。

繼續閱讀：星空人工智能

星空人工智能美女福利导航網倡導尊重與保護知識產權。如發現本站文章存在版權等問題，煩請30天內提供版權疑問、身份證明、版權證明、聯係方式等發郵件至1851688011@qq.com美女直播全婐APP免费下载將及時溝通與處理。！：首頁 > 星空人工智能產業 > AI大模型 » 兩大AI模型性能提升登上國際榜單

相關推薦