您的当前位置:首页 > 百科 > 又创新高 阿里通义开源模型Qwen2.5进入大模型盲测全球前十 是模型得分最高的开源大模型 正文
时间:2024-11-22 01:16:29 来源:网络整理 编辑:百科
9月29日消息,基准测试平台Chatbot Arena日前公布最新大模型盲测榜单,10天前发布的阿里通义千问开源模型Qwen2.5再次闯入全球十强,其大语言模型Qwen2.5-72B-Instruct
9月29日消息,又创基准测试平台Chatbot Arena日前公布最新大模型盲测榜单,新高型盲10天前发布的阿里阿里通义千问开源模型Qwen2.5再次闯入全球十强,其大语言模型Qwen2.5-72B-Instruct排名LLM榜单第十,通义是开源前十唯一的中国大模型;Qwen系列视觉语言模型Qwen2-VL-72B-Instruct排名Vision榜单第九,是模型得分最高的开源大模型。
同一时间,进入全球开源社区基于Qwen系列二次开发的大模衍生模型数量突破7.43万,超越Llama系列衍生模型的测全7.28万。通义千问Qwen成长为世界最大的球前生成式语言模型族群,在Hugging Face社区的又创开源模型权威榜单Open LLM Leaderboard上,Qwen系列及其衍生模型包揽了前十全部座次。新高型盲
不论是阿里模型性能还是生态影响力,Qwen都创造了中国开源大模型的通义历史。
Qwen2.5-72B-Instruct排名Chatbot Arena大语言模型榜单第十
Chatbot Arena是开源由开放研究机构LMSYS Org推出的大模型性能测试平台,自2023年5月推出以来一直是世界顶级大模型的最重要竞技场。平台目前集成了全球70多个大模型,采用匿名方式将大模型两两组队,交给用户进行盲测,用户根据真实对话体验对模型能力进行投票。
9月19日发布的Qwen2.5迅速进榜,旗舰模型Qwen2.5-72B-Instruct得分位列LLM榜单第十,居于OpenAI的o1、GPT-4o等模型之后,是得分最高的中国大模型;同天开源的视觉语言模型Qwen2-VL-72B-Instruct闯入Vision榜单第九,略逊于GPT-4o、Gemini-1.5-Pro等闭源模型,是成绩最好的开源模型。此前Qwen系列已有多款开源模型闯入Chatbot Arena榜单。
Chatbot Arena官方发文,Qwen2-VL-72B-Instruct是排名最高的开源视觉语言模型
Qwen2.5的发布在海内外开源社区引发一场狂欢,这套开源模型涵盖多个尺寸的大语言模型、多模态模型、数学模型和代码模型,几乎所有尺寸的模型都实现了同等规模业界最佳性能,发布10天下载量超过150万。有国外开发者称赞通义千问称得上是真正的“开放AI”;有用户测评发现Qwen2.5从0.5B到72B都是SOTA水平,于是发起话题:“大家都用Qwen2.5替换了那些常用模型?”
海外开源社区盛赞Qwen2.5
現場視頻!中國維和部隊營區外730米發生爆炸2024-11-22 01:10
黎真主黨報復以色列2024-11-22 01:06
美國旅行商沉浸式體驗「China Travel」2024-11-22 01:05
受極端天氣影響 厄瓜多爾19省進入紅色警戒狀態2024-11-22 01:04
中央廣電總台台長慎海雄會見法國駐華大使2024-11-22 01:04
古特雷斯警告:黎巴嫩有可能變成「另一個加沙」2024-11-22 00:54
《天人合一——老子》雕塑交接儀式在希臘舉行2024-11-22 00:21
美國伯明翰市發生槍擊事件 已致4人死亡數十人受傷2024-11-21 23:42
馬斯克稱兩年內用「星艦」執行五次不載人探測火星任務2024-11-21 23:09
黎巴嫩多地遭以軍襲擊 已致多人死傷2024-11-21 22:45
商務部:對美國PVH集團啟動不可靠實體清單調查2024-11-22 00:51
美針對波音737飛機方向舵問題發出緊急安全建議2024-11-22 00:46
二氧化氮和氨气反应生成什么(二氧化氮和氨气反应)2024-11-22 00:28
中英舉行軍控與防擴散磋商2024-11-22 00:07
中英兩軍舉行防務戰略磋商2024-11-21 23:26
「未來能源」主題活動在紐約舉行 旨在推動全球能源領域交流合作2024-11-21 23:26
黎巴嫩真主黨向摩薩德總部發射一枚彈道導彈2024-11-21 23:16
朝鮮譴責美國借「四方安全對話」推行陣營對抗2024-11-21 23:13
國家國際發展合作署:中國向孟加拉國提供緊急人道主義醫療援助2024-11-21 22:40
阿根廷中北部地區發生6級地震2024-11-21 22:29