阿里云通义千问2.5发布 全面超越GPT-4 Turbo 成地表最强中文大模型

【KJKX科技快讯】5月9日消息,阿里云正式推出了通义千问2.5版本,该版本在模型性能上全面超越了GPT-4
Turbo,被宣称为地表最强的中文大模型。此次升级不仅展示了阿里云在人工智能领域的持续努力,也再次巩固了其在中文大模型领域的领先地位。

据了解,通义千问2.5相较于之前的2.1版本,在理解能力、逻辑推理、指令遵循以及代码能力等方面均有了显著提升,分别提升了9%、16%、19%和10%。特别是在中文能力方面,通义千问2.5继续保持了业界的领先地位。在权威基准OpenCompass上,通义千问2.5的得分与GPT-4
Turbo相媲美,这也是国产大模型在该基准上首次取得如此优异的成绩。

同时,通义还发布了最新款的开源模型Qwen1.5-110B,该模型拥有1100亿参数。在MMLU、TheoremQA、GPQA等多个基准测评中,Qwen1.5-110B均超越了meta的Llama-3-70B模型,展现出强大的实力。在HuggingFace推出的开源大模型排行榜Open
LLM Leaderboard上,Qwen1.5-110B更是荣登榜首,证明了通义开源系列在业界的竞争力。

除了通义千问2.5和Qwen1.5-110B外,通义的多模态模型和专有能力模型也备受关注。其中,通义千问视觉理解模型Qwen-VL-Max在多模态标准测试中超越了Gemini
Ultra和GPT-4V,已经在多家企业得到实际应用。而通义千问代码大模型CodeQwen1.5-7B则是HuggingFace代码模型榜单Big
Code的领先者,并作为国内用户规模第一的智能编码助手通义灵码的基石。

通义大模型自问世一年多以来,已经发展出了业界领先的文生图、智能编码、文档解析、音视频理解等能力。企业客户和开发者可以通过API调用、模型下载等方式接入通义,而个人用户则可以通过通义APP、官网和小程序免费使用通义家族的全栈服务。

文章采集于互联网

相关推荐