百度文心大模型迈过关键里程碑,超越ChatGPT 3.5,国内领先

【KJKX科技快讯】7月19日消息,百度集团副总裁兼深度学习技术及应用国家工程研究中心副主任吴甜近日向媒体表示,百度的文心一言大模型在最新的AI大模型技术能力评估报告中取得了显著突破,超越了ChatGPT
3.5,这标志着国内相关技术工作迈出了重要的一步。

根据IDC发布的《AI大模型技术能力评估报告,2023》,百度文心大模型3.5在评估中获得了7个满分,拿下了12项指标中的7个第一,综合评分、算法模型和行业覆盖三个方面均排名第一。

据KJKX科技快讯了解,这份评估报告从产品技术、服务生态和行业应用三个维度考察了大模型的能力,并邀请了包括百度、阿里、腾讯、华为、科大讯飞、360、商汤等14家国内主流厂商参与评估。报告显示,百度文心大模型在模型能力、工具平台、生态布局和行业覆盖等方面具有明显优势,并已经进入商业化落地探索阶段。

吴甜介绍说,百度从2019年开始专注于预训练模型的研发,并相继发布了知识增强文心系列模型。最近,百度正式发布了文心大模型3.5版本,在基础模型、知识增强、检索增强等核心技术上取得了创新,并在各个能力方面都有明显提升。

百度之所以能在大模型能力评估中取得优势,得益于百度的四层技术栈(芯片-框架-模型-应用)优势、知识增强的核心特色以及繁荣的大模型生态。特别是百度拥有自研的深度学习平台飞桨,有效支撑了大模型的高效训练和推理。飞桨与文心的协同优化使得文心大模型3.5的模型效果提升了50%,训练速度提升了2倍,推理速度提升了30倍。

在大模型生态方面,百度文心已经形成了企业、教育和社区三位一体的生态体系。最新数据显示,百度拥有超过750万开发者基础和20万企业生态基础,并开展了多层次的大模型人才培训、企业赋能和开发者运营。此外,百度还设立了10亿创投基金,以促进大模型的创新和生态繁荣。

吴甜表示,目前大模型产业化仍面临着巨大的挑战,主要体现在大模型的体积庞大、训练难度和成本高、对算力和数据规模的要求等方面。然而,她认为大模型平台并不需要存在大量的大模型,而是可以依托几个少量的大模型,形成广泛的应用生态。

关于“百模大战”的终局,吴甜表示,虽然近期出现了大量新的大模型,但这只是阶段性现象。未来,各个企业和机构会逐渐找到自己的定位,向着细分领域发展。终局只会集中在少数几个大模型上,但以这几个大模型为基础,将出现广泛的应用生态。

文章采集于互联网

相关推荐