当前位置: 首页 >  关注  >  正文

百度文心大模型3.5版,评测得分超越ChatGPT|世界热文
2023-06-22 12:28:23 面包芯语


(资料图片仅供参考)

新浪财经报道,据内部人士透露,百度文心大模型 3.5 版本已内测可用,在公开测试集上进行的基础模型少样本(Few-Shot)评测显示,文心大模型 3.5(ERNIE 3.5)在多个测试集的得分已超过 ChatGPT。

为验证主流大模型的各项综合能力,评测在AGIEval、C-Eval和MMLU三个权威评测基准上进行综合评估。除文心大模型3.5,评测的模型还有ChatGPT、GPT-4、GLM、LLaMa系列大模型,评测可看出大模型在能力上的优劣,同时对模型的迭代发展也有着很强的指导作用。

从评测得分来看,文心大模型3.5版中文能力突出,甚至有超出GPT-4的表现;综合能力稍逊于GPT-4,但已经在评测中超过了ChatGPT,远远领先于其他开源大模型。

中国工程院院士邬贺铨曾表示,中国企业在获得中文语料和对中国文化的理解方面比外国企业有天然的优势,中国制造业类别最全,具有面向实体产业训练产业AIGC的有利条件,在算力方面中国已具有较好的基础; 以百度文心大模型3.5版为例,与3.0版本相比,通过各项算法和数据的优化,尤其是百度首创的知识增强和检索增强技术的优化,新版本文心大模型在各项能力上均有明显提升。

据了解,百度人工智能四层架构的端到端优化,尤其是框架和模型层的协同优化,让文心大模型训练速度、模型效果加速提升。

‍点击进入公众号,回复关键词:

芯片|ISSCC|滤波器|SerDes|半导体设备

热门推荐