选择更适合在中国可用的大模型,百度文心一言综合得分业内领先-新华网
新华网 > > 正文
2023 08/05 18:00:57
来源:新华网

选择更适合在中国可用的大模型,百度文心一言综合得分业内领先

字体:

  8月4日,在百度举行的“AI大模型产品能力交流会”上,新华网与权威科研机构联合发布的《国内LLM产品测试报告》,为业界选择大模型提出了内容安全、常识问答、数学运算、阅读理解和主观问答等五大维度参考。

新华网测试报告显示百度文心一言综合得分第一

  新华网测试报告对文心一言、GPT-3.5等四大知名大模型进行评测,结果显示,文心一言综合得分第一,超过GPT-3.5,国内大模型排名第一。

  文心一言是百度自主研制的知识增强大语言模型,首先从数万亿数据和数千亿知识中融合学习得到预训练大模型,在此基础上采用有监督精调、人类反馈的强化学习和提示等技术,并具备知识增强、检索增强和对话增强等技术优势。

  当前,从政府机构到企业公司,都迫切需要一些判断大模型适合程度的标准和方法。

  新华网物联网技术总监葛振斌认为,评测大模型有5项维度非常重要:一是把控生成内容安全性的能力;二是常识推断计算的能力;三是对长文本的语义理解能力;四是数学运算及数学推理能力;五是主观判断能力。

  中国传媒大学新媒体研究院院长赵子忠认为,大模型必须具备行业化、场景化的服务能力,才能满足不同企业的要求。他建议创业者和开发者以及中小企业,可以基于文心大模型打造智能应用,避免重复造轮子,把精力放在自己擅长的创新上。谁先做出来满足用户需求的应用,谁就抢占了发展先机。

  百度自2019年推出文心大模型1.0,到今年5月份升级到3.5版本。通过飞桨深度学习平台与文心大模型的协同优化,文心大模型3.5实现了基础模型升级、精调技术创新、知识点增强、逻辑推理增强、插件机制等,模型效果提升50%,训练速度提升2倍,推理速度提升30倍。

  目前百度文心大模型已拥有诸多产业应用场景,超过15万家企业申请文心一言内测,其中有超300家生态伙伴在400多个具体场景取得测试成效,覆盖办公提效、知识管理、智能客服、智能营销等领域,联合国家电网、浦发银行、泰康、吉利等企业,联合发布了11个行业大模型。百度还设立了10亿创投基金鼓励大模型应用创新和繁荣产业生态。

【纠错】 【责任编辑:刘璟】