百度副总裁：文心大模型 3.5 版能力超越 ChatGPT 3.5

IT 之家 19 日引用网易科技报导，百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜表示，新一代大语言模型、生成式 AI（人工智慧）产品「文心一言」的新版本能力已超出 ChatGPT 3.5，为百度展开相关技术工作重要的里程碑；此外，IDC 最新发布「AI 大模型技术能力评估报告，2023」显示，百度文心大模型 3.5 拿下 12 项指标的 7 个满分，综合评分第一、演算法模型第一、行业覆盖第一。

据悉，IDC评估报告围绕产品技术、服务生态及行业应用三大方面，考察大模型的十多项指标，中国国内主流大模型包括百度、阿里巴巴、腾讯、华为、科大讯飞、360、商汤等14家厂商参与本次评估。报告结果显示，百度文心在模型能力、工具平台、生态布局及行业覆盖上优势明显，并已提前进入商业化落实探索阶段。

吴甜续指，百度自2019年开始深耕预训练模型研发，先後发布知识增强文心系列模型；不久之前正式发布文心大模型3.5版本，进一步在基础模型、知识增强、检索增强等多项核心技术上取得创新，新版本在各项能力上均有明显提升；尤其是百度拥有自研的深度学习平「飞桨」有力支撑了大模型的高效训练和推理；飞桨与文心的协同优化，让文心大模型3.5最新版本的模型效果提升50%，训练速度提升2倍，推理速度提升30倍。

在大模型生态方面，吴甜指出，百度文心已形成企业、教育、社区三位一体的生态体系，最新数据显示，百度有超过750万开发者基础，20万企业生态基础，多层次开展大模型人才培训、企业赋能、开发者营运；百度并设立了10亿人民币创投基金鼓励大模型创意、繁荣大模型生态。

不过，吴甜直言，目前大模型产业化仍面临着巨大的挑战，总结起来有三方面，首先是大模型的体积确实很大，带来的训练难度高、成本高；第二是对算力规模要求非常大，性能要求非常高；第三在於数据规模亦很大，收集、挖掘、建设、筛选、清洗这些数据，本身也是非常大的大工程，「大模型平台是价格昂贵的大算力系统，其实完全不需要存在大量的大模型，对於应用者而言也不需要每个应用都进行大模型的开发」。

对於「百模大战」的终局预测，吴甜认为，过去短短几个月时间，大量新的大模型出现，但这是个阶段现象，未来各个企业和机构会逐渐找到自己的定位，接着会走向自己细分的方向，终局只会集中在少量的几个大模型，但依托几个少量大模型，会有非常广泛的应用生态出现。

（本文由 MoneyDJ新闻授权转载；首图来源：shutterstock）

百度副总裁：文心大模型 3.5 版能力超越 ChatGPT 3.5

【R18 黄游评测】天下布魔，征服世界组织专属自己的後宫军团！

玩喵剧情向🔞新作《眼眸之城与梦境少女》无照密医深夜密会病弱少女

绅士无人岛性活《荒岛X爱X求生》将登Steam，多结局後宫+「夫目前犯」曹开心

动画疯 VPN 推荐清单！实测过确定可行，让你在国外也能看，2023 最新

丹麦科学家探索以 LOVOT 机器人协助照顾失智症患者

Howie Su／让「虚拟分身」替你工作！90间新创联手引爆元宇宙想像

特斯拉 AI Day 2022：自驾车与机器人的大脑解密

会跳舞、翻身，小米机器狗「铁蛋」动眼看

微软宣布 Windows 10 将停止支援 Office

微软重申坚持 TPM 2.0 门槛　Windows 11 硬体需求不妥协

Google NotebookLM 引入新功能并将推商业版本

彭博：新 AirPods Max、AirPods 4 随 iPhone 16 发布会登场

Welcome Back!

Retrieve your password