IT 之家 19 日引用网易科技报导,百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜表示,新一代大语言模型、生成式 AI(人工智慧)产品「文心一言」的新版本能力已超出 ChatGPT 3.5,为百度展开相关技术工作重要的里程碑;此外,IDC 最新发布「AI 大模型技术能力评估报告,2023」显示,百度文心大模型 3.5 拿下 12 项指标的 7 个满分,综合评分第一、演算法模型第一、行业覆盖第一。
据悉,IDC评估报告围绕产品技术、服务生态及行业应用三大方面,考察大模型的十多项指标,中国国内主流大模型包括百度、阿里巴巴、腾讯、华为、科大讯飞、360、商汤等14家厂商参与本次评估。报告结果显示,百度文心在模型能力、工具平台、生态布局及行业覆盖上优势明显,并已提前进入商业化落实探索阶段。
吴甜续指,百度自2019年开始深耕预训练模型研发,先後发布知识增强文心系列模型;不久之前正式发布文心大模型3.5版本,进一步在基础模型、知识增强、检索增强等多项核心技术上取得创新,新版本在各项能力上均有明显提升;尤其是百度拥有自研的深度学习平「飞桨」有力支撑了大模型的高效训练和推理;飞桨与文心的协同优化,让文心大模型3.5最新版本的模型效果提升50%,训练速度提升2倍,推理速度提升30倍。
在大模型生态方面,吴甜指出,百度文心已形成企业、教育、社区三位一体的生态体系,最新数据显示,百度有超过750万开发者基础,20万企业生态基础,多层次开展大模型人才培训、企业赋能、开发者营运;百度并设立了10亿人民币创投基金鼓励大模型创意、繁荣大模型生态。
不过,吴甜直言,目前大模型产业化仍面临着巨大的挑战,总结起来有三方面,首先是大模型的体积确实很大,带来的训练难度高、成本高;第二是对算力规模要求非常大,性能要求非常高;第三在於数据规模亦很大,收集、挖掘、建设、筛选、清洗这些数据,本身也是非常大的大工程,「大模型平台是价格昂贵的大算力系统,其实完全不需要存在大量的大模型,对於应用者而言也不需要每个应用都进行大模型的开发」。
对於「百模大战」的终局预测,吴甜认为,过去短短几个月时间,大量新的大模型出现,但这是个阶段现象,未来各个企业和机构会逐渐找到自己的定位,接着会走向自己细分的方向,终局只会集中在少量的几个大模型,但依托几个少量大模型,会有非常广泛的应用生态出现。
(本文由 MoneyDJ新闻 授权转载;首图来源:shutterstock)