从 ChatGPT 生成程式码抓错，OpenAI 开发新模型「CriticGPT」

OpenAI 研究人员微调 GPT-4 模型，训练「CriticGPT」用於找出 ChatGPT 生成程式码的错误，帮助大型语言模型生成内容更精确。

驱动 ChatGPT 背後采用了 GPT-4，OpenAI 使用基於人类意见回馈的强化学习（Reinforcement Learning from Human Feedback，RLHF）来对齐。RLHF 是一种机器学习技术，以人类的意见回馈微调模型，判断模型生成内容是否连贯、准确、不令人反感。AI 训练人员给出评分回馈到驱动模型运作的演算法。为使 ChatGPT 这类聊天机器人更可靠并防止行为不正，RLHF 扮演的角色相当重要，却使 ChatGPT 错误更加微妙、不易发现。

一篇《LLM Critics Help Catch LLM Bugs》新论文叙述，OpenAI 开发出 CriticGPT，做为 AI 训练人员的新助手，负责检视 ChatGPT 生成程式码并指出错误，帮助人们发现可能被忽略的错误。

事实上，CriticGPT 也使用 RLHF 进行训练；但与 ChatGPT 不同的是，OpenAI 研究人员故意插入大量错误程式码的资料训练 CriticGPT，教导它辨识和标记各种程式码错误，CriticGPT 必须对程式码错误做出评论。

▲ CriticGPT 找出 ChatGPT 生成程式码的错误。（Source：OpenAI Blog）

OpenAI 规划将类似 CriticGPT 的模型整合至 RLHF 标注流程中，为 AI 训练人员提供明确帮助。CriticGPT 有助於 OpenAI 训练出更强大的模型，确保生成内容值得信赖，符合人类价值观。

OpenAI Wants AI to Help Humans Train AI
OpenAI’s new “CriticGPT” model is trained to criticize GPT-4 outputs
OpenAI develops AI model to critique its AI models

（首图来源：Unsplash）

从 ChatGPT 生成程式码抓错，OpenAI 开发新模型「CriticGPT」

【R18 黄游评测】天下布魔，征服世界组织专属自己的後宫军团！

玩喵剧情向🔞新作《眼眸之城与梦境少女》无照密医深夜密会病弱少女

绅士无人岛性活《荒岛X爱X求生》将登Steam，多结局後宫+「夫目前犯」曹开心

动画疯 VPN 推荐清单！实测过确定可行，让你在国外也能看，2023 最新

丹麦科学家探索以 LOVOT 机器人协助照顾失智症患者

Howie Su／让「虚拟分身」替你工作！90间新创联手引爆元宇宙想像

特斯拉 AI Day 2022：自驾车与机器人的大脑解密

会跳舞、翻身，小米机器狗「铁蛋」动眼看

微软宣布 Windows 10 将停止支援 Office

微软重申坚持 TPM 2.0 门槛　Windows 11 硬体需求不妥协

Google NotebookLM 引入新功能并将推商业版本

彭博：新 AirPods Max、AirPods 4 随 iPhone 16 发布会登场

Welcome Back!

Retrieve your password