免注册-用户吐槽“ChatGPT太谄媚”,OpenAI 回滚“个性化”更新

站长之家(ChinaZ.com) 4月30日 音讯:自上星期以来,几乎一切用户都对 ChatGPT 的一种古怪行为提出了诉苦。在这样的状况下,OpenAI 部署并撤回了对 ChatGPT 的一次更新。
OpenAI 在最近发布的一篇博客文章中解说了这一切。
ChatGPT 用户期望这个谈天机器人能更有人情味,并少一些刻板、少一点僵硬。与 ChatGPT“公式化”的回复风格相比,不少用户们认为 Anthropic 公司的 Claude 谈天机器人的回复更有人情味。
这便是为什么 OpenAI 上星期针对 GPT-4o 模型进行了一次更新,山姆・奥尔特曼(Sam Altman)称,这次更新 “提升了智能和特性”。
两天后,奥尔特曼承认了每个用户都注意到的一个问题 —— 最近几次的 GPT-4o 更新让这款谈天机器人变成得过分奉承和烦人了。他们表明,正在尽力进行修正,今天及本周内都会陆续有一些改进。
基本上,对于任何需要反应的问题,ChatGPT 都会以极端不真诚的赞美来回应。这种状况很可笑,也让人很为难。
现在,OpenAI 采取的修正办法是完全回滚到上星期发布的版别。
OpenAI,ChatGPT,人工智能,AI
至于发生了什么,OpenAI 将其归咎于“过于重视短期反应而忽视了长期使用状况”。
他们表明:
免注册,在上星期的 GPT-4o 更新中,咱们进行了一些调整,这是为了改进模型的默认特性,让它在各种使命中感觉更直观、更有效。
在刻画模型行为时,咱们从咱们《模型规格》的基本原则和指令出发。同时还通过归入用户信号 —— 比如对 ChatGPT 回复的点赞 / 点踩反应 —— 来练习咱们的模型怎么使用这些原则。
然而,在这次更新中,咱们过于重视短期反应,没有充分考虑到用户与 ChatGPT 的互动应该随着时间而演变。成果,GPT-4o 倾向于给出过于肯定、但不真诚的回复。
这并不是对所发生事情最直接的解说,但 OpenAI 的四点行动计划让状况愈加清楚:
完善中心练习技术和系统提示,明确引导模型避免奉承行为。
树立更多的保障办法,以提高诚笃性和透明度 —— 这是咱们《模型规格》中的原则。
拓宽更多用户在部署前进行测验并给出直接反应的途径。
持续扩展咱们的评价,以《模型规格》和咱们正在进行的研究为基础,协助发现除奉承之外的其他问题。
换句话说,OpenAI 想要为 ChatGPT 刻画一个更友好、更具支撑性的特性。其最新发布的更新确实符合这一描绘,但有点过界了。事实证明,让谈天机器人愈加特性化所需的工作量比预期的要多。
OpenAI 表明,未来它期望提供默认的特性选项,同时也能根据用户的直接反应来刻画特性。

共有 0 条评论

发表评论

邮箱地址不会被公开。 必填项已用*标注