蓝队网络-Meta 发布可以检查其他 AI 模型工作的 AI 模型

Facebook 母公司 Meta 当地时刻周五正式发布了一批来自其研究部门的新 AI 模型,其中包含一个名为「自学评价器」(Self-Taught Evaluator)的模型,这或许为减少人类在 AI 开发进程中的参与度供给了一条新途径。
Meta,元宇宙,Facebook
此次发布紧随 Meta 在 8 月份一篇论文中介绍该工具之后,该论文具体阐明了怎么依赖与 OpenAI 最近发布的 o1 模型中运用的「思想链」技能,来让模型对其输出进行可靠判断。
这一技能经过将复杂问题拆解为更小的逻辑步骤,明显提高了在科学、编程和数学等范畴解决难题的准确性。
Meta 的研究人员彻底运用 AI 生成的数据来训练这个评价器模型,彻底消除了人工输入的需求。
蓝队网络,运用 AI 可靠地评价 AI 的才能展现了未来完成自主 AI 智能体的或许途径。该项意图两位 Meta 研究人员向路透社表明,这种 AI 智能体可以从自身过错中学习。
AI 范畴的许多人设想,这类智能体可以作为高度智能的数字帮手,可以在无需人类干涉的情况下履行广泛的使命。
自我改进的 AI 模型有望替代当前常用的昂贵且低效的根据人类反应的强化学习(RLHF)进程,这种方法要求具有专业知识的人类标注员来符号数据并验证复杂数学和写作问题的答案是否正确。
「我们希望,随着 AI 的开展,它能越来越好地查看自己的工作,然后逾越普通人的表现,」该项目研究员之一 Jason Weston 说道。
他说:「自我学习并能自我评价是完成这种逾越人类水平 AI 的关键。」
包含谷歌和 Anthropic 在内的其他公司也发布了关于 RLAIF(根据 AI 反应的强化学习)概念的研究。但与 Meta 不同的是,这些公司通常不公开发布其模型供大众运用。
Meta 在周五发布的其他 AI 工具还包含对公司图像识别模型 Segment Anything 的更新、一种加快大言语模型(LLM)呼应生成时刻的工具,以及可用于发现新型无机材料的数据集。

共有 0 条评论

发表评论

邮箱地址不会被公开。 必填项已用*标注