百度钱包一分钱-谷歌发布双思维AI Agent:像人类一样思考,重大技术突破!

提出了一个惊人的理论——让AI模型考虑20秒所带来的功能提高,相当于将模型扩大100,000倍并训练100,000倍的时刻。
Noam所指的技能便是System1/2thinking,也是OpenAI最新模型o1正在运用的技能。
谷歌DeepMind研讨人员则直接把这项技能集成到AI Agent中开发了Talker-Reasoner结构,让其具有“快”、“慢”两种拟人化考虑办法。这关于处理杂乱、冗长的任务来说帮助巨大,也突破了传统AI Agent履行业务流程的办法,极大提高了功率。
图片
像人类相同考虑——快、慢思想
在介绍谷歌的双思想AI Agent之前,「AIGC开放社区」先为大家简略介绍一下System1/2的快、慢思想的由来和技能特性,关于了解Talker-Reasoner结构很有帮助。
快、慢思想最早是由诺贝尔经济学奖得主-丹尼尔·卡内曼在其著作《考虑,快与慢》中提出,并被广泛接受为了解人类思想的一种重要理论结构。
这两种思想办法别离被称为“System1”和“System2”,它们各自承担着不同的认知任务,并以共同的办法影响着咱们的决策进程。
图片
System1,所谓的“快考虑”,是一种自动化的、敏捷的思想形式,几乎不需求耗费很多的认知资源,也不需求个别付出显着的尽力。
当咱们面临一个了解的场景或问题时,System1会敏捷作出反响,供给即时的答案或处理方案。例如,当咱们看到一辆车忽然向咱们驶来时,咱们会天性地做出逃避的动作;或许当咱们听到一个笑话时,咱们或许会立即感到好笑并发出笑声。
这些反响都是System1在起作用的结果,它依赖于直觉和经验积累,可以在短时刻内处理很多信息,但一起也或许由于缺乏深入剖析而发生成见或错误判断。
相比之下,System2则代表着“慢考虑”,这是一种更为杂乱和谨慎的思想进程。System2担任履行那些需求更多注意力和尽力的任务,如处理杂乱的数学问题、进行逻辑推理或是拟定长期方案等。
百度钱包一分钱,假如你运用过OpenAI的o1或许国内的Deepseek、阿里最新开源的QwQ-32B模型,它们在履行超杂乱问题时,便会进入时刻短的考虑时刻。
System2的特色在于其可以对信息进行详尽的剖析和评估,然后得出愈加精确和全面的结论。但是,由于这种考虑办法需求耗费较多的认知资源,所以比System1要慢得多。
此外,在面临紧急情况或压力较大的情境下,System2的体现或许会受到影响,导致决策功率下降。
谷歌双思想AI Agent——Talker-Reasoner
而谷歌DeepMind研讨人员提出的Talker-Reasoner中,奇妙地将System1/2集成到了AI Agent上。
Talker-Reasoner架构的中心思想是将AI Agent分为两个独立的模块:Talker和Reasoner。这两个模块别离对应于人类的System1和System2,各自承担着不同的任务和功能。
图片
Talker模块,类似于System1,担任快速、直观的对话生成,它可以敏捷呼应用户的需求,生成天然言语的回答。而Reasoner模块,类似于System2,担任杂乱的多步推理和规划,它需求更多的时刻和计算资源来处理杂乱的任务,如调用外部东西、检索信息和处理问题。
在Talker模块中,AI Agent被规划为可以了解和处理天然言语,生成连接和天然的对话。这需求AI Agent具有强大的言语了解和生成能力,以及对上下文的敏感性。Talker模块需求可以快速地从回忆中提取相关信息,以支撑其对话生成。
这种回忆可所以对话历史、用户偏好或其他相关信息。Talker模块的规划使其可以模仿人类的直觉反响,即便在信息不完全的情况下也能做出合理的回应。
与Talker模块的快速反响不同,Reasoner模块的规划要点在于深度考虑和杂乱问题处理。Reasoner模块需求可以履行多步推理,这或许涉及到对很多信息的剖析和处理。它需求调用各种东西和数据库,以获取外部常识,支撑其推理进程。
图片
Reasoner模块还需求可以构成和更新关于用户状况的崇奉,这些崇奉以结构化言语目标的形式存储在回忆中。这种崇奉建模是Reasoner模块的要害特征,它使得AI Agent可以更好地了解用户的需求和目的,然后供给更精确的服务。
在实践应用中,Talker和Reasoner模块之间的交互是经过回忆来实现的。Reasoner模块担任生成新的崇奉状况,并将其存储在回忆中。Talker模块在需求时从回忆中检索这些崇奉状况,以支撑其对话生成。
这种规划答应Talker模块即便在Reasoner模块没有完结其推理进程时,也可以持续与用户进行互动。该分工类似于人类的大脑,System1始终活跃,而System2则在需求时介入。
Talker-Reasoner测验数据
为了测验Talker-Reasoner的双思想功能,研讨人员用这个开发了一个睡觉教导Agent。在这个场景中,AI Agent需求与用户进行对话,供给关于改善睡觉习惯的建议和方案。
Talker模块担任与用户的直接互动,而Reasoner模块则担任拟定和调整睡觉教导方案。这种分工使得AI Agent可以一起进行快速的对话和杂乱的规划,提高了用户体验。
在测验中,Talker模块经过一系列指令编码专家常识,指导其完结睡觉教导的各个阶段。这些指令不仅包含了与用户互动的规则,还包含了睡觉教导的具体步骤和策略。Talker模块需求可以了解和回应用户的需求,一起保持对话的连接性和天然性。
图片
Reasoner模块则需求根据用户的反应和需求,调整和优化睡觉教导方案。这或许涉及到调用外部资源,如睡觉相关的研讨和建议,以及根据用户的具体情况拟定个性化的方案。Reasoner模块的规划使其可以处理杂乱的逻辑和推理,为用户供给最合适的建议。
在实践对话中,Talker和Reasoner模块的协同作业被证明是有用的。Talker模块可以流畅地与用户对话,而Reasoner模块则可以根据用户的反应调整和优化教导方案。这种分工履行使得AI Agent可以一起处理快速的对话和杂乱的规划,极大提高了用户体验。

共有 0 条评论

发表评论

邮箱地址不会被公开。 必填项已用*标注