河南景安-知乎大模型“知海图AI”来了，要与GPT-4掰掰手腕

2023/04/21域名新闻

此前一向被看作是“ChatGPT概念股”的知乎，终于做出了自己的大模型。在日前举办的“2023知乎发现大会”上，知乎方面公开了与面壁智能共建的大模型产品“知海图AI，而双方的合作则将以联合研制与战略出资的方法展开。据悉，现在该大模型的首个功用“热榜摘要”已发动内测，其将对知乎热榜上的问题答复进行抓取、收拾和聚合，并把答复梗概展示给用户。

作为一个在toC内容渠道上线的大言语模型项目，“知海图AI”是根清华NLP实验室和面壁智能CPM-Bee（10B）模型的技能支撑。依照官方的说法，河南景安，针对知乎热榜问题中的一切答复，在“热榜摘要”这个特定场景中将“知海图AI”大模型的作用与GPT-4进行比较发现，两个模型的体现简直相等。

要知道，在王小川眼中，国内现在的大模型与GPT的距离是三年，即便乐观如李彦宏也只是喊出了，“百度的文心一言和OpenAI的距离是2个月”。而到了知乎这儿，知海图AI就敢说与GPT-4在特定场景能战成平手了。

从某种意义上来说，知乎方面似乎是学习了手机厂商的“好榜样”，究竟只需定语加的足够多，谁都能成为“第一”。在许多业内人士看来，对于知乎而言，将“知海图AI”的首秀放在知乎热榜是适可而止的，究竟要是去拼技能见识、拼运用范围，它或许不是百度文心一言、阿里通义千问的对手。

事实上，知乎入局大言语模型赛道，参加“百模大战”简直是一种必定。现在在移动互联网盈利近乎于枯竭的环境下，未来无疑是混沌的，因而捉住或许通往未来的船票就成为了互联网厂商拥抱改变的必定。用大言语模型来革新事务层、为详细的事务落地场景赋能，这也现已是许多互联网厂商的一起战略。并且在当下这个存量商场中，在功率上的少许改变就现已能兑现为竞争优势。

当下做大言语模型现已不仅仅是追逐潮流，更是内容渠道特点杰出的知乎，保持商场竞争力的一种方法。不管老用户如何吐槽，知乎依旧还是现在国内互联网中数一数二的优质内容渠道。君不见，微软集成了ChatGPT的New Bing在答复用户问题时，参考资料大量来源于知乎，由此也足以证明知乎的内容质量现已受到了海外科技巨头的认可。

要知道，ChatGPT这类大言语模型之所以比以往的人工智能产品愈加智能，靠的便是“力大砖飞”，也需求海量的语料库做支撑，而语料库自身的质量更优秀、产出的成果也就会更好。有得天独厚的资源作为基础，知乎假如对大言语模型视而不见，未免就过于暴殄天物了。

反过来说，大言语模型其实也需求知乎的优质答主来协助其实现迭代，让大言语模型的文本理解和上下文相关才能进一步升级。

众所周知，根据人类反应的强化学习（RLHF）是ChatGPT得以迸发的秘密武器，虽然现在OpenAI还没有开源RLHF，外界只知道它是强化学习(RL)的一个扩展，是将人类的反应归入练习进程，为机器供给一种天然的、人性化的互动学习进程。

而ChatGPT自己给出的解说，便是与传统的RL相比，RLHF的优势在于能更好地与人类的目的保持一致，允许机器把握明显嵌入人类经验中的决议计划要素，并从各种类型的反应中进行学习，且根据需求对反应进行收拾。

所以人类的反应无疑是ChatGPT智能化的要害，那么知乎能不能扮演这样的一个人物呢?答案显然是必定的，由于知乎是根据“认知盈利”建立起来的问答社区。假如将AI生成的答复放到知乎上，让不同范畴的专业用户来验证，就可以在反复调校中优化AI的性能。反过来讲，高质量的原创内容也更简单被AI发现，这有助于改变知乎在现在龙蛇混杂的环境里、优质内容越来越难以被用户发现的困局。

至于为什么要将知海图AI的第一个运用场景聚集在“热榜摘要”，知乎CEO周源在承受媒体采访时就表明，这是从前期产品“答复总结”中汲取的灵感。他表明，“那个功用（答复总结）是开放给一切用户，我们进行wiki一样的修改，后来发现这个事情太困难了，答复数量多了今后成本十分高，而且作用并不好，现在则可以通过技能的方法，帮人来完成这样的事情。”

假如直接用大言语模型来进行创造，并答复知乎上的问题，成果简直一定是灾难性的的。相信许多朋友在运用ChatGPT、文心一言，以及New Bing时就会发现，生成式人工智能有一个十分杰出问题，那便是不苟言笑的胡言乱语。但之所以用户知道ChatGPT在胡说，是由于在发问前你就现已对答案有了一个大概的认识，是有才能判别他所给出的成果正确与否。可假如用户对问题的答案没有概念呢?

知海图AI在热榜摘要上小试牛刀，可以说是知乎因地制宜来实现以点破面的方法，由于这个功用是面向内容消费者、而非生产者的。通过近似于“长话短说”的热榜摘要功用，用户不需求细心浏览详细的答复，就可以大致了解我们围绕热榜论题进行了哪些谈论，这对于以实时音讯为主的知乎热榜而言，最大的好处便是将信息浓缩、以协助用户进步功率。

在这个内容消费不断碎片化的年代，短视频的锋芒毕露就现已证明了用户对于细心“咀嚼”内容，以提炼信息这件事，是越来越没有耐性了。高质量的内容虽然是知乎的立身之本，但随着邀请制被废弃，门槛降低后的大众化战略除了带来海量的用野外，也让知乎的大环境龙蛇混杂，有价值的内容被开掘的难度越来越大。而有了热榜摘要，用AI来协助用户开掘优质内容，天然也就能盘活资源。

不过对于创造者来说，热榜摘要或许并非一个福音。将热榜问题的答复去粗取精、再收拾到用户面前，虽然满意了用户无障碍获取信息的痛点，但价值是用户既然现已看完了精华，还会不会去继续查看详细的答复呢。所以成果会是做出了优质答复的答主或许不会被用户发现并重视，这也就代表着属于优质答主的流量无形中会变少。

顺着这一思路再发散一下会发现，既然用户寻觅答案的作业被AI替代，也就意味着热榜摘要有削减用户运用时长的风险。在其他APP都在想方设法让用户留下的情况下，知乎这无疑是反其道而行之。并且对于一个依赖广告和商业化内容解决方案的渠道而言，用户停留时间短简直就等于流量变差，所以这似乎并非一个好的成果。

河南景安-知乎大模型“知海图AI”来了，要与GPT-4掰掰手腕

admin

共有 0 条评论

发表回复取消回复

admin

共有 0 条评论

发表回复 取消回复

发表回复取消回复