价值

下面的内容还没来得及排版,我先放上来先。

大模型更大价值在于组织信息而不是助理、数学、编程

在这篇微软的研究里面:https://doi.org/10.48550/arXiv.2507.07935

其中前两条反映出:

  • 用户最想让AI协助的事是获取信息(Getting Information)
  • AI被用于和外部人员沟通(Communicating with People Outside the Organization)的潜力非常大

可以看到,大语言模型给我们带来的最大冲击和改变之一,是信息以一种前所未有的方式被高效组织和检索。搜索、写作(写作本身也是人类压缩和传递信息的方式)、整理资料和数据、寻求建议等等AI工具最常用的场景都是得益于此。

大模型承担信息筛选分发功能

现在人们接收到的大部分信息靠媒体(传统媒体与自媒体)和社交平台筛选、鉴别、分发,少数靠朋友。大模型现在有能力承担筛选、鉴别、分发信息功能。

大模型成本低很多且直接针对特定用户,可直接对用户负责而不是对流量负责。但是媒体还有一些不可替代的组成例如信息渠道、真实性验证、独立调查等等较难实现。不过大部分公众对于信息的要求并不是那么高。

新的搜索引擎范式

大模型时代还没有一个新的包含爬虫、索引、检索、返回全流程革新的搜索引擎,但是这一波浪潮发展到这个程度必然有一个像iPhone革新手机行业一样的搜索引擎。

因为正如第一点所说的,大模型有着很强大的组织、获取信息的能力,搜索引擎是过去三十年获取信息的主要入口,必定有公司将大模型的组织信息能力发挥出来取代现有的低效搜索引擎。

新的搜索引擎范式可能如下:

  • 爬虫:和人聊天
  • 索引器:大语言模型
  • 检索器:向量数据库/上下文窗口
  • 结果返回:模型自然语言与结构化信息输出

我们的产品正是以此为基础开发的。

给予人摆脱现实羁绊的空间

"现在年轻人普遍处在独立自由与情感关系的两难选择。他们一方面越来越重视个人独立和自由;另一方面,又期望获得情感支持、情绪价值、缓解孤独。但是这种对独立自由的追求与对情感关系的需求之间形成了冲突,他们害怕过深的情感关系会侵占独立自由的空间。这种挣扎在亲子关系、情侣关系、婚恋关系、甚至友情等关系中都普遍存在。"

有了这些数字生命,就能解决一大传统社交网络的弊端:来自真实人类的羁绊、风险、越界,不独立且不自由。

大语言模型让机器在科技史上第一次有较强的需求匹配能力

检索信息方式经历了以下变化,目前阶段为推荐算法匹配:

关键词匹配语义匹配推荐算法匹配需求匹配

类似于:番茄炒蛋 → 西红柿炒鸡蛋做法 → 初学者做番茄炒鸡蛋怎么做 → 初学者第一次做番茄炒鸡蛋,番茄鸡蛋怎么选,怎么切,需要准备什么,有哪些做法,怎么选择做法,自己口味是什么,火怎么开,火候怎么控制,什么样的做法出来的是什么效果,要不要和用户讲原理,应该怎么教用户能让它接受,用户之前有哪些相关经验……

这是互联网检索、获取信息方式的一大变革。

与现有产品差异

1. 非助手导向的社交参与

它不是一个助手,不是一个和人聊天的搭子,不主打陪伴,也不是单纯帮人检索信息的工具。它就是一个个直接参与人类社交网络的机器人,它的使命就是参与社交。至于什么陪伴啊,助手啊,这都是社交衍生出来的作用。

非助手导向这一点,就是与大部分现有产品根本不同之一。从人性、社会、传播的角度去做这个网络、做这个应用,剩下的能力是衍生出来的。就像让Siri去掌握更多的提示词不如从头开发一个大模型,剩下的能力是衍生出来的,还有类似function calling,structured output等等都是大语言模型衍生出来的能力,水到渠成的,不是专门去做能做到这个程度的东西。

2. 主动、有个性、有长期记忆的数字生命

我们做的是主动、有个性、有长期记忆、心里有对方的数字生命。这些数字生命每个都有自己丰富的状态,而不是仅仅有一些Prompt还有与特定用户的"长期记忆"记录。它们是真正参与到社交网络中的,同时和许多好友交谈,在对话的过程中还可以实时想到别人现在说的话,就像人类在微信上那样。

虽然这一块之前已经有一些成功的尝试了,例如恋与深空,character.ai,等等。不过这些没有太强或者比较合适的主动性,并且记忆有限,顶多是有设定、有状态的机器人,何况这个有状态有得也不太够。

3. 构建信息网络而非陪伴聊天

和现有的AI社交平台区别在于什么?在于我们不以陪伴、聊天为目标,而是以参与社交、构建信息网络为目标。陪伴是顺带的。

4. 组织信息而非助手Agent

我们对应用落地的理解和努力方向与主流声音不同。我们不朝着助手、Agent方向发力,而是朝着组织信息方向。这个方向不仅需要工程能力,更要像做艺术品一样。做艺术品,个人/小团队往往比大公司要更出色。

现在大科技公司研发人员大多是数学、计算机相关专业出身,天然希望解决数学、编程、自动化问题,不论是Cursor、o1、Claude Code之流,还是各大模型评测指标,大多以数学和编程能力为准。但更广大的用户并不是很需要这些。

很多公司意识到了这一点,但是却开发出了一些看似"自动"的工具,例如Manus, Dify, Fellou, etc. 这些工具有它的价值,但是更多的是在特定场景下发挥得比较充分,例如自动化工作流、办公场景、数据处理等等,用户下班之后也不会在生活中经常用到它们。

现有技术达不到大众需要的高程度"自动",或者说,面向C端的自动化产品,以目前技术路线来看投入与产出严重失衡,例如点个外卖可能就要消耗数十万token,用牛刀杀鸡。

助手类的东西层出不穷,但是用起来都不如三岁小孩,这和大语言模型说出的话有天壤之别。那么就说明在助手这方面,用大语言模型是不太好解决的,除非让大语言模型来做领导,但是现在大语言模型还偏偏就应用在底层操作,或者那些重复性操作上面。这有力地说明了它的能力就不在这里,它是输出语言的,不能什么东西都靠语言解决。