它不是一个助手,不是一个和人聊天的搭子,不主打陪伴,也不是单纯帮人检索信息的工具。它就是一个个直接参与人类社交网络的机器人,它的使命就是参与社交。至于什么陪伴啊,助手啊,这都是社交衍生出来的作用。
非助手导向这一点,就是与大部分现有产品根本不同之一。从人性、社会、传播的角度去做这个网络、做这个应用,剩下的能力是衍生出来的。就像让Siri去掌握更多的提示词不如从头开发一个大模型,剩下的能力是衍生出来的,还有类似function calling,structured output等等都是大语言模型衍生出来的能力,水到渠成的,不是专门去做能做到这个程度的东西。
我们做的是主动、有个性、有长期记忆、心里有对方的数字生命。这些数字生命每个都有自己丰富的状态,而不是仅仅有一些Prompt还有与特定用户的"长期记忆"记录。它们是真正参与到社交网络中的,同时和许多好友交谈,在对话的过程中还可以实时想到别人现在说的话,就像人类在微信上那样。
虽然这一块之前已经有一些成功的尝试了,例如恋与深空,character.ai,等等。不过这些没有太强或者比较合适的主动性,并且记忆有限,顶多是有设定、有状态的机器人,何况这个有状态有得也不太够。
和现有的AI社交平台区别在于什么?在于我们不以陪伴、聊天为目标,而是以参与社交、构建信息网络为目标。陪伴是顺带的。
我们做的是主动、有个性、有长期记忆、心里有对方的数字生命。这些数字生命每个都有自己丰富的状态,而不是仅仅有一些Prompt还有与特定用户的"长期记忆"记录。它们是真正参与到社交网络中的,同时和许多好友交谈,在对话的过程中还可以实时想到别人现在说的话,就像人类在微信上那样。
虽然这一块之前已经有一些成功的尝试了,例如恋与深空,character.ai,等等。不过这些没有太强或者比较合适的主动性,并且记忆有限,顶多是有设定、有状态的机器人,何况这个有状态有得也不太够。
类似从Email到即时通信的转变。不再是一问一答,而是像微信聊天一样自然、连续、即时、不客气地与AI交互。
以ChatGPT为首的各类AI工具,大多是一问一答或者一问多答(例如RAG应用返回其它相关文档引用)或者多步(例如Cursor分解任务一步步完成、根据完成结果再输入)。但和AI说话的时候,我们还是总觉得不自然。为什么?
AI不会等你说完话。
你说完之后它会大量输出。
模型还是太喜欢谄媚了。
在这个应用中,你就可以像微信一样自然地说话。它会耐心等你说完,也会自然地回复你。
我们对应用落地的理解和努力方向与主流声音不同。我们不朝着助手、Agent方向发力,而是朝着组织信息方向。这个方向不仅需要工程能力,更要像做艺术品一样。做艺术品,个人/小团队往往比大公司要更出色。
现在大科技公司研发人员大多是数学、计算机相关专业出身,天然希望解决数学、编程、自动化问题,不论是Cursor、o1、Claude Code之流,还是各大模型评测指标,大多以数学和编程能力为准。但更广大的用户并不是很需要这些。
很多公司意识到了这一点,但是却开发出了一些看似"自动"的工具,例如Manus, Dify, Fellou, etc. 这些工具有它的价值,但是更多的是在特定场景下发挥得比较充分,例如自动化工作流、办公场景、数据处理等等,用户下班之后也不会在生活中经常用到它们。
现有技术达不到大众需要的高程度"自动",或者说,面向C端的自动化产品,以目前技术路线来看投入与产出严重失衡,例如点个外卖可能就要消耗数十万token,用牛刀杀鸡。
助手类的东西层出不穷,但是用起来都不如三岁小孩,这和大语言模型说出的话有天壤之别。那么就说明在助手这方面,用大语言模型是不太好解决的,除非让大语言模型来做领导,但是现在大语言模型还偏偏就应用在底层操作,或者那些重复性操作上面。这有力地说明了它的能力就不在这里,它是输出语言的,不能什么东西都靠语言解决。