AI时代如何发生(上)【the prompt】
红杉中国投资人深度对谈,复盘AI行业发展,探讨AI Native产品范式及Agent技术的未来趋势。
UP主: 红杉汇 · 时长: 1h11m · 🔗 B站原视频
标签: AI · 行业分析 · 红杉中国 · 播客 · 创业投资
伪问题与打脸:寻找AI时代的“抖音”
所以我认为这是非常典型的一个伪问题。你要寻找AI时代的抖音、AI时代的微信、AI时代的小红书,这件事情是不存在的。我不认同过字节,我也不认同过抖音,但最后又被啪啪打脸。以前并不相信智能一定会发生,但现在真的是一个Agent在24小时跑,帮他去监控数据。
2024-2025复盘:Agent带来的转折点
今天我们主要聊一下25年的复盘,然后再聊一下对26年的展望。我现在的感受是,25年实际上多少有点转折的意味。24年的时候尽管整个AI已经比较火了,但整体节奏还没那么快。但是25年从DeepSeek开始,后面又有一系列标志性的中国模型和Agent出来,市场情绪有一个巨大的提升。我不知道各位感受是不是这样?
-
其实我感觉到了一个转折点,实际上是年初的时候,我看到一个产品叫Devin。那个产品给我最大的震撼。去年差不多这个时候,我用了一下Devin当时的新版本,我觉得Devin是第一个能让你离开屏幕去完成任务的产品。两年前我们在内部做了一个关于Agent的讨论,当时大家还是有一点相当于写小说那种感觉。但是从看到Devin那一刻起,我觉得Agent产品或模型能完成任务、做规划这件事情已经快实现了。所以在那个时刻,给我有一点点Aha moment或者转折的意味在。
-
那个点抽象出来是什么?就是它能够直接交付结果。除了在一个界面上跟它聊天之外,你能直接给它一个任务,不用再看着它,它能在做好了之后给你看。这样一个意味对我来说是非常震撼的。
过去几年的三大 AI Native 产品
-
其实我自己觉得,过去几年有三个比较AI Native的产品我很认同。第一个就是ChatGPT,在有互联网以来,大家第一次可以跟一个东西对话,然后那个东西会给你一个明确的反馈和答案,且是非常自由多维度的。
-
第二个我觉得就是23年的Rewind,也是一个非常Native的产品。在AI之前,不会有人想这样去设计一个产品:有一个东西随时常驻在你的电脑、手机上,随时看到你的一举一动,把你干了啥、看了什么内容全都记录下来。虽然它出现的时间点可能有点太提前,在技术发展的更早期,但这个理念完全是因为AI诞生的。
-
第三个就是Devin。我们的工作经常会跟实习生交互,比如早上布置任务,中午问进展,晚上要结果。这个沟通的过程完全是人和人沟通的数字化展现。所以Devin可能确实是我看上去第一个真正意义上Agent Native的雏形,给大家打了个样,导致今年有那么多Agent公司出现。
-
我比较喜欢条理化或者逻辑性地去想。如果类比的话,可能出现过三次类似于“iPhone时刻”的节点。第一个是ChatGPT,of course。第二个可能是Claude 3.5,它背后enable了Agent和Coding,是一个非常大的市场和趋势变化的Trigger point。第三个可能是NotebookLM(注:根据发音推测)。现在发布了两周,今天还是会有很多人发现出新的玩法,而且是非常惊艳的。如果让我选一个,我会pick它。因为它已经完全到了让普通消费者能直接、非常容易体感到的阶段。这有点像当年iPhone 4的时候,iPhone刚出来是极客的狂欢,但iPhone 4的时候每个人拿在手里都会说“哇真帅,真流畅,上网速度真好”。我觉得这是一个Tipping point。
深层次的数字化与人类习惯的改变
-
我接着刚才说的Rewind。其实我特别喜欢这种Total Recall型的产品。我今年认为这是一个深层次的数字化。移动互联网时代可能是浅层次的数字化,把纸张上的文本、地址、电话线上化了。但今年是把那些从来没有人记录过的信息,特别是录音、操作方式,全部数字化。一下子我们给AI多了很多材料,这点是很有意思的。而且这点可能会影响到人类的语言。比如我现在给大模型留言,我只关注我是不是所有信息点都说全了,至于谁先谁后,或者后面要补一点,我都不介意,因为我觉得它都能理解。
-
这个话题其实挺有意思,揭示了互联网跟AI这波最大的差别。互联网过去20年发生最重要的事情,是把供给搬上线,变成更好的数字化展现。把信息变成文章、推荐条目,把商品变成图片和文案,把服务变成照片加描述。这是过去20年的主线:把线上线下的供给做标准化并分发。但今天很不一样,你能记录的信息更多,一个人有更多的需求和意图表达出来。这个意图跟AI交互的时候,可以带动很多不一样的玩法或新机会。所以往后看,很有可能是一个人完整的意图表达,跟最后交付完成意图之间的匹配过程。
-
这一步肯定有明确的差异点。一开始不会有这么多偏To B、偏工具的东西出现。iOS刚出来的时候,天气预报、日历、万年历这些小工具很火,相对简单。到后面内容越来越复杂,娱乐产品越来越多。我感觉如果最终没有本质变化,比如还是人跟人交互,或者人消费信息和产品,很多东西还是相通的。但有些东西会发生本质变化。以前只有人跟人交互,或者人消费信息。之后可能一个人身边围着几十个Agent,不论工作还是娱乐都围绕你转,这个范式会发生变化。
-
我倾向于认为老的一些定律大部分都还存在,包括网络效应。只不过今天还没什么产品做到To C,或者让用户之间产生交互。如果看移动互联网早期,也没有什么网络效应,最早用到的都是特别简单的游戏、生产力工具和阅读。AI如果注定改变互联网,今天也还在早期,还没到百花齐放的阶段。AI的能力可能隐在幕后,更多的是产品创新,为用户提供本质价值。就像我们记得抖音、美团、滴滴,但大家不会清楚地说美团是靠LBS的。今天还在卷基础技术,有一些灵光一现的点。但离这些东西变成底层、技术平权且完善,在上面构建更大的东西,可能还没到那个时间点。
-
我自己有一种模模糊糊的感觉。现在我们所有的交互形式,人的介入是很深的。今天大模型不管叫Agent还是Workflow,很有可能是人跟AI一起在某个业务或场景里共存,一起完成具体任务。当引入的AI越多,人跟AI协作的情况越多,也许会产生某种程度的效应。之前的创新都是在连接层面,修路、修运河、网络都是连接,但这次是有智能参与,这是很大的差异。
AI内容的接受度:用户已经不care是不是AI了
-
我自己感受是,10月、11月的时候,我刷了好多Sora生成的短视频。很多人生产视频发到抖音、小红书上。我有一个比较深的感触:确实现在好多内容一眼看上去就是AI,包括AI的水印也很明显。但我看到评论区用户已经不是在讨论AI本身了。最关键的是,用户已经不care它是不是AI了。即使一眼看出来是AI,大量人还是在讨论这个梗本身,剧情更有趣,这才是吸引大家的东西。如果时间线往后推,以后大家消费的内容,人们已经分不出来是不是AI,或者即使看出来,心态也会变,已经不care了。
-
这跟原来咱们闲扯的时候聊过的一样。最早电影发明的时候,人类是不能理解剪辑的。你要看一个东西,一定要一镜到底拍到尾,才知道是个故事。中间剪辑了,或者拍个特写,他会觉得这个人被砍了一半,根本不理解。但是到现在,剪辑已经很复杂了,不停地闪回,大家都能接受。对应到AI上,很可能未来大家对这事就不介意了,人的心态会变化。甚至我已经相信跟我聊天的那个人背后是有自主意志或者灵魂的。人的心态变化过程,不是靠一条数学曲线去推导的,有可能在某个节点就突然发生了变化。
过去三年认知发生的最大转变
-
如果回顾的话,我想问大家一个问题。AI发展有3年了,我们一直在投资,也在做认知迭代。过去3年,你们的认知发生最大转变的点在哪?从最开始看到Midjourney、ChatGPT,当时对AI的判断,到今天看可能是完全错误的。
-
我先抛砖引玉。我看内容平台比较多,有一段时间对AI上头了,觉得UGC完蛋了,以后都是AIGC,AI一定更快更强。但是3年过去了,你发现AI的生产能力大幅上升,但依然需要人的干预。AI更像是一个厉害的工具,让人变得更强。如果完全脱离开AI,仍然不能完全生产高质量的内容。所以我的预期从“AIGC颠覆UGC”变成了“UGC演化成人在驾驶AI(AI Copilot)”。
-
我觉得本质上是一开始我们没有那么理解模型。AI更像是一个抽象和最大公约数,它有很强的能力,就像一个学业特别好的博士生,但它依然不懂一个具体的行业。比如不懂投资,不懂怎么做医生,不懂怎么做导演。它还是需要专业Know-how。今天人还没有提供足够多的数据让AI在每个垂直领域变得非常强。AI是一个非常厉害的人,但最后画龙点睛那一下还是得靠人。
-
我的感受,第一就是深层次的数字化,拼命通过传感器或智能设备收集人类数据。第二,我在Monica里面让它帮我跑一个东西,比如“把这段时间所有华人创业的项目跑一遍”。我突然看见一个弹窗,它自己开发了一个程序开始弄。我是非常吃惊的,因为我没有告诉它这样做。它有一段思考:到底华人怎么定义?姓氏怎么样?它自己设置了一个原则,然后给我输出。我觉得AI的推理和逻辑比我们强,有东西能够直接触达结果,这点非常出乎意料。
-
对我来说是模型能力上,应该是Claude 3.5 Sonnet。这是一个模型带来范式巨大跃迁的时刻。原来大家对模型的使用基本都在聊天框里,以前是“接下茬儿”。当Claude 3.5出来后,实际上开启了整个编程的范式。后面有了OpenAI的o1系列模型,这些东西结合在一起,把整个空间打开了。原来是在平面上探索,现在是在更立体的空间里探索。这个是非常Surprise的,不在我的线性外推预料之内。
AI的渗透率与 Killer App
-
往回看,看Chatbot那个聊天范式,其实它跟一个更智能的搜索没有本质区别。最开始看大模型的时候,它数都算不了,两位数加两位数都算不对。现在这已经不是问题了。我觉得AI仍然在一个非常小众的圈子内。那时候在iPhone之前,我们用多普达手机挂个QQ觉得很牛,但大部分人是不知道的。今天AI其实也在这个状态下。我身边的很多人甚至同行,接受AI的速度其实比我们想象的要滞后。
-
移动互联网一开始也是这样,后来大量人使用淘宝、拼多多、抖音,几乎全民都上来了。现在的确特别早,但全球每天也有几亿人在使用。ChatGPT过10亿的MAU,加上国内的豆包、DeepSeek、Kimi、MiniMax,实际上已经是一个非常庞大的群体。每过一个坎儿,可能就是人类社会的一次大变化。
-
总结一下,我们现在说的是人群渗透率。你觉得身边不在创投圈子的年轻朋友,他们对AI的接受度高吗?
-
我觉得搜索场景应该已经改造得非常大了。现在大家默认的天然搜索,第一个去问的就是豆包和ChatGPT。越年轻的朋友越以用先进产品为荣。很多互联网从业者都看到ChatGPT跟豆包的翘尾效应,翘尾本身代表很大的泛化过程。
-
那你觉得现在渗透率算高吗?加上所有To C产品的搜索框,可能不到10%。我觉得10%已经很不得了了。搜索是一个固定的刚需,它的转变不是一个剧烈的、一下子把人群淹没的新东西。比如小程序里的手机游戏,它造成了几十倍不玩游戏的人开始玩游戏,这是巨大变化。豆包可能算个例外,但大部分AI工具还是在原有业务上慢慢渗透。
-
没有百度的时候,你上网得有明确预期,互联网是孤立的。有了搜索引擎,大量东西被检索分发,产生了本质变化。我觉得豆包目前还是原有业务和需求的升级满足,它还不是一个全新的需求。可能下一个时代的“微信”、“短视频”现在还没出现,大家完全不知道长什么样。
-
总结一下,就是一个应用了新技术的Killer App,让这波行情大幅渗透到普通人身上。对话这件事情肯定是被低估的。就像一个四岁的小朋友,只要能把意思说清楚,大模型就能帮他找东西或完成任务。从产品角度来说,ChatGPT肯定是目前最大的Game Changer和Killer App。
个人使用习惯的变化:AI作为超级助理
-
过去一年我最大的变化就是,我在大模型里做了一个分身。我把所有的文章、PPT、分享都喂给它。现在我要写个串场演讲,它几乎能用和我一样的口气写出来,节约了我非常多的时间。
-
我接受新产品相对慢,但今年变化很大。我重度使用ChatGPT,它是我搜索、思考、整理的过程。我所有的输出或思考都会用。生图偶尔玩玩,视频还没到重度使用的程度。
-
我感觉是使用习惯的变化。今年年初开始,我所有的线上线下会议、微信通话,都会打开豆包或通义听悟记录。我也不知道记录干嘛,但先记录下来再说,总有一天它的价值会被放大。我几乎认为未来人类生命全过程的绝大部分数据都会被记录下来。
-
今年有一个挺有意思的体验。之前ChatGPT发了GPT-4o,它把追问做得很好。平时工作聊项目,我会把录音总结给它,让它精简成一段话发微信。以前我需要自己Prompt,但这次它直接回了一句:“要不要像以前一样,我帮你总结成一段话?”我回个Yes,它马上给我,我直接复制粘贴。它变得更主动了。
-
我现在用的时候,会经常让它把关于我的“长期记忆”全部列一遍,我检查一下哪句是错的让它改。AI变得更主动,感觉像有一个助理。这很像科幻小说里,当你习惯有一个助理帮你干活后,如果不让你用AI,你已经开始难受了。
审美权重的降低与信息茧房的打破
-
我有一个暴论。过去这么多年,包括现在AI解决的一个问题,就是让人的“审美”成分降得越来越低。靠一群人的审美去影响另一群人,这事变得没那么重要了。以前看新闻靠编辑,看长视频靠导演编剧。今天随着短视频、推荐引擎,再到AI,你自己的偏好和意图变得更重要。审美权重变低,偏好变高。
-
那这样信息茧房是变弱了吗?
-
我觉得信息茧房实际上被打破了。你跟AI聊天时,AI并不是完全顺着你,它会有不同观点跟你讨论。原来推荐引擎是通过你的操作强化茧房,不喜欢就划走;但今天你跟AI互动,是有交互成分在的。
-
我最近用一个很好玩的产品,直接做视频的网站。我上传两个儿子的照片,它就会根据我的一句话编一个故事。我每周做一两个视频带回去给孩子们看。我给哥哥设定成超级英雄,弟弟跟着他成长。对小朋友来说,他不知道AI是什么,但AI已经跟他的记忆深度耦合在一起了,他们是原生的AI群体。
创业、非共识与“机械降神”
-
我想讨论一个话题。我旁观了几个周期,每次周期过去后,下一代人只能从幸存者写的文本中去寻找规律。现在AI到底有没有迹可循?是不是可以通过逻辑推演找到大方向?
-
我的观点是,其实没有那么多方法论。在行业发展非常早期,靠逻辑推演是推不出结果的。更多是创业者自身的激情,跟时代最强音共振到一起了。碰巧把这事做成了,其实就是看人。因为行业在剧烈变化,每个人的主观能动性会让事情产生不一样的发酵。就像十多年前看美团,你不能想象后面有外卖;看短视频,不能想象它能降维渗透到各个行业。
-
早期的时候,总有些创始人讲的东西让你觉得很科幻。比如我们种子期投宇树科技的王兴兴,他当时有个愿景:想用机器人去造机器人。造一个比山还大、像奥特曼一样的机器人,再造小到纳米级的机器人。听起来很无厘头,但从创始人的愿景来看,最后的发展路径也是这样。
-
请教一个问题:当有些方向创业者做出来了,巨头也很快跟进,那是更值得投还是更不值得投了?
-
完全是Case by case。有的方向比如抓娃娃,产品很酷,但它没有壁垒,不适合初创公司。但有的巨大的东西,比如字节跳动,在很长时间内它的推荐算法和价值观是完全“非共识”的。我不认同过字节和抖音,最后被打脸。这是它能做大的原因。
-
今天AI有什么非共识?Midjourney有7亿美金的ARR,这本质上是个非共识现象。大家都觉得后面有更好的模型会冲击它,但它依然在涨。Character.ai也是,大家疯狂唱衰,但它一直在涨。ChatGPT也是,大家都觉得产品做得没豆包好用,但它靠极简的形态一直支撑到现在。
-
竞争差异有程度之分:最浅是技术领先,往下是认知层面(网络效应、用户习惯),再往下是非共识,最核心的差异落脚到创始人的个性。知之者不如好之者,好之者不如乐之者。
-
我觉得下一代可能出现的伟大To C产品,就是“机械降神”。它突然就出现了,天降大任。我看日本动漫,很多民工漫没落是因为世界观圆不回来,boss打不赢。最后只能靠主角突然“机械降神”获得能力干掉boss。比如《JOJO的奇妙冒险》第七部,boss的能力是操控世界的灾厄,而主角的能力是发射泡泡(弦理论)。不存在于世界上的东西对抗世界的灾厄,他赢了。以后To C的产品可能也是这样,突然出现一个灵感。
供给侧革命与多维宇宙的未来
-
我们现在能做的,就是对大的趋势极度乐观。智能变得越来越强、越来越廉价,所有人唾手可得,这是高概率事件。但具体某个产品长什么样,是不可描述的。你要寻找AI时代的抖音、微信、小红书,这是不存在的。今天出现的东西,往往是你不知道的,但会让你有Aha moment。
-
这一波机会里,是巨头吃掉更多,还是创业公司拿到更多门票?每次创新,只会有极少数名字被加到巨头列表里。移动互联网也就几张大门票。上一个时代的玩家不是被淘汰,而是被遗忘。当它做的业务没那么重要时,大家就忘掉它了。
-
短视频可能是人类历史上Top 5的门票,它达到了认知和消费效率的极限。AI时代还有没有这么大的门票?我觉得以前互联网是注意力经济,卖流量、做线上地产商。但今天形态变了,如果你指望ChatGPT形成泛娱乐消费平台,不一定成立。它带来的是供给侧革命,劳动力变得极其充裕,人手N个助理。从房地产生意变成劳动力生意,这是一个重要变化。
-
也许未来这种异步的、云端的沟通会成为常态。你的助理、分身在云端存在,人类的交互时间被打满。有一个更鲜活的多维宇宙,里面都是Bot在为你卖命或提供娱乐。
-
最后,我们这期播客叫《The Prompt》。诗歌其实就是Prompt,信息量极低,但读到它的人靠自己的模型想象出内容。好诗能激发更多人的想象。我们几个不同背景的人在这里碰撞,就像不同的Agent在互相Prompt。可能我们说的98%都是废话,但如果有2%能让谁突然灵光一现,这就是Prompt的意义。