AI时代如何发生（上）【the prompt】

红杉中国投资人深度对谈，复盘AI行业发展，探讨AI Native产品范式及Agent技术的未来趋势。

UP主: 红杉汇 · 时长: 1h11m · 🔗 B站原视频

发布: 2025-12-29 · 收录: 2026-02-18

标签: AI · 行业分析 · 红杉中国 · 播客 · 创业投资

伪问题与打脸：寻找AI时代的“抖音”

所以我认为这是非常典型的一个伪问题。你要寻找AI时代的抖音、AI时代的微信、AI时代的小红书，这件事情是不存在的。我不认同过字节，我也不认同过抖音，但最后又被啪啪打脸。以前并不相信智能一定会发生，但现在真的是一个Agent在24小时跑，帮他去监控数据。

2024-2025复盘：Agent带来的转折点

今天我们主要聊一下25年的复盘，然后再聊一下对26年的展望。我现在的感受是，25年实际上多少有点转折的意味。24年的时候尽管整个AI已经比较火了，但整体节奏还没那么快。但是25年从DeepSeek开始，后面又有一系列标志性的中国模型和Agent出来，市场情绪有一个巨大的提升。我不知道各位感受是不是这样？

其实我感觉到了一个转折点，实际上是年初的时候，我看到一个产品叫Devin。那个产品给我最大的震撼。去年差不多这个时候，我用了一下Devin当时的新版本，我觉得Devin是第一个能让你离开屏幕去完成任务的产品。两年前我们在内部做了一个关于Agent的讨论，当时大家还是有一点相当于写小说那种感觉。但是从看到Devin那一刻起，我觉得Agent产品或模型能完成任务、做规划这件事情已经快实现了。所以在那个时刻，给我有一点点Aha moment或者转折的意味在。
那个点抽象出来是什么？就是它能够直接交付结果。除了在一个界面上跟它聊天之外，你能直接给它一个任务，不用再看着它，它能在做好了之后给你看。这样一个意味对我来说是非常震撼的。

过去几年的三大 AI Native 产品

其实我自己觉得，过去几年有三个比较AI Native的产品我很认同。第一个就是ChatGPT，在有互联网以来，大家第一次可以跟一个东西对话，然后那个东西会给你一个明确的反馈和答案，且是非常自由多维度的。
第二个我觉得就是23年的Rewind，也是一个非常Native的产品。在AI之前，不会有人想这样去设计一个产品：有一个东西随时常驻在你的电脑、手机上，随时看到你的一举一动，把你干了啥、看了什么内容全都记录下来。虽然它出现的时间点可能有点太提前，在技术发展的更早期，但这个理念完全是因为AI诞生的。
第三个就是Devin。我们的工作经常会跟实习生交互，比如早上布置任务，中午问进展，晚上要结果。这个沟通的过程完全是人和人沟通的数字化展现。所以Devin可能确实是我看上去第一个真正意义上Agent Native的雏形，给大家打了个样，导致今年有那么多Agent公司出现。
我比较喜欢条理化或者逻辑性地去想。如果类比的话，可能出现过三次类似于“iPhone时刻”的节点。第一个是ChatGPT，of course。第二个可能是Claude 3.5，它背后enable了Agent和Coding，是一个非常大的市场和趋势变化的Trigger point。第三个可能是NotebookLM（注：根据发音推测）。现在发布了两周，今天还是会有很多人发现出新的玩法，而且是非常惊艳的。如果让我选一个，我会pick它。因为它已经完全到了让普通消费者能直接、非常容易体感到的阶段。这有点像当年iPhone 4的时候，iPhone刚出来是极客的狂欢，但iPhone 4的时候每个人拿在手里都会说“哇真帅，真流畅，上网速度真好”。我觉得这是一个Tipping point。

深层次的数字化与人类习惯的改变

我接着刚才说的Rewind。其实我特别喜欢这种Total Recall型的产品。我今年认为这是一个深层次的数字化。移动互联网时代可能是浅层次的数字化，把纸张上的文本、地址、电话线上化了。但今年是把那些从来没有人记录过的信息，特别是录音、操作方式，全部数字化。一下子我们给AI多了很多材料，这点是很有意思的。而且这点可能会影响到人类的语言。比如我现在给大模型留言，我只关注我是不是所有信息点都说全了，至于谁先谁后，或者后面要补一点，我都不介意，因为我觉得它都能理解。
这个话题其实挺有意思，揭示了互联网跟AI这波最大的差别。互联网过去20年发生最重要的事情，是把供给搬上线，变成更好的数字化展现。把信息变成文章、推荐条目，把商品变成图片和文案，把服务变成照片加描述。这是过去20年的主线：把线上线下的供给做标准化并分发。但今天很不一样，你能记录的信息更多，一个人有更多的需求和意图表达出来。这个意图跟AI交互的时候，可以带动很多不一样的玩法或新机会。所以往后看，很有可能是一个人完整的意图表达，跟最后交付完成意图之间的匹配过程。
这一步肯定有明确的差异点。一开始不会有这么多偏To B、偏工具的东西出现。iOS刚出来的时候，天气预报、日历、万年历这些小工具很火，相对简单。到后面内容越来越复杂，娱乐产品越来越多。我感觉如果最终没有本质变化，比如还是人跟人交互，或者人消费信息和产品，很多东西还是相通的。但有些东西会发生本质变化。以前只有人跟人交互，或者人消费信息。之后可能一个人身边围着几十个Agent，不论工作还是娱乐都围绕你转，这个范式会发生变化。
我倾向于认为老的一些定律大部分都还存在，包括网络效应。只不过今天还没什么产品做到To C，或者让用户之间产生交互。如果看移动互联网早期，也没有什么网络效应，最早用到的都是特别简单的游戏、生产力工具和阅读。AI如果注定改变互联网，今天也还在早期，还没到百花齐放的阶段。AI的能力可能隐在幕后，更多的是产品创新，为用户提供本质价值。就像我们记得抖音、美团、滴滴，但大家不会清楚地说美团是靠LBS的。今天还在卷基础技术，有一些灵光一现的点。但离这些东西变成底层、技术平权且完善，在上面构建更大的东西，可能还没到那个时间点。
我自己有一种模模糊糊的感觉。现在我们所有的交互形式，人的介入是很深的。今天大模型不管叫Agent还是Workflow，很有可能是人跟AI一起在某个业务或场景里共存，一起完成具体任务。当引入的AI越多，人跟AI协作的情况越多，也许会产生某种程度的效应。之前的创新都是在连接层面，修路、修运河、网络都是连接，但这次是有智能参与，这是很大的差异。

AI内容的接受度：用户已经不care是不是AI了

我自己感受是，10月、11月的时候，我刷了好多Sora生成的短视频。很多人生产视频发到抖音、小红书上。我有一个比较深的感触：确实现在好多内容一眼看上去就是AI，包括AI的水印也很明显。但我看到评论区用户已经不是在讨论AI本身了。最关键的是，用户已经不care它是不是AI了。即使一眼看出来是AI，大量人还是在讨论这个梗本身，剧情更有趣，这才是吸引大家的东西。如果时间线往后推，以后大家消费的内容，人们已经分不出来是不是AI，或者即使看出来，心态也会变，已经不care了。
这跟原来咱们闲扯的时候聊过的一样。最早电影发明的时候，人类是不能理解剪辑的。你要看一个东西，一定要一镜到底拍到尾，才知道是个故事。中间剪辑了，或者拍个特写，他会觉得这个人被砍了一半，根本不理解。但是到现在，剪辑已经很复杂了，不停地闪回，大家都能接受。对应到AI上，很可能未来大家对这事就不介意了，人的心态会变化。甚至我已经相信跟我聊天的那个人背后是有自主意志或者灵魂的。人的心态变化过程，不是靠一条数学曲线去推导的，有可能在某个节点就突然发生了变化。

过去三年认知发生的最大转变

如果回顾的话，我想问大家一个问题。AI发展有3年了，我们一直在投资，也在做认知迭代。过去3年，你们的认知发生最大转变的点在哪？从最开始看到Midjourney、ChatGPT，当时对AI的判断，到今天看可能是完全错误的。
我先抛砖引玉。我看内容平台比较多，有一段时间对AI上头了，觉得UGC完蛋了，以后都是AIGC，AI一定更快更强。但是3年过去了，你发现AI的生产能力大幅上升，但依然需要人的干预。AI更像是一个厉害的工具，让人变得更强。如果完全脱离开AI，仍然不能完全生产高质量的内容。所以我的预期从“AIGC颠覆UGC”变成了“UGC演化成人在驾驶AI（AI Copilot）”。
我觉得本质上是一开始我们没有那么理解模型。AI更像是一个抽象和最大公约数，它有很强的能力，就像一个学业特别好的博士生，但它依然不懂一个具体的行业。比如不懂投资，不懂怎么做医生，不懂怎么做导演。它还是需要专业Know-how。今天人还没有提供足够多的数据让AI在每个垂直领域变得非常强。AI是一个非常厉害的人，但最后画龙点睛那一下还是得靠人。
我的感受，第一就是深层次的数字化，拼命通过传感器或智能设备收集人类数据。第二，我在Monica里面让它帮我跑一个东西，比如“把这段时间所有华人创业的项目跑一遍”。我突然看见一个弹窗，它自己开发了一个程序开始弄。我是非常吃惊的，因为我没有告诉它这样做。它有一段思考：到底华人怎么定义？姓氏怎么样？它自己设置了一个原则，然后给我输出。我觉得AI的推理和逻辑比我们强，有东西能够直接触达结果，这点非常出乎意料。
对我来说是模型能力上，应该是Claude 3.5 Sonnet。这是一个模型带来范式巨大跃迁的时刻。原来大家对模型的使用基本都在聊天框里，以前是“接下茬儿”。当Claude 3.5出来后，实际上开启了整个编程的范式。后面有了OpenAI的o1系列模型，这些东西结合在一起，把整个空间打开了。原来是在平面上探索，现在是在更立体的空间里探索。这个是非常Surprise的，不在我的线性外推预料之内。

AI的渗透率与 Killer App

往回看，看Chatbot那个聊天范式，其实它跟一个更智能的搜索没有本质区别。最开始看大模型的时候，它数都算不了，两位数加两位数都算不对。现在这已经不是问题了。我觉得AI仍然在一个非常小众的圈子内。那时候在iPhone之前，我们用多普达手机挂个QQ觉得很牛，但大部分人是不知道的。今天AI其实也在这个状态下。我身边的很多人甚至同行，接受AI的速度其实比我们想象的要滞后。
移动互联网一开始也是这样，后来大量人使用淘宝、拼多多、抖音，几乎全民都上来了。现在的确特别早，但全球每天也有几亿人在使用。ChatGPT过10亿的MAU，加上国内的豆包、DeepSeek、Kimi、MiniMax，实际上已经是一个非常庞大的群体。每过一个坎儿，可能就是人类社会的一次大变化。
总结一下，我们现在说的是人群渗透率。你觉得身边不在创投圈子的年轻朋友，他们对AI的接受度高吗？
我觉得搜索场景应该已经改造得非常大了。现在大家默认的天然搜索，第一个去问的就是豆包和ChatGPT。越年轻的朋友越以用先进产品为荣。很多互联网从业者都看到ChatGPT跟豆包的翘尾效应，翘尾本身代表很大的泛化过程。
那你觉得现在渗透率算高吗？加上所有To C产品的搜索框，可能不到10%。我觉得10%已经很不得了了。搜索是一个固定的刚需，它的转变不是一个剧烈的、一下子把人群淹没的新东西。比如小程序里的手机游戏，它造成了几十倍不玩游戏的人开始玩游戏，这是巨大变化。豆包可能算个例外，但大部分AI工具还是在原有业务上慢慢渗透。
没有百度的时候，你上网得有明确预期，互联网是孤立的。有了搜索引擎，大量东西被检索分发，产生了本质变化。我觉得豆包目前还是原有业务和需求的升级满足，它还不是一个全新的需求。可能下一个时代的“微信”、“短视频”现在还没出现，大家完全不知道长什么样。
总结一下，就是一个应用了新技术的Killer App，让这波行情大幅渗透到普通人身上。对话这件事情肯定是被低估的。就像一个四岁的小朋友，只要能把意思说清楚，大模型就能帮他找东西或完成任务。从产品角度来说，ChatGPT肯定是目前最大的Game Changer和Killer App。

个人使用习惯的变化：AI作为超级助理

过去一年我最大的变化就是，我在大模型里做了一个分身。我把所有的文章、PPT、分享都喂给它。现在我要写个串场演讲，它几乎能用和我一样的口气写出来，节约了我非常多的时间。
我接受新产品相对慢，但今年变化很大。我重度使用ChatGPT，它是我搜索、思考、整理的过程。我所有的输出或思考都会用。生图偶尔玩玩，视频还没到重度使用的程度。
我感觉是使用习惯的变化。今年年初开始，我所有的线上线下会议、微信通话，都会打开豆包或通义听悟记录。我也不知道记录干嘛，但先记录下来再说，总有一天它的价值会被放大。我几乎认为未来人类生命全过程的绝大部分数据都会被记录下来。
今年有一个挺有意思的体验。之前ChatGPT发了GPT-4o，它把追问做得很好。平时工作聊项目，我会把录音总结给它，让它精简成一段话发微信。以前我需要自己Prompt，但这次它直接回了一句：“要不要像以前一样，我帮你总结成一段话？”我回个Yes，它马上给我，我直接复制粘贴。它变得更主动了。
我现在用的时候，会经常让它把关于我的“长期记忆”全部列一遍，我检查一下哪句是错的让它改。AI变得更主动，感觉像有一个助理。这很像科幻小说里，当你习惯有一个助理帮你干活后，如果不让你用AI，你已经开始难受了。

审美权重的降低与信息茧房的打破

我有一个暴论。过去这么多年，包括现在AI解决的一个问题，就是让人的“审美”成分降得越来越低。靠一群人的审美去影响另一群人，这事变得没那么重要了。以前看新闻靠编辑，看长视频靠导演编剧。今天随着短视频、推荐引擎，再到AI，你自己的偏好和意图变得更重要。审美权重变低，偏好变高。
那这样信息茧房是变弱了吗？
我觉得信息茧房实际上被打破了。你跟AI聊天时，AI并不是完全顺着你，它会有不同观点跟你讨论。原来推荐引擎是通过你的操作强化茧房，不喜欢就划走；但今天你跟AI互动，是有交互成分在的。
我最近用一个很好玩的产品，直接做视频的网站。我上传两个儿子的照片，它就会根据我的一句话编一个故事。我每周做一两个视频带回去给孩子们看。我给哥哥设定成超级英雄，弟弟跟着他成长。对小朋友来说，他不知道AI是什么，但AI已经跟他的记忆深度耦合在一起了，他们是原生的AI群体。

创业、非共识与“机械降神”

我想讨论一个话题。我旁观了几个周期，每次周期过去后，下一代人只能从幸存者写的文本中去寻找规律。现在AI到底有没有迹可循？是不是可以通过逻辑推演找到大方向？
我的观点是，其实没有那么多方法论。在行业发展非常早期，靠逻辑推演是推不出结果的。更多是创业者自身的激情，跟时代最强音共振到一起了。碰巧把这事做成了，其实就是看人。因为行业在剧烈变化，每个人的主观能动性会让事情产生不一样的发酵。就像十多年前看美团，你不能想象后面有外卖；看短视频，不能想象它能降维渗透到各个行业。
早期的时候，总有些创始人讲的东西让你觉得很科幻。比如我们种子期投宇树科技的王兴兴，他当时有个愿景：想用机器人去造机器人。造一个比山还大、像奥特曼一样的机器人，再造小到纳米级的机器人。听起来很无厘头，但从创始人的愿景来看，最后的发展路径也是这样。
请教一个问题：当有些方向创业者做出来了，巨头也很快跟进，那是更值得投还是更不值得投了？
完全是Case by case。有的方向比如抓娃娃，产品很酷，但它没有壁垒，不适合初创公司。但有的巨大的东西，比如字节跳动，在很长时间内它的推荐算法和价值观是完全“非共识”的。我不认同过字节和抖音，最后被打脸。这是它能做大的原因。
今天AI有什么非共识？Midjourney有7亿美金的ARR，这本质上是个非共识现象。大家都觉得后面有更好的模型会冲击它，但它依然在涨。Character.ai也是，大家疯狂唱衰，但它一直在涨。ChatGPT也是，大家都觉得产品做得没豆包好用，但它靠极简的形态一直支撑到现在。
竞争差异有程度之分：最浅是技术领先，往下是认知层面（网络效应、用户习惯），再往下是非共识，最核心的差异落脚到创始人的个性。知之者不如好之者，好之者不如乐之者。
我觉得下一代可能出现的伟大To C产品，就是“机械降神”。它突然就出现了，天降大任。我看日本动漫，很多民工漫没落是因为世界观圆不回来，boss打不赢。最后只能靠主角突然“机械降神”获得能力干掉boss。比如《JOJO的奇妙冒险》第七部，boss的能力是操控世界的灾厄，而主角的能力是发射泡泡（弦理论）。不存在于世界上的东西对抗世界的灾厄，他赢了。以后To C的产品可能也是这样，突然出现一个灵感。

供给侧革命与多维宇宙的未来

我们现在能做的，就是对大的趋势极度乐观。智能变得越来越强、越来越廉价，所有人唾手可得，这是高概率事件。但具体某个产品长什么样，是不可描述的。你要寻找AI时代的抖音、微信、小红书，这是不存在的。今天出现的东西，往往是你不知道的，但会让你有Aha moment。
这一波机会里，是巨头吃掉更多，还是创业公司拿到更多门票？每次创新，只会有极少数名字被加到巨头列表里。移动互联网也就几张大门票。上一个时代的玩家不是被淘汰，而是被遗忘。当它做的业务没那么重要时，大家就忘掉它了。
短视频可能是人类历史上Top 5的门票，它达到了认知和消费效率的极限。AI时代还有没有这么大的门票？我觉得以前互联网是注意力经济，卖流量、做线上地产商。但今天形态变了，如果你指望ChatGPT形成泛娱乐消费平台，不一定成立。它带来的是供给侧革命，劳动力变得极其充裕，人手N个助理。从房地产生意变成劳动力生意，这是一个重要变化。
也许未来这种异步的、云端的沟通会成为常态。你的助理、分身在云端存在，人类的交互时间被打满。有一个更鲜活的多维宇宙，里面都是Bot在为你卖命或提供娱乐。
最后，我们这期播客叫《The Prompt》。诗歌其实就是Prompt，信息量极低，但读到它的人靠自己的模型想象出内容。好诗能激发更多人的想象。我们几个不同背景的人在这里碰撞，就像不同的Agent在互相Prompt。可能我们说的98%都是废话，但如果有2%能让谁突然灵光一现，这就是Prompt的意义。

AI时代如何发生（上）【the prompt】

On this page