OpenAI近期的体验和看法

从局外人的角度看,OpenAI巨大泡沫显而易见

他们的新产品——Atlas浏览器——远谈不上划时代。它只是一个加了AI助手的Chrome变体,最多也就是“安装了AI插件的Chrome”。相比之下,豆包Mac客户端完全免费;对比大火的Fellou在多任务并行、Agent调度等方面的能力,更是甩Atlas几条街。Atlas距离真正意义上的Agentic Browser还很远。

过去几个月,OpenAI动静不小,但技术突破却乏善可陈

  1. 模型技术突破有限:GPT-5创新性远不及早期的GPT-3→GPT-4跨越。在多模态与推理能力上,Google Gemini 2.5 Pro已经与之持平甚至超越。

  2. 产品粗糙:无论是Codex、ComputerUse还是近期的开发者功能,体验都显得粗糙,短期可玩但难以支撑真正的生产力工具。

  3. 技术理想主义退潮:Sam Altman以及整个OpenAI团队,明显更关注商业化与资本合作——与英伟达、AMD、微软的深度捆绑,更多是为了维持估值体系,而非追求技术范式的突破。

从市场行为的角度看,趋势仍在延续——泡沫破前总会再创新高。投资者的信念让OpenAI暂时屹立不倒。

但从价值投资的角度,我已经不再把OpenAI视作长期标的。

短期内无法做空它,所以我会选择它最具技术底蕴的老对手:Google

设计AI Agent的感想

最近尝试将工作中的工具整合到Agent中,打造一个面向SRE的协作智能体,过程中读到了很多好文章好思路,写下来一起分享。

好的问题,就是答案的一半

对比两个DeepResearch的效果:

Gemini的模型能力很强,但是截止25年7月,Gemini2.5Pro普通模式下依然不显示工具调用和辅助思考,因此在我的多次使用中,都出现了严重的幻觉和意图判断错误。即使是Gemini DeepResearch,最后给报告的感觉像是“综上所述”,没做到结合问题中的核心点来进行分析。

ChatGPT Deepresearch让我感觉最好用的点在于: 在第一次提问后,会围绕你的问题进行二次提问(意图识别+槽位分析),精准的帮用户分割问题,补充上下文,在Research过程中不断修正目标,最后的报告质量可用性非常高。

好的问题,就是答案的一半。 工作中常常看到因为错误的问题和方向,导致整个团队的返工。在使用AI的过程中,这句话又一次又一次的告诉我,解决问题就是定义问题,拆解成更多的问题,而这些问题值不值得、能否回答清楚,才是解决问题的关键所在。

时刻谨记惨痛的教训,做“船一样”的产品,而非“塔一样”的产品

选择做船的产品和决策,随着基座模型和底层能力的提升,产品能力/个人能力就会跟着提升,而做塔就会被淹掉。

充分利用巨大计算能力的通用方法,远胜于那些试图利用人类领域知识的方法。最终是、也几乎总是最有效的方法。

AI研究者不应过度专注于将现成的、人类的知识和思维方式塞进AI模型里。相反,我们应该致力于开发和改进那些能够随着计算能力增长而无限扩展的“元方法”(meta-methods),主要是搜索学习。这些方法能够让AI自己去发现知识,而不是被动地接受人类赋予的知识。

大约一年前多,我用ChatGPT分析我的账单,结果就是,非常“气人”:驴唇不对马嘴不说,调用各种工具的成功率异常低,经常以报错结束。

而我们现在用ChatGPT的O3模型:

对于我们当前工作来说,什么是通用的力量:

  1. 基座模型的能力

  2. 使用工具的能力

  3. 智能体结合上下文的能力

因此我们其实能做很多,除了基座模型的力量我们能够提升的较慢以外。 我们能够丰富工具、丰富上下文,而这一切,都能够切实影响智能体的行为。

Agent is grown, not built

有一句很著名的话: Software is grown, not built

任何软件都不是设计来的,是自我成长来的。

Agent也是。

我们要打造动态的Agent,因此他的知识库要是活的,动态的。

因为员工是动态的,公司是动态的,业务是动态的。 并非不能使用固定的Prompt来解决特定的问题,而是指:一旦你使用了静态的Context/脚手架来约束AI,你应该清晰的了解其边界和能力范围。并尽量控制这样的场景重复发生。

Agent更像有生命的森林,给予阳光、雨露、适当的肥料和耐心,允许他用自己的方式成长。这个过程,远比按照你设定的更有生命力,更强大。

对于我们工作来说:

阳光:Agent生长方向,我们应当选择怎样的基座模型,如何最大潜力发挥这个模型的能力。

雨露:为Agent充分授权使用各种工具的权利。

适当的肥料:适当的上下文,合适的知识,数据约束。

耐心:Agent团队领导者的信心、决心和耐心。

现阶段,人机协作大于独立的人或独立的机器

读《人类简史》有一点很震撼,纵观人类历史,在漫长的历史进程中,不管人类自己如何认为,人类不是也永远不是那个最聪明、最终统治世界的生物,事实上,这样的生物也并不存在。

“碳基生命只是硅基生命的Bootloader”

我没觉得这句话从自然角度来讲,并非无法接受。如果你知道了这个残酷无情的事实,那你现在便拥有了下个阶段的钥匙。

给Agent充分的授权,设定可扩展的范围,用人去引导Agent理解这个世界,是Bootloader的使命。

但这个过程,也是让人更强的过程。

长远的眼光

和组内曾经合作过的小伙伴沟通,这段时间以来他一直在和组内一个资深的工程师做看起来非常OKR的项目,但这些事情,从长期发展的角度来看,对他的职业生涯并没有太多实质的提升和进步。

我原来对他的期望很高,前段时间我和领导聊了聊对他的看法:头脑灵光,执行力强,但有点可惜的是,这些都在消失的过程中。

今天挑了个机会和他大概讲了下我的想法,他不明白,他说虽然从毕业后没有什么重要的社会贡献,钱最重要,也没感到失去了什么。

他还没成家,没孩子,没那么多琐事破事,有无限的精力,可无限的精力大部分都白白被工作中最不重要的消耗了,并没有真正的用于提升自己,为将来铺路。他们误以为,真正需要的,就是那33两白银。

我说因为我还在这个环境中不能说太多,很多东西都需要你去悟,相信你花时间多思考,能想到我想说什么。如果实在不知道,那只能等我离职了。

我愿意和他说,是因为他曾经和我一起写过代码,讨论过系统设计,也大半夜为上一个新功能而努力。

可我帮不了他,我深感人生确实没有捷径可走,这个世界的一切都在精准匹配着你,而你永远都要为你的认知买单。

人不管多晚,得明白一个道理,任何资源在需要的时候都是紧缺的。

从玩游戏中就能看出来,早期最重要的是钱,矿产资源(另外一种形式的钱)。

后期不缺这些都东西了,就开始缺手速(节奏),你的能力如果跟不上节奏,就会被快速淘汰掉。

人生也是一样,早期我们只是为了钱努力,而不是为了节奏而努力,那越往上走,你会越来越难受。

好忙没时间,那就会永远好忙,永远没时间。

好迷茫没方向,那就会永远好迷茫,永远没方向。

树立远大的理想(不只是为了钱),往前走,低头走路,抬头看路,不是为了达到终点,只是为了享受走在路上的感觉。

这个道理,越早明白越好。