如何判断模型、产品性能是否真的提升了?很简单,亲自用它进行一天的实际工作就能知道。
近期,Anthropic 宣布完成了一轮 130 亿美元的融资,公司估值达到 1830 亿美元。这次融资额仅次于 2025 年 3 月 OpenAI 的 400 亿美元融资。
然而,这家公司在经历新的挑战:不少用户发现其核心产品——Claude Code 存在智能化下降的问题,有些开发者已经转向 OpenAI 推出的竞品——Codex Cli。

如果不考虑近期的争议,Claude Code 无疑是一款非常成功的产品。它从 Cursor 那里抢走了大量用户,发布 4 个月用户数量已达到 11.5 万。
这款产品为何能取得成功?在最近的一次访谈中,Claude Code 负责人 Boris Cherny 揭示了一些构建该产品的关键细节,包括其极简易用、高度可扩展的产品理念,以及用户体验优先的评估标准和快速的用户反馈响应机制。
视频链接:https://www.youtube.com/watch?v=iF9iV4xponk
以下是详细内容:
1. 过去的 12 个月里,编程领域发生了哪些变化?
一年前,如果要编写代码,开发者通常使用一个集成开发环境(IDE),后者提供自动补全功能,同时可能借助一些对话式 AI 工具,通过复制粘贴来完成代码。
后来,智能体(agents)成为编程工作流的核心组成部分。它们不再是实验性的工具,而是真正融入了开发者的日常工作流程。
2. 这种转变背后的原因是什么?
之前的两个主要制约因素是模型本身不够好,以及模型之上的工具(脚手架)也不够成熟。
过去一年,模型在智能体编程方面取得了显著进步,如 Sonnet 3.7、Sonnet 4 和 Opus 4.1 等。工具方面,Claude Code 也进步了很多。模型与工具之间相辅相成,工具就像是马鞍,让开发者更好地驾驭模型(马)。
在过去一年中,我们学会了如何为模型构建更有效的工具。模型与 Claude Code 以及整个基于 Anthropic 模型的智能体编程工具生态系统共同进化。
3. 所谓的「共同进化」是如何实现的?
在 Anthropic,每个人都使用 Claude Code,包括那些构建模型的研究人员。在这个过程中,他们会发现模型的一些自然限制。
例如,早期的 Sonnet 3.5 模型可以持续运行 1 分钟而不偏离轨道。如今,新模型能够持续自主运行的时间越来越长。这是一个基于真实体验的改进循环,通过使用者的反馈,可以不断优化模型的性能。
4. 如何评估新模型、新功能的性能是否在改善?
答案很简单:亲自用它完成当天的工作。
在日常工作中,你会执行各种任务,包括编写新代码、修复 bug、阅读 Slack 消息或 GitHub 问题来回应反馈。这种实际应用是最接近真实情况的评估方式,能够给你最直接的结果。
构建有效的评估标准非常困难。到目前为止,最直观和最直接的信号就是用户体验。因为任务的范围非常广泛,涉及多种场景。
5. 在收集反馈方面做了哪些特别的事情?
关键在于超快速响应——每当有人给出反馈时,我们会尽快修复。
有时,我会花两三个小时,尽可能快地处理和修复尽可能多的 bug,并立即通知用户已解决。这鼓励用户继续提供反馈。到今天,内部的 Claude Code 反馈渠道依然非常活跃,这种活跃的反馈循环是产品快速迭代的重要基础。
6. Claude Code 当前的状态是什么?最新的功能是什么?你对什么感到兴奋?你看到人们现在在用它做什么?
Claude Code 的设计哲学是:极简易用和高度可扩展。其中,可扩展性是当前最令人兴奋的发展方向。
扩展能力的演进历程:
- 最初:通过 CLAUDE.md 文件添加项目上下文信息
- 现在:拥有复杂的设置系统、权限管理、Hooks 系统、MCP 集成、斜杠命令、子智能体等丰富的扩展点
这些功能与模型能力的整体提升相辅相成:模型变得更加自主、工作时间更长、指令执行更准确、记忆能力更强,所有扩展功能都从中受益。
7. 未来 6 到 12 个月,使用 Claude Code 工作会变成怎样的体验?
工作模式将呈现手动与自动的深度融合:
- 交互式编程:不再是直接修改文本,而是通过 Claude 操作代码
- 主动化编程:Claude 主动执行任务甚至自我审查,开发者主要负责决策是否采纳这些修改
- 目标导向编程:未来 12-24 个月,Claude 将更多地关注高层目标和整体规划,而不是具体的执行细节
这类似于工程师的工作方式:先制定月度目标,然后通过一系列小的改动逐步实现。Claude 也将具备这种宏观规划能力。
8. 对需要适应这些变化的开发者们有什么建议?
在智能体编程出现之前,技术栈变得极其复杂。想要开发一个 JavaScript 网站,开发者必须学习 React、Next.js,以及多种构建和部署系统,这使得入门门槛非常高。
智能体的出现正在改变这一现状。现在,有了编程智能体,启动一个项目变得真正容易。如果你有想法,可以直接开始构建。重点从“如何实现”转向了“实现什么”,因为如同 Claude Code 一样,代码可以反复重写。虽然代码本身仍然是一门艺术,有时你仍然会享受手工编写代码的乐趣,但更多时候,关注点在于你要创造的东西,而不是创造的过程。
因此,我建议今天学习编程的人:仍然需要掌握核心技能——编程语言、编译器、运行时、Web 应用开发、系统设计等基础知识不能丢。但同时,要变得更加富有创造力。如果你有创业想法或产品构思,现在就可以立即开始构建,以一种以前完全不可能的方式。虽然我们还无法完全理解这意味着什么,但可以肯定的是,由于智能体的出现,巨大的创造潜力即将被释放。
9. 针对使用 Claude Code 的新手有哪些建议?
第一个建议:先问问题,后写代码。
初次使用 Claude Code 时,不要急于让它编写代码。先用它来理解现有代码库,比如问它:“如果要添加新的日志功能,应该怎么做?”或“这个函数为什么要这样设计?”
让 Claude Code 探索代码库、查看 Git 历史并回答你的疑问。等你熟悉了这种“智能体研究助手”的使用方式后,再开始让它编写代码。
第二个建议:根据任务难度选择不同策略。
将任务分为三个等级:
- 简单任务:一个提示就能完成的工作。直接在 GitHub issue 中 @Claude,让它创建 PR。
- 中等任务:使用 Shift+Tab 进入计划模式,先与 Claude 制定执行计划,确认后切换到自动执行模式。
- 困难任务:开发者主导,Claude 辅助。使用 Claude 进行代码研究、原型验证、边界探索,但核心实现仍由人完成。
关键是根据任务的复杂度选择合适的协作模式,而不是一刀切地使用同一种方法。