< img id=”wx_img” src=” width=”400″ height=”400″>
明显从”基础模型研究”向”Agent 产品化”倾斜
梦晨 发自 凹非寺
| QbitAI
当前,大模型行业正加速进入“模型能力释放”与“场景落地”并重的关键阶段。从单一对话交互向自主任务执行的 Agent 演进,已成为多家头部厂商的战略共识。在此背景下,DeepSeek 近期的招聘动向释放了显著信号。
DeepSeek 一口气开放了 17 个招聘岗位。
最核心研发岗聚焦 Agent,覆盖算法研究、数据评测、基础设施全链条。
仔细阅读每个岗位的要求,发现两个有意思的细节:
多个岗位在“加分项”或“岗位要求”中明确提到:重度使用 Claude Code、Cursor、Copilot 等 AI 编程工具的优先。
在全栈开发工程师的岗位职责中,也出现了一条不太常见的描述:作为 Vibe Coding 重度用户,持续探索模型能力在产品中的创新应用。
从岗位要求来看,DeepSeek 的 Agent 布局已经从研究落地到具体能力建设阶段:
Agent 深度学习算法研究员
核心任务包括探索提升模型能力的新方法与新范式,参与强化学习在大模型对齐与能力提升中的应用研究,覆盖 RLHF/RLAIF、过程奖励、偏好学习等方向。
Agent 数据评测专家
聚焦于构建评测数据集,精准区分不同模型的能力边界,针对 Agent 的规划、工具调用、多轮交互、长期记忆等核心能力设计测试用例。
Agent 基础设施工程师
负责搭建 Agent 运行的底层基座,包括集成外部工具到内部强化学习基础设施、搭建 Agent 评测平台、维护内部 Agent 集成框架。
除了三个专属岗位,DeepSeek 还在产品和工程端同步布局 Agent 能力:
模型策略产品经理岗位,单独设立了 Agent 方向。
要求候选人“熟悉 Agent 核心机制(Tool Use、Planning、长期记忆、Multi-Agent 协作等);
持续跟踪行业前沿,熟悉并深度使用过 Claude Code、OpenClaw、Manus 等知名 agent”,需要洞察高价值 Agent 应用场景,包括 OpenClaw 式的生活/工作个人助理、Deep Research、自动化工作流、多模态设备控制等,主导 Agent 评测体系及训练数据方案设计。
全栈开发工程师岗位,也明确将“支撑海量 AI Agent 运行的下一代容器调度与隔离平台”作为核心工作方向。
需要攻克容器生命周期管理、资源精细调度、多硬件平台统一支持等核心难题,构建高性能、高安全性的 Agent 运行时环境。
对比今年 1 月,当时 DeepSeek 开放的核心岗位集中在”深度学习研究员-AGI”这类通用研究方向),此次招聘明显从”基础模型研究”向”Agent 产品化”倾斜。
这些招聘需求,拼凑出 DeepSeek 在 Agent 方向的技术布局。
首先能看出 DeepSeek 在追求数据闭环能力。
算法研究员岗位明确要求”与数据标注团队紧密协作,设计标注方案与质量标准,形成’数据 – 训练 – 评测’的能力提升闭环”。
这意味着 DeepSeek 正在搭建从数据生产到模型迭代的完整流水线,而非依赖第三方数据服务。
然后是Agent 技术栈的全面布局。
基础设施岗位要求熟悉”MCP、Tool Use、Function Calling 等 Agent 交互协议与规范”,评测岗位则要求对”Agent 跨 session 记忆连续性、多工具调度可靠性”等前沿问题有体系化认知。
这些关键词都指向具备复杂任务执行能力的自主 Agent 系统。
此次大规模招聘也印证了此前的行业传闻。
2025 年 9 月曾有消息称,DeepSeek 正在开发具备高级 Agent 功能的 AI 模型,计划在 2025 年第四季度发布,对标 OpenAI 等海外竞争对手,能够在最小用户指引下执行多步任务,并基于历史行动自主学习进化。
DeepSeek 的 R-1 推理模型曾以数百万美元的研发成本,在基准测试中追平或超过 OpenAI 同类产品,颠覆了大模型研发需要巨额投入的行业共识。
能不能像 R-1 改变推理模型行业格局一样,用低成本方案再次颠覆 Agent 赛道,答案可能很快就会揭晓。