AI编程的十字路口:Copilot模式为何成为创业陷阱?

当整个人工智能行业都在为「如何给程序员打造更快的马」而疯狂投入时,一支特立独行的团队选择「直接去造汽车」。

大模型的发展,更像篮球比赛刚打完第一节

自 2022 年底 ChatGPT 引爆全球以来,AI 编程被普遍认为是大语言模型中最有可能实现严肃商业化的领域。GitHub Copilot 的成功,以及众多科技大厂和创业公司的涌入,使得行业似乎已经形成共识:AI 主要作用是作为程序员的“副驾驶”,其核心价值在于提高代码编写效率。

然而,蔻町智能(AIGCode)创始人兼 CEO 宿文提出了不同的观点:「大模型的发展,更像一场篮球比赛才刚刚打完第一节。所有人都在用第一节的比分去判断整场比赛的胜负,但我们认为,还有第二、三、四节要打。」

非共识一:基座模型仍处「婴幼儿期」,网络结构创新是破局关键

在许多人看来,大模型的竞争似乎已经尘埃落定,后来者尤其是创业公司只能在应用层寻找机会。但宿文持不同意见:「我们相信大模型技术,或者说基座模型的发展,仍处于婴幼儿期。」

他指出,现有的以 Transformer 为基础的模型架构在学习机制和知识压缩效率上存在根本性问题。尽管 MoE(Mixture of Experts)通过专家分工提高了计算效率,但专家之间的关系是“扁平”的,缺乏协作,整体上仍然是一个依赖简单路由机制的“黑盒”。

蔻町智能从成立之初就选择了自主研发基座模型。他们通过不断迭代模型网络结构,最终采用了在推荐搜索领域已经非常成熟的 PLE(Progressive Layered Extraction)架构。

AI编程的十字路口:Copilot模式为何成为创业陷阱?

多任务学习(Multi-task Learning)网络结构的演进,从简单的底层共享(Shared-Bottom),发展到通过门控专家网络(MMoE、CGC)与渐进式分层提取(PLE),以实现更精细地分离与融合任务的共性与个性信息。图片来源:Gabriel Moreira@ Medium

从 MoE 到 MMoE 再到 PLE,这一系列演进逐步解决了专家模块的解耦问题,并进一步减少了信息损耗,实现了对任务共性和个性的精细化提取。

这种网络结构的创新使得他们的模型在知识压缩和长逻辑链条的理解上,具备了超越主流模型的潜力。

AI编程的十字路口:Copilot模式为何成为创业陷阱?

蔻町智能研发的新模型 AIGCoder 架构图,通过解耦的专家模块(De-coupled Experts)改良了传统模型,利用多头专家感知注意力(MHEA)负责动态激活专家,定制化门控(CGC)负责精细整合信息,从而在不增加计算开销的情况下,通过架构创新应对大模型扩展时遇到的瓶颈。

AI编程的十字路口:Copilot模式为何成为创业陷阱?

实验数据显示,无论是单一关键模块(左图)还是整合后的完整架构(右图),AIGCoder(橙色曲线)的训练效率均相较基线模型(蓝色曲线)提升了 1.3 倍以上。

非共识二:避开大厂赛道是个伪命题

在 AI 领域,创业者常被告知不要涉足大厂的发展道路,以免被轻松碾压。但宿文认为这是一个伪命题:「如果真是一件大事,为什么大厂不去做?更准确的说法应该是‘避免去摘低垂的果实’。」

在宿文看来,真正的竞争优势不是选择大厂看不上的“缝隙市场”,而是在同一领域内,解决比大厂更复杂、更深入的问题。他说:「现在很多 Coding 产品采用工程化方式集成各种 API,生成一个前端体验不错的 Demo,这只是低垂的果实。相反,蔻町智能通过底层技术创新,实现真正的‘All-in-one’解决方案。」

他进一步解释说,当前行业习惯将技术栈划分为 Infra、基座、OS、Agent 等层次,但这只是对前一代技术架构的简单映射,对于新兴技术来说,这种划分并不一定有意义。他认为,各技术环节在新范式下是深度耦合的:「为了更好地解决问题,我们要将其一体化处理。」

蔻町智能将 AI 编程划分为 L1 到 L5 五个阶段:

  • L1:类似于低代码平台,目前并不是主流。
  • L2:辅助力程序员的 Copilot 产品,根据提示生成代码,如 GitHub Copilot 和 Cursor。
  • L3:Autopilot 产品,能够端到端地完成编程任务,无需程序员介入。
  • L4:多端自动协作,让多个用户能直接把软件创意变为完整的产品。
  • L5:能够自动迭代,升级为成熟的软件产品。

宿文表示,目前大多数 AI Coding 产品集中在 L2 阶段,而 AutoCoder 从一开始就定位在 L3。他强调,将编程助手做到极致并不会自然演进到端到端软件生成,这是因为两者需要解决的技术问题和优化方向几乎没有重叠:L2 优化的重点在于上下文理解和精准补全,提升写代码的效率;而 L3 关注的是复杂业务逻辑的理解、拆解与长逻辑链条的生成,实现“不写代码”的目标。

此外,L2 需要与 IDE(集成开发环境)深度融合,这对大厂来说具有天然的优势,但对于创业公司而言,则是一条高风险且效率低下的路径。

非共识三:个性化应用市场即将爆发,新增需求远超存量替代

选择 L3 不仅是技术决策,更是对市场未来的深刻洞察。虽然行业的普遍观点是 AI 编程的最终目标在于赋能每个人,但在实现路径上,主流看法认为当前最现实的做法是先辅助程序员,解决存量市场的效率问题。然而,宿文认为这恰恰是一种「战略绕行」,因为 L2 无法自然演进到 L3,沿此路径不仅难以达到目标,更可能错失巨大的增量市场——那些被现有开发模式压制的海量个性化需求。

他说:「新增的需求远远大于存量的替代。程序员不会消失,但一个全新且数倍于现有规模的市场将爆发。」

宿文以网约车市场和外卖市场为例进行类比:「在滴滴出现之前,人们的出行需求被高昂的成本和复杂的流程所压抑;美团的出现则激发了外卖市场的巨大潜力。同样,在软件开发领域,大量中小企业、创业者乃至大企业的业务部门都存在被压抑的需求。」

他举例说,一个业务部门希望能为内部开发一套培训系统,但在传统模式下,从漫长的需求沟通、高昂的开发投入,到最终交付物偏离预期的风险,整个过程可能需要几个月,且试错成本极高。

因此,蔻町智能希望重塑这一流程,实现上午定义需求,下午即可上线部署的目标。最新发布的端到端软件生成产品 AutoCoder 定位为「全球首款前后端一体化的应用与软件完整生成平台」,能够同时生成高度可用的前端、数据库和后端。例如,用户只需输入「帮我生成一个科技公司官网」,平台不仅能生成用户可直接使用的前台页面,还能同步生成供企业内部员工管理网站内容和用户数据的后台系统。

AutoCoder 的受众不仅包括产品经理、设计师等专业用户(Prosumer),还包括大量非技术背景的个人从业者、小型企业主(如咖啡店、健身房经营者)以及初创团队的非技术创始人等。这些群体有明确的数字化需求,但受到传统开发高门槛的限制。

宿文引用的数据表明,一家拥有类似理念的公司在短期内获得了相当于发展近 20 年的 GitHub 十分之一的月访问量,而 GitHub 的数据本身并没有下滑。这暗示了新市场的潜力正在被逐渐激发。

当然,实现端到端软件生成也会面临诸多质疑,特别是关于软件缺陷的处理问题。宿文的回答是:「与其花费数小时去寻找一个 Bug,为什么不花几分钟重新生成一个正确的版本呢?」随着软件生成的边际成本趋近于零,迭代和试错的自由度将被空前释放。

结语

自研基座模型,选择更难的端到端路径,瞄准被压抑的增量需求——这三个非共识但逻辑自洽的判断,构成了蔻町智能的核心战略和发展路径。

尽管这条路充满了不确定性和质疑,但正如汽车在诞生之初远不如马车跑得快,而且经常出故障一样,蔻町智能的「汽车」是否能在性能、稳定性和可靠性上迅速迭代并超越成熟的「马车体系」,仍然需要时间和市场的验证。

但不可否认的是,这场关于 AI 编程的篮球赛才刚刚开始。作为挑战者,蔻町智能已经选择了自己的独特方式,去打一场完全不同的比赛。从用户的角度来看,一个软件创造权力被彻底平权的未来值得期待。

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,可联系本站进行审核删除。
(0)
上一篇 2025年 7月 3日 下午5:44
下一篇 2025年 7月 3日 下午6:37

相关推荐

欢迎来到AI快讯网,开启AI资讯新时代!