随着人工智能技术的飞速发展,尤其是通用大模型在性能上的显著提升以及推理算力成本的持续下降,垂直领域的大模型迎来了前所未有的发展机遇。在这股浪潮中,代码大模型因其巨大的商业潜力和对软件开发领域的变革性影响,备受市场瞩目,并引来了来自各方的资本竞逐。
全球IT支出持续攀升,软件开发成本占据重要比例。根据Gartner发布的《2024年全球IT支出预测》报告,全球软件开发人力成本正以年均7-9%的速度增长,预计2024年全球软件相关支出将达到1.2万亿美元,其中人力成本占比高达50%,即6000亿美元。值得关注的是,中国互联网企业在软件开发方面的人力成本压力更为突出,部分公司的薪酬及相关支出年增幅已接近15%。这无疑为代码大模型提供了广阔的市场空间。
与此同时,全球软件工程师的缺口也在持续扩大,形成供需矛盾。据统计,未来十年内,这一缺口可能达到数千万之巨,成为制约各行各业数字化转型的重要瓶颈。代码大模型凭借其提升软件开发效率、降低人力成本的潜力,成为了少数具备明确商业化路径和用户付费意愿的垂直行业大模型之一。
海外市场对AI编程产品的认可度不断提高。以Cursor为例,这款AI编程产品仅用21个月便实现了1亿美元的年度经常性收入(ARR),成为历史上增长最快的SaaS产品之一,估值更是高达100亿美元。Gartner预测,到2026年,AI将自动化全球30%的编码任务,预示着代码大模型市场将是一个潜力巨大的千亿美元级市场。
国内通用大模型厂商也纷纷入局,抢占代码大模型市场先机。阿里巴巴的通义灵码、腾讯的腾讯云AI代码助手、华为的Code Arts、字节跳动的豆包Mars Code以及百度的文心快码等产品相继问世,展现出激烈的市场竞争态势。此外,京东、讯飞、昆仑万维、DeepSeek、智谱等多家通用大模型厂商也在积极布局这一领域,力求在代码大模型赛道上占据一席之地。
在众多参与者中,aiXcoder凭借其在软件工程领域的长期积累和优异的模型性能脱颖而出。依托北京大学软件工程研究所60余年的科研沉淀,aiXcoder团队从多篇全球顶级会议论文的理论奠基,到全球首个十亿级和百亿级参数的国产代码大模型aiXcoder的发布,再到国内众多大型企业的实践落地,实现了从实验室理论到实际产业价值的闭环验证。这种深厚的学术背景和产业经验,赋予了aiXcoder独特的竞争优势。
aiXcoder-7B模型是aiXcoder的最新成果。该模型在多个评测集的测试结果中超越了同级别参数规模的诸多开源模型,例如Qwen2.5-Coder-7B、DeepSeekCoder-7B、CodeLlama-7B等,在代码生成与补全效果上均达到了目前的最优水平(SOTA)。
今年年初,aiXcoder(北京硅心科技有限公司)完成了A++轮融资,由中关村发展集团旗下的中关村资本和中关村协同创新基金共同投资。截至目前,该公司已累计获得4轮融资,吸引了伽利略资本、高瓴创投、彬复资本、清流资本、三七互娱等多家知名风险投资机构的青睐,充分体现了资本市场对aiXcoder发展前景的认可。
近日,aiXcoder的商业合伙人兼总裁刘德欣在接受采访时,分享了对代码大模型行业的技术瓶颈和未来发展趋势的看法。他指出,尽管通用大模型功能强大,但由于其构建和训练方式主要基于自然语言而非编程语言,因此在处理代码时存在一定的局限性。代码相比自然语言具有更强的上下文依赖性和结构性,这要求模型能够精准地理解程序语言的结构和语义。
针对这些挑战,aiXcoder-7B采用了结构化Span的形式构建模型,并创新性地提出了“结构化填充中间目标(SFIM)”的训练方法。通过解析代码语法树节点,选取完整的代码逻辑单元作为训练跨度,有效地避免了随机选段可能导致的信息不完整,从而显著提升了模型训练效果。实验结果表明,SFIM方法能够显著提升生成代码的简洁性和结构合理性。
除了模型性能之外,企业在私域大模型落地过程中还需要关注多个关键要素。刘德欣总结了企业领域大模型落地的四大原则:掌握模型自治权、实现模型层的高解耦、建立可复用的数据框架以及始终关注业务需求。这些原则不仅为企业提供了落地大模型的指导思路,也为aiXcoder等服务商提供了与客户合作的基础框架。
面对大型科技公司在代码大模型领域的激烈竞争,aiXcoder凭借其在垂直领域的深耕细作、与客户之间的紧密合作关系以及与大型科技公司之间的积极合作策略,保持了强劲的市场竞争力。刘德欣表示,aiXcoder将继续专注于软件工程和智能化这两个垂直领域,并致力于实现更深层次的技术融合,从而保持技术层面的领先地位。
值得一提的是,aiXcoder还创新推出了内置MCP(Model Control Panel)功能的软件开发Agent,目前正在进行内部测试。该Agent不仅支持企业私有化部署,并能够针对企业已有的开源大模型进行定制化的适配,还具备强大的环境适配能力,支持企业在不影响现有代码架构的前提下快速接入企业私有化工具链。此外,aiXcoder计划在插件端免费开放Agent功能,以降低使用门槛,从而有力推动AI Coding行业的整体发展。