算苗3D TokenPU成功流片，推动国产云端AI大算力芯片新突破

中国AI算力赛道迎来一位重磅玩家。专注3D架构大算力芯片的算苗科技宣布，其面向大模型推理的3D TokenPU芯片A4E已于6月15日正式流片。这不仅是国内首款采用3D混合堆叠架构的大模型专用处理器，更关键的是，它完全依托国产供应链，实现了从设计到制造的全链路自主可控。

大模型时代原生设计专注推理能效比

当前，AI产业正加速由训练向推理迁移。德勤预测，未来超80%的算力需求将集中在推理侧。然而，大模型推理长期受制于“内存墙、算力墙、通信墙”三大核心瓶颈，尤其是数据在存储器与处理器之间的频繁搬运，造成高达80%的能耗和70%的成本压力。

作为大模型时代原生的算力芯片企业，算苗科技首创3D TokenPU架构，跳出通用GPU的设计思路，专攻推理场景极致性能。第一代产品A4E将8层存储晶圆垂直堆叠在计算逻辑晶圆上，通过硅通孔（TSV）与凸点（bump）技术实现微米级互联，将传统芯片间的“毫米级”传输距离压缩两个数量级，带来16TB/s的超大访存带宽，有效缓解数据饥饿问题。

在架构设计方面，算苗科技引入Tile-Native软硬件协同理念，将Tile作为数据搬运、存储和计算的基本单元，实现“一次搬运、多次复用”的高效模式。硬件原生支持Tile级数据调度与多精度动态切换，软件端则构建适配LLVM、Triton等开源生态的编译工具栈，兼顾开发者友好性与算子优化效率。这种“硬件架构-软件工具-算法特性”的闭环优化，为大模型推理提供了更高性能和更低TCO（总拥有成本）。

“我们不是在别人的赛道上追赶，而是在开辟新的方向。”算苗科技创始人兼CEO汪福全博士表示，“3D TokenPU专为大模型Token处理而生，不必单纯依赖制程缩小，就能实现算力密度、能效比的跨越式提升。”

从设计到制造自主可控面向量产

算苗科技已构建起覆盖芯片设计、核心IP、制造、封装的国产化供应链体系。A4E芯片基于自研RISC-V架构与自研IP、自研软件体系打造，与国内头部供应链伙伴深度合作，采用成熟国产工艺也可实现卓越推理性能。在工程化量产层面，算苗团队核心成员已在高通量存算一体芯片项目中，完成万片级3D混合堆叠晶圆的量产，是全球少数掌握该技术的团队之一。同时，公司构建了高精尖人才梯队，研发人员占比超80%，核心骨干来自中科院、清华、北大等顶尖院校，兼具深厚的半导体工程化落地与AI前沿算法研究能力。

携手客户深耕千亿级推理市场

当前全球大模型推理市场已迈入千亿美金规模，中国市场也达到数千亿人民币规模。算苗3D TokenPU的核心客户为头部大模型厂商，目前已联手客户开展近一年的深度研发工作；从芯片定义阶段便锚定真实推理场景需求，针对性完成架构与底层算法深度调优，实现AI算力和大模型算法的极致匹配。

算苗3D TokenPU大算力芯片的技术路线与产业化潜力，也获得了资本市场的高度认可。公司已先后完成多轮融资，投资方覆盖国资平台、头部市场化基金与一线产业资本，包括国开金融、北京顺禧、源码资本、石溪资本、联想创投、襄禾资本等。

客观来看，3D堆叠技术并非新鲜事物，但将其与RISC-V生态结合并瞄准大模型推理场景，算苗科技走得相当激进。相比英伟达H100/B200等方案，A4E在制程节点上不占优势，却通过垂直互联和专用架构试图在能效比上弯道超车。如果其量产良率和实际性能达到宣传水平，那么国产推理芯片或许真的等来了一个结构性的破局点。

关于算苗科技（SUNMMIO）

算苗科技SUNMMIO是大模型时代原生的芯片企业，为3D TokenPU概念首创者，专注3D架构AI云端大算力芯片的研发，团队核心成员拥有全球领先的3D混合堆叠晶圆量产能力。公司依托国产供应链与成熟制程，以3D堆叠+Tile-Native软硬件协同创新，突破AI算力墙、内存墙、通信墙三大瓶颈，打造高带宽、高性能、高性价比解决方案，助力国产算力产业跃迁与全球化发展。欲了解更多信息，请访问：www.sunmmio.com。

免责声明：本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿，凡在本网站出现的信息，均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性，但不保证有关资料的准确性及可靠性，读者在使用前请进一步核实，并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏，概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时，可联系本站进行审核删除。

一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

算苗3D TokenPU成功流片，推动国产云端AI大算力芯片新突破

相关推荐

发表回复