
AI快讯网编辑-青青
-
中科大、智源发布推理检索框架BGE-Reasoner,突破RAG思考瓶颈
BGE-Reasoner 是由中国多个机构联合研发的推理密集型信息检索解决方案,通过查询理解、向量检索与重排序三个模块,显著提升了搜索引擎在复杂推理任务中的表现。在 BRIGHT 基准测试中,BGE-Reasoner 以 45.2 分刷新了最佳纪录,展示了其在查询改写、数据合成和强化学习方面的创新与突破。
-
谷歌nano banana正式上线:单图成本低于3毛,比OpenAI便宜95%
谷歌推出 gemini-2.5-flash-image-preview 模型,支持 32k 上下文,提供温度调整等高级设置,可在 Google AI Studio 和 Gemini API 中免费试用。该模型生成每张图像的成本约为 0.039 美元,远低于 OpenAI 的图像生成成本,并支持换装、合成照片和混合设计等多种玩法。
-
FlashAttention-4震撼发布,原生适配Blackwell GPU,英伟达护城河再加深
在 Hot Chips 2025 上,TogetherAI 首席科学家 Tri Dao 发布了 FlashAttention-4。该版本在 Backwell GPU 上比英伟达 cuDNN 库快 22%,采用两项算法改进:在线 softmax 算法和指数的软件模拟。此外,FlashAttention-4 使用 CUTLASS CuTe Python DSL,移植到 ROCm HIP 更具挑战性。Tri Dao 的多数核代码开源给英伟达开发者,助力英伟达 GPU 生态系统。 FLASHAttention 的 GitHub 软件库已获得了 1.91 万星,但 FlashAttention-4 的技术报告尚未发布。
-
英伟达推出通用机器人芯片:AI算力提升7.5倍,宇树和银河通用已搭载
英伟达发布了新一代机器人专用芯片 Jetson Thor,大幅提升算力,支持人形机器人等各种形态。其 AI 计算能力是上一代的 7.5 倍,最高达到 2070 FP4 TFLOPS,功耗 130W,能效是上一代的 3.5 倍。内存容量提升至 128G,显存带宽为 273GB/s。Jetson Thor 专为生成式 AI 模型的推理打造,支持下一代「物理 AI」智能体,能够端侧实时运行,降低对云端的依赖。
-
大厂AI「氛围编程」:老工程师现身说法引热议
氛围编程(vibe coding)在 FAANG 等大型科技公司逐渐流行,但对其是否真正符合氛围编程的定义仍存在争议。一位拥有十多年经验的 AI 软件工程师在 Reddit 分享了其使用 AI 辅助编程的方法,强调从设计文档和技术评审开始,采用测试驱动开发和详细规范,AI 主要用于编写测试和代码审核。尽管有 AI 加持,大型公司流程繁琐仍影响研发速度。
-
全球百万网友沉迷赛博养鱼,AI小丑鱼让我也着迷了
最近流行的AI小游戏Draw A Fish,用户只需画一条小鱼,便能在虚拟鱼缸中看到它游动。游戏通过AI实时反馈和互动,带来强烈的创作成就感,类似《王者荣耀》的上分体验,吸引全球百万网友参与。低门槛设计和社区氛围使其广受欢迎。
-
全球首款AI原生游戏引擎再进化:GTA6不来,我们自己AI一个
GTA 6 跳票至明年,但 AI 驱动的游戏引擎发展迅速。Mirage 2 作为生成式世界引擎,实现了更灵敏的提示控制、更低的游戏延迟和通用领域建模。尽管仍存在动作控制精度和视觉一致性问题,但进步显著,未来值得期待。
-
微软AI CEO警告:警惕看似有意识的AI
AI 是否有意识仍无定论,但其复杂性令人难以理解。微软 AI CEO Mustafa Suleyman 提出「看似有意识的 AI」(SCAI)概念,强调其可能带来的社会、道德和法律影响,呼吁构建人文主义 AI,避免将 AI 视为有意识实体。
-
DiT在数学和形式上错了吗?谢赛宁回应:科学不在脑子里做
近期,一篇帖子在 X 上引发热议,博主认为 DiT 模型存在架构缺陷,FID 过早稳定,暗示模型无法继续学习。博主引用了 TREAD 方法,通过令牌路由提升训练效率和生成质量,显著超越 DiT。谢赛宁回应称,DiT 的问题主要在于 sd-vae,其他方面仍稳健,且有改进空间。
-
当AI超越人类智慧:李飞飞与Hinton的对立生存指南
人类对AI安全的担忧由来已久,从阿西莫夫的“机器人学三定律”到近期OpenAI和Anthropic模型的“威胁”行为。李飞飞认为AI的安全性取决于设计、治理和价值观,而Hinton则担忧超级智能可能在未来5到20年内出现并失控。两人在AI安全问题上的观点截然不同,但都强调了人类在其中的关键角色。