人工智能
-
Meta因挖人成瘾再遭员工批评:不积极宣传项目,开源生态或将进一步恶化
Meta 内部管理问题频出,朱泽园发推文表示在 Meta 花近一年才获准转推自己的项目,且转推效果不佳。他提到开源项目 Physics of Language Models 受关注不高,引发业内对开源价值的讨论。
-
DeepSeek梁文锋NSA论文及北大杨耀东团队荣获ACL 2025最佳论文奖
ACL 2025 大会共收到 8000 多篇投稿,评选出 4 篇最佳论文、2 篇最佳社会影响力论文、3 篇最佳资源论文、3 篇最佳主题论文、26 篇杰出论文等。华人团队如北大杨耀东团队和 DeepSeek(梁文锋参与撰写)等在多个奖项中获奖,展现出在自然语言处理领域的突出贡献。
-
OpenAI推出学习模式,AI教师时代来临
ChatGPT推出学习模式,通过交互式提示、支架式回复、个性化支持等功能,引导用户主动学习,帮助解决具体问题。该模式适用于免费用户,已获广泛好评。
-
解奥赛题成本5000美元?陶哲轩警告:AI下一步将实现规模化且更便宜
人工智能与数学密不可分,谷歌的 Gemini 模型在 IMO 竞赛中取得了金牌水平,但陶哲轩教授对此表示谨慎,认为需在受控环境下进行科学评估,避免简单化比较。未来 AI 的关键在于“降本增效”,标准化的评估机制将变得越来越重要。
-
首个工业信号多模态基础模型FISHER发布,清华与上交等团队开源权重
近期,清华大学等机构联合发布首个面向多模态工业信号的基座模型 FISHER,采用搭积木方法对异质工业信号进行统一建模。FISHER 通过子带建模和自蒸馏预训练,显著提升在 RMIS 基准上的泛化能力,开源模型包括 tiny、mini 和 small 三种尺寸。
-
DeepMind夺IMO金牌,科学家转投Meta,全是华人大牛
Meta 挖走多位 Google DeepMind IMO 金牌成员,包括 Tianhe Yu、Cosmo Du 和 Weiyue Wang,以重振 Llama 系列。此举引发 AI 领域人才大洗牌,Meta 和微软正积极从竞争对手挖角。
-
OpenAI计划建设5GW数据中心,马斯克公布5年AI基建计划
《华尔街日报》报道,OpenAI 和软银在“星际之门”项目上出现分歧,计划大幅缩减。尽管先前承诺投资 1000 亿美元,但目前仅计划在今年年底前建造一个小型数据中心。然而,OpenAI 宣布与甲骨文合作,将在美国开发 4.5 GW 的数据中心容量,加上德克萨斯州阿比林的 Stargate I 数据中心,总容量将超过 5 GW。
-
OpenAI的通用智能体ChatGPT Agent正式亮相
OpenAI 推出全新 ChatGPT Agent,具备主动选择工具和执行任务的能力,已向 Pro、Plus 和 Team 用户开放。这一重大升级使 ChatGPT 超越单纯回答问题,成为能处理复杂任务的智能体。用户可在 ChatGPT 下拉菜单中选择「Agent 模式」,执行如行程规划、信息检索等任务。
-
DeepMind让AI成为「导演」,创造一场全由AI主演的「西部世界」
Concordia 是一个基于实体-组件架构的软件库,由 Google DeepMind 和多伦多大学提出,用于构建多角色生成式 AI 系统。它将游戏主持人(GM)和玩家(角色)都设计为可配置的 AI 实体,通过组件实现不同功能,支持科学模拟、互动叙事和 AI 评估等应用场景。此架构允许设计师自由组合组件,快速构建和测试复杂场景,实现灵活高效的游戏设计。
-
重塑记忆架构:LLM正在安装新“操作系统”
现代大型语言模型(LLM)的上下文窗口有限,通常只能处理数千到数万 token,尽管近期有些模型已拓展至百万级 token。然而,即使拥有长上下文窗口,LLM 也常出现「失忆」现象,需要记忆管理机制。近期研究表明,通过固定和非固定记忆池、记忆操作系统等方法,可以增强 LLM 的记忆能力,使其在多轮对话中保持一致性。