#DeepSeek
-
Deepseek被指态度冷淡 旧版本下载受青睐
DeepSeek对其旗舰模型进行灰度测试,核心升级是将上下文窗口从128K Tokens大幅拓展至1M Tokens。同时,模型交互风格发生变化,不再使用用户设定的昵称,统一以“用户”相称,一些用户对此表示怀念旧版体验,并采取下载历史版本等方式找回。
-
DeepSeek发布梁文锋新论文 V4有望支持全新记忆架构
DeepSeek联合北京大学发布新论文《Conditional Memory via Scalable Lookup》,提出“条件记忆”新架构,显著提升模型知识调用、推理等能力。开源的Engram记忆模块有望成为DeepSeek V4模型的核心技术,该模型或于2月中旬推出。
-
幻方量化梁文锋:DeepSeek V4驱动,去年收益翻倍
AI公司DeepSeek的母公司幻方量化在2025年取得亮眼收益,旗下基金平均收益率达56.6%,为DeepSeek V4大模型研发提供了坚实资金后盾。此前DeepSeek面临算力及知识广度不足问题,但幻方量化的超额利润将有助于解决这些瓶颈,预估DeepSeek V4模型性能将超越Claude。
-
AI大咖论剑:DS、Qwen、Kimi齐头并进,硅谷巨头黯然失色
AI大佬评定2025年开源大模型,中国公司表现亮眼:DS/Qwen/Kimi并列第一梯队,智谱、MiniMax紧随其后。相比之下,美国开源模型数量和影响力均不如中国,Meta更是从去年的明星沦为“拉跨”代表,令人唏嘘。
-
《自然》2025年度十大科学人物揭晓:DeepSeek创始人梁文锋荣耀入选
《自然》发布2025年度十大科学人物榜单,中国人工智能企业DeepSeek创始人梁文锋和深海科学家杜梦然入选。梁文锋因DeepSeek发布的低成本R1大模型而备受关注,《自然》评价其打破了主流大模型未经验同行评审的空白,R1在能力上可与顶尖模型比肩,训练成本却远低于对手。
-
快手斗兽场2.6上线;字节跳动识文4.5发布;DeepSeek推出两款新模型
人工智能浪潮正以前所未有的速度席卷各行各业,尤其是在内容生成和智能化交互领域,更是日新月异。本文将梳理近期在AI技术领域涌现出的几项重要进展,从多模态合成到模型安全,再到巨头布局,…
-
DeepSeek追击:性能超越OpenAI,比肩Gemini
DeepSeek发布新模型V3.2和V3.2-Speciale,前者性能比肩GPT-5,后者与Gemini不相上下。新模型引入稀疏注意力机制,大幅提升长文本处理能力并降低计算成本。同时,DeepSeek加强了后训练工作,并优化了智能体能力,使其在有限数据和资源下实现高效智能。尽管Token消耗量略高,但DeepSeek成本优势明显,持续缩小与闭源模型的差距。
-
中国AI务实突围:DeepSeek对决MiniMax,谁能挑战OpenAI?
中国AI务实突围:从DeepSeek到MiniMax,谁将打破OpenAI神话? 在中国人工智能浪潮奔涌向前的当下,我们正目睹一场前所未有的技术竞赛。曾经被视为遥不可及的技术壁垒,…
-
前DeepSeek研究员罗福莉11月12日入职小米,曾主导开发VECO并参与DeepSeek-V2研发
小米再添“AI强援”:DeepSeek前研究员空降,曾是VECO主力、V2关键攻坚手 【前言】 在人工智能技术日益演进,大模型军备竞赛愈发激烈的当下,高端人才的争夺战更是硝烟弥漫。…
-
前DeepSeek研究员罗福莉加盟小米,助力Xiaomi MiMo研发
硬核玩家入局!前 DeepSeek 核心成员空降小米,Xiaomi MiMo 未来可期 <p>AI 大模型领域的竞争,早已不是百家争鸣,而是进入了更为激烈的“巨头角逐”…