#DeepSeek
-
DeepSeek大模型V4即将发布,为AI应用带来新机遇!
在人工智能浪潮席卷全球的当下,多模态大模型的研发与落地正成为行业竞争的新焦点。就在下周,大模型领域的一股重要力量——DeepSeek——将迎来其最新力作V4版本的正式发布。这次更新…
-
英伟达芯片违反出口管制?DeepSeek被指使用H200训练,中国回应
美国议员指控DeepSeek AI模型使用违禁英伟达芯片训练,外交部回应反对科技封锁。专家认为此举是科技霸权,妄图遏制中国AI发展。此前,英伟达H200芯片在中国市场遇冷,或加剧美方焦虑。
-
Deepseek被指态度冷淡 旧版本下载受青睐
DeepSeek对其旗舰模型进行灰度测试,核心升级是将上下文窗口从128K Tokens大幅拓展至1M Tokens。同时,模型交互风格发生变化,不再使用用户设定的昵称,统一以“用户”相称,一些用户对此表示怀念旧版体验,并采取下载历史版本等方式找回。
-
DeepSeek发布梁文锋新论文 V4有望支持全新记忆架构
DeepSeek联合北京大学发布新论文《Conditional Memory via Scalable Lookup》,提出“条件记忆”新架构,显著提升模型知识调用、推理等能力。开源的Engram记忆模块有望成为DeepSeek V4模型的核心技术,该模型或于2月中旬推出。
-
幻方量化梁文锋:DeepSeek V4驱动,去年收益翻倍
AI公司DeepSeek的母公司幻方量化在2025年取得亮眼收益,旗下基金平均收益率达56.6%,为DeepSeek V4大模型研发提供了坚实资金后盾。此前DeepSeek面临算力及知识广度不足问题,但幻方量化的超额利润将有助于解决这些瓶颈,预估DeepSeek V4模型性能将超越Claude。
-
AI大咖论剑:DS、Qwen、Kimi齐头并进,硅谷巨头黯然失色
AI大佬评定2025年开源大模型,中国公司表现亮眼:DS/Qwen/Kimi并列第一梯队,智谱、MiniMax紧随其后。相比之下,美国开源模型数量和影响力均不如中国,Meta更是从去年的明星沦为“拉跨”代表,令人唏嘘。
-
《自然》2025年度十大科学人物揭晓:DeepSeek创始人梁文锋荣耀入选
《自然》发布2025年度十大科学人物榜单,中国人工智能企业DeepSeek创始人梁文锋和深海科学家杜梦然入选。梁文锋因DeepSeek发布的低成本R1大模型而备受关注,《自然》评价其打破了主流大模型未经验同行评审的空白,R1在能力上可与顶尖模型比肩,训练成本却远低于对手。
-
快手斗兽场2.6上线;字节跳动识文4.5发布;DeepSeek推出两款新模型
人工智能浪潮正以前所未有的速度席卷各行各业,尤其是在内容生成和智能化交互领域,更是日新月异。本文将梳理近期在AI技术领域涌现出的几项重要进展,从多模态合成到模型安全,再到巨头布局,…
-
DeepSeek追击:性能超越OpenAI,比肩Gemini
DeepSeek发布新模型V3.2和V3.2-Speciale,前者性能比肩GPT-5,后者与Gemini不相上下。新模型引入稀疏注意力机制,大幅提升长文本处理能力并降低计算成本。同时,DeepSeek加强了后训练工作,并优化了智能体能力,使其在有限数据和资源下实现高效智能。尽管Token消耗量略高,但DeepSeek成本优势明显,持续缩小与闭源模型的差距。
-
中国AI务实突围:DeepSeek对决MiniMax,谁能挑战OpenAI?
中国AI务实突围:从DeepSeek到MiniMax,谁将打破OpenAI神话? 在中国人工智能浪潮奔涌向前的当下,我们正目睹一场前所未有的技术竞赛。曾经被视为遥不可及的技术壁垒,…