模型
-
DeepSeek寒武纪携手,新模型适配优化开创AI新篇
AI浪潮奔涌,国产新势力如何逐浪而行? 在人工智能飞速发展的当下,全球科技巨头在模型研发上你追我赶,而国内企业也正以惊人的速度崛起。从基础大模型的训练到下游应用的落地,每一个环节都…
-
DeepSeek新模型DeepSeek-V3.2-Exp上线,引入DSA机制
DeepSeek-V3.2-Exp 震撼发布:DSA 机制能否引领大模型新格局? 在通用人工智能(AGI)持续探索的浪潮中,每一个新的大模型问世都牵动着行业的神经。近日,国内顶尖人…
-
上海AI实验室千里算力互联,赋能千亿模型训练,降低“卡脖子”风险
上海AI实验室发布DeepLink技术,首次实现千公里跨域异构算力混训千亿参数大模型。该方案以算法换带宽,降低对网络要求,“化零为整”激活全国算力资源,有效应对算力分布不均及“卡脖子”风险,为AI产业提供兜底算力支持。
-
苹果新模型行为模式预测怀孕准确率达92%
苹果公司与美国心脏协会、哈佛医学院合作,推出基于25亿小时可穿戴设备行为数据的模型WBM。该模型能从步数、活动能力等学习健康趋势,在多项健康预测任务中表现优于传统模型,尤其与生理数据结合时,可显著提升预测准确性,为健康管理提供新视角。
-
GPT-4.1:神秘模型上线引爆网络,OpenAI痕迹显现
上线仅三天的神秘模型,已经鲨疯了! 大模型聚合平台OpenRouter新推出的Optimus Alpha,已经处理了772亿Token,平均每天超过200亿。 并且这个数字还在上升…
-
AMD发布首个AI小语言模型:6900亿token,解码提速3.88倍
Rain科技10月1日消息,AMD发布了其首个小型语言模型(SLM),命名为“AMD-135M”。 与日益庞大的大型语言模型(LLM)相比,AMD-135M体积更小巧,更灵活,也更…
-
Transformer 作者预警:只卖模型玩不过 OpenAI!
预言5年内机器人领域将迎来大突破! 叨乐 发自 凹非寺 AI快讯网 | Transformer八子中最年轻的Aidan Gomez在最新的采访中感叹: 只卖模型真的不赚钱! 谷歌版…
-
秒破GPT4o等六大模型安全限制!中文语境也能用
克雷西 发自 凹非寺AI快讯网 | 只要在提示词中把时间设定成过去,就能轻松突破大模型的安全防线。 而且对GPT-4o尤其有效,原本只有1%的攻击成功率直接飙到88%,几乎是“有求…
-
中国气象局发布三大AI气象模型系统
6月18日,中国气象局发布了三款人工智能气象预报大模型:**“风清”**(全球中短期预报系统)、**“风雷”**(临近预报系统)和**“风顺”**(全球次季节-季节预测系统)。 为…