# 大模型
-
数据揭露DeepSeek崛起的秘诀
DeepSeek-R1的推出促使全球资本重新评估中国科技公司的价值。 2月11日消息,梁文峰因DeepSeek的成功而财富激增,身价或将超过英伟达CEO黄仁勋,问鼎亚洲新科技首富。…
-
李彦宏:持续投入下一代大模型训练
2月11日,在阿联酋迪拜举办的2025世界政府峰会上,百度创始人李彦宏表示,尽管人工智能技术进步迅速,成本也在不断下降,但持续投入AI基础设施仍至关重要,这才能确保百度在技术创新方…
-
DeepSeek冲击下,英伟达市值周跌5520亿美元
Rain科技2月2日消息,英伟达市值在一周内缩水了5520亿美元(约合4万亿元人民币),这一现象引发市场广泛关注。 据报道,此次市值缩水与国内人工智能初创企业DeepSeek(深度…
-
冯骥盛赞DeepSeek:国运级科技成果
Rain科技1月27日消息,近期DeepSeek大模型引发热议,多位业界大佬纷纷表达赞赏。 游戏科学创始人兼CEO冯骥昨晚发文,高度评价DeepSeek,称其“可能是个国运级别的科…
-
端到端大模型:小米官方详解
Rain科技11月16日消息,小米HAD(Xiaomi Hyper Autonomous Driving)将全面接入端到端大模型,智驾体验将迎来重大升级,预计12月底开启先锋版推送…
-
字节跳动大模型训练遭实习生攻击:真相揭秘
Rain科技10月19日消息,近日,字节跳动实习生攻击大模型训练事件引发广泛关注,迅速登上热搜。事件的真相究竟如何?本文将结合多方信息,进行客观分析。 据“大厂青年”爆料,内部人士…
-
苹果MM1.5:300亿参数多模态AI大模型
Rain科技10月13日消息,近日,苹果公司发布了300亿参数的多模态AI大模型MM1.5。该模型基于前代MM1架构进行改进,延续了数据驱动的训练原则,并对不同训练周期中混合数据类…
-
阿里通义Qwen衍生模型数量超Llama,创造历史
进入大模型盲测全球前十 9月29日消息,基准测试平台Chatbot Arena日前公布最新大模型盲测榜单,10天前发布的阿里通义千问开源模型Qwen2.5再次闯入全球十强,其大语言…
-
支付宝大模型医疗应用,四大切入点
大模型医疗应用还在早期,最大挑战还是在数据的处理上 白小交 发自 凹非寺 AI快讯网 | 大模型医疗应用还在早期,最大挑战还是在数据的处理上,国内至少还需要两到三年来解决; 创业公…
-
腾讯优图&上交大新方法提升大模型性能,达SOTA
方法不依赖数据集和模型元信息 告别传统指令微调,大模型特定任务性能提升有新方法了。 一种新型开源增强知识框架,可以从公开数据中自动提取相关知识,针对性提升任务性能。 与基线和SOT…