# 大模型
-
丰知物流决策大模型发布:巨头争夺落地先机
在顺丰速运总裁王卫公开表示“顺丰已经开始钻研ChatGPT”一年多后,顺丰在大模型领域再次传出新消息。 8月19日,《每日经济新闻》记者从顺丰方面获悉,顺丰科技于8月18日推出其自…
-
全球最强数学大模型发布,人人可玩Demo,阿里多模态模型加持,中文适用
衡宇 发自 凹非寺 AI快讯网 | 现在,最强数学大模型,人人都可上手玩了! 一觉醒来,阿里千问大模型团队发布了Qwen2-Math的Demo,抱抱脸在线可玩。 惊喜的是,如果嫌输…
-
摩尔线程发布夸娥智算集群KUAE 1.2,连续无故障训练15天!
Rain科技8月19日消息,摩尔线程正式发布了夸娥智算集群KUAE 1.2版本。该版本在软硬件层面进行了全面的优化,实现了功能和性能的多维升级,并提升了稳定性和生态友好性,为大模型…
-
4秒看完2小时电影!阿里发布通用多模态大模型mPLUG-Owl3
还提出了一个有趣的长视觉序列测评方法 4秒看完2小时电影,阿里团队新成果正式亮相—— 推出通用多模态大模型mPLUG-Owl3,专门用来理解多图、长视频。 具体来说,以LLaVA-…
-
智谱 AI 开放平台上线 GLM-4-Long,支持 1M 上下文
年初,当大模型行业掀起“长文本”竞赛热潮时,我们就萌生过打造一个“读书助理”的想法。对市面上主流大模型进行测试后,我们发现普遍存在两个不足: 一种是可处理的文本长度不够,即使有些大…
-
大模型拥有语言理解能力:MIT论文揭秘其“思维过程”
无需解释,只靠代码和输入输出就能学会编程 克雷西 发自 凹非寺AI快讯网 | 大模型对现实世界,可以形成自己的理解! MIT的一项研究发现,随着模型能力越强,它对现实的理解可能不仅…
-
大模型能发现自相矛盾的Prompt吗?上海交通大学最新研究解密
大模型检测“指令冲突”能力新基准 上海交通大学王德泉课题组 投稿 AI快讯网 | 上海交通大学王德泉教授课题组在最新研究中提出了这样的一个问题。 设想这样一个场景:一个幼儿园的小朋…
-
大模型指令调优数据集万字评测!腾讯上交大联合出品
腾讯优图实验室 投稿AI快讯网 | 随着大模型的快速发展,指令调优在提升模型性能和泛化能力方面发挥着至关重要的作用。 然而,对于指令调优数据集的数据评估和选择方法尚未形成统一的体系…
-
清华唐杰团队新作:大模型开卷长输出,一口气生成2万字
明敏 发自 凹非寺 AI快讯网 | 一口气生成2万字,大模型输出也卷起来了! 清华&智谱AI最新研究,成功让GLM-4、Llama-3.1输出长度都暴增。 相同问题下,输出…
-
上海人工智能实验室乔宇:大模型将带来交互式、创作式阅读体验
2024上海书展暨“书香中国”上海周于8月14日盛大开幕,书香之夏如约而至。在当日举行的“书香上海·东方阅读盛典”上,上海人工智能实验室主任助理、教授乔宇发表了精彩演讲。他认为,大…