# 大模型
-
10行代码,大模型数学能力提升20%
平衡生成文本的连贯性和多样性 只要不到10行代码,就能让大模型数学能力(GSM8k)提升20%! 几名独立学者提出了大模型采样的改进方案,引起了开源社区的关注。 目前该方法已在Mi…
-
李沐重返母校,上交大秒变追星现场,大模型趋势无保留分享
俞勇:第一次亲眼看到如此盛况 什么是顶流? AI大神李沐回母校做演讲,直接让上交大变成了大型追星现场—— 现场可谓是人人从从众众,先来感受一下这个feel: 正式演讲前的场外已经是…
-
丰知物流决策大模型发布:巨头争夺落地先机
在顺丰速运总裁王卫公开表示“顺丰已经开始钻研ChatGPT”一年多后,顺丰在大模型领域再次传出新消息。 8月19日,《每日经济新闻》记者从顺丰方面获悉,顺丰科技于8月18日推出其自…
-
全球最强数学大模型发布,人人可玩Demo,阿里多模态模型加持,中文适用
衡宇 发自 凹非寺 AI快讯网 | 现在,最强数学大模型,人人都可上手玩了! 一觉醒来,阿里千问大模型团队发布了Qwen2-Math的Demo,抱抱脸在线可玩。 惊喜的是,如果嫌输…
-
摩尔线程发布夸娥智算集群KUAE 1.2,连续无故障训练15天!
Rain科技8月19日消息,摩尔线程正式发布了夸娥智算集群KUAE 1.2版本。该版本在软硬件层面进行了全面的优化,实现了功能和性能的多维升级,并提升了稳定性和生态友好性,为大模型…
-
4秒看完2小时电影!阿里发布通用多模态大模型mPLUG-Owl3
还提出了一个有趣的长视觉序列测评方法 4秒看完2小时电影,阿里团队新成果正式亮相—— 推出通用多模态大模型mPLUG-Owl3,专门用来理解多图、长视频。 具体来说,以LLaVA-…
-
智谱 AI 开放平台上线 GLM-4-Long,支持 1M 上下文
年初,当大模型行业掀起“长文本”竞赛热潮时,我们就萌生过打造一个“读书助理”的想法。对市面上主流大模型进行测试后,我们发现普遍存在两个不足: 一种是可处理的文本长度不够,即使有些大…
-
大模型拥有语言理解能力:MIT论文揭秘其“思维过程”
无需解释,只靠代码和输入输出就能学会编程 克雷西 发自 凹非寺AI快讯网 | 大模型对现实世界,可以形成自己的理解! MIT的一项研究发现,随着模型能力越强,它对现实的理解可能不仅…
-
大模型能发现自相矛盾的Prompt吗?上海交通大学最新研究解密
大模型检测“指令冲突”能力新基准 上海交通大学王德泉课题组 投稿 AI快讯网 | 上海交通大学王德泉教授课题组在最新研究中提出了这样的一个问题。 设想这样一个场景:一个幼儿园的小朋…
-
大模型指令调优数据集万字评测!腾讯上交大联合出品
腾讯优图实验室 投稿AI快讯网 | 随着大模型的快速发展,指令调优在提升模型性能和泛化能力方面发挥着至关重要的作用。 然而,对于指令调优数据集的数据评估和选择方法尚未形成统一的体系…