Large Language Model
-
小米大模型提效新框架:训练提速34%,推理提速52%!
文本也能像语音一样下采样 大模型推理速度提升50%以上,还能保证少样本学习性能! 小米大模型团队提出SUBLLM(Subsampling-Upsampling-Bypass Lar…
-
华为发布会:盘古大模型跳级发布,编程语言仓颉首次亮相
明敏 发自 HDC2024 AI快讯网 | 公众号 QbitAI 华为自研盘古大模型,跳级迭代! HDC 2024上,没有4.0,直接发布5.0。 最新系列覆盖十亿、百亿、千亿、万…
-
阿里通义Qwen2成斯坦福大模型榜单最强开源模型
性能超越Llama3-70B模型 6月20日消息,斯坦福大学的大模型测评榜单HELM MMLU发布最新结果,斯坦福大学基础模型研究中心主任Percy Liang发文表示,阿里通义千…
-
340B险胜70B,Kimi机器人贴脸”嘲讽”英伟达新开源模型
允许免费生成合成数据 排名超过Llama-3-70B,英伟达Nemotron-4 340B问鼎竞技场最强开源模型! 前两天,英伟达突然开源了其通用大模型Nemotron的3400亿…
-
8B模型奥数成绩比肩GPT-4!上海AI Lab出品
克雷西 发自 凹非寺AI快讯网 | 公众号 QbitAI 只要1/200的参数,就能让大模型拥有和GPT-4一样的数学能力? 来自复旦和上海AI实验室的研究团队,刚刚研发出了具有超…