Large Language Model

人工智能

小米大模型提效新框架：训练提速34%，推理提速52%！

文本也能像语音一样下采样大模型推理速度提升50%以上，还能保证少样本学习性能！小米大模型团队提出SUBLLM（Subsampling-Upsampling-Bypass Lar…

2024年 6月 24日
人工智能

华为发布会：盘古大模型跳级发布，编程语言仓颉首次亮相

明敏发自 HDC2024 AI快讯网 | 公众号 QbitAI 华为自研盘古大模型，跳级迭代！ HDC 2024上，没有4.0，直接发布5.0。最新系列覆盖十亿、百亿、千亿、万…

2024年 6月 22日
人工智能

阿里通义Qwen2成斯坦福大模型榜单最强开源模型

性能超越Llama3-70B模型 6月20日消息，斯坦福大学的大模型测评榜单HELM MMLU发布最新结果，斯坦福大学基础模型研究中心主任Percy Liang发文表示，阿里通义千…

2024年 6月 20日
人工智能

340B险胜70B，Kimi机器人贴脸”嘲讽”英伟达新开源模型

允许免费生成合成数据排名超过Llama-3-70B，英伟达Nemotron-4 340B问鼎竞技场最强开源模型！前两天，英伟达突然开源了其通用大模型Nemotron的3400亿…

2024年 6月 19日
人工智能

8B模型奥数成绩比肩GPT-4！上海AI Lab出品

克雷西发自凹非寺AI快讯网 | 公众号 QbitAI 只要1/200的参数，就能让大模型拥有和GPT-4一样的数学能力？来自复旦和上海AI实验室的研究团队，刚刚研发出了具有超…

2024年 6月 18日

欢迎来到AI快讯网，开启AI资讯新时代！