benchmark
-
Honor Magic 8 Scores Over 4.16 Million: A First for the Smartphone Industry
Honor’s product manager, Li Kun, has revealed the AnTuTu benchmark scores for the up…
-
Global Premiere of Snapdragon 8 Elite Gen5! Xiaomi 17 Pro First Benchmark Unveiled
Analysis of Emerging Smartphone Technology: Xiaomi 17 Pro Benchmark Reveals Next-Generatio…
-
AnTuTu V11 Beta Officially Released: Multiple Devices Surpass 3 Million Points
On September 4th, AnTuTu V11 Public Beta was officially released, introducing a comprehens…
-
大模型测试题爆火,GPT-4和Claude3都跪了,LeCun转发:新Benchmark
还有12款模型全军覆没…… 克雷西 发自 凹非寺AI快讯网 | 公众号 QbitAI 一项新的“大模型Benchmark”在推特上爆火,LeCun也点赞转发了! 而且无论是GPT-…
-
百万级高质量视频数据集发布,登顶抱抱脸数据集排行榜
高质量描述,让视频生成质量更好 ShareGPT4V团队 投稿AI快讯网 | 公众号 QbitAI 中科大、上海AI实验室等组成的ShareGPT4V团队,推出了新的视频数据集,登…
-
考考大模型视频理解能力,中科院人大百川提出新基准合成框架 | AI快讯网
“计数任务”众多模型表现都不理想 测试Gemini1.5 Pro、GPT-4o等多模态大模型的新基准来了,针对视频理解能力的那种。 直接在视频内容中插入多个无关的图像或文本“针”,…
-
GPT-4o 超越 SOTA,800 万数据集测试准确率达 50%
最先5个达到85%即可瓜分50万美元 克雷西 发自 凹非寺AI快讯网 | 公众号 QbitAI GTP-4o挑战悬赏八百万的超难数据集,实现SOTA! 数据集当中包含了各种类型的图…
-
中国大模型市场主流产品评估报告(2024)发布
6月12日,国际数据公司IDC发布了《中国大模型市场主流产品评估,2024》。IDC此次采取了实测的方式,专门成立了产品测试团队,对基础大模型及其相关产品进行了多维度评测。不仅如此…
-
全华人团队推出多模态大模型新基准,GPT-4o准确率仅为65.5% | AI快讯网
还发现感知错误、推理错误是所有模型最常见的两大错误。 GPT-4o再次掀起多模态大模型的浪潮。 如果他们能以近似人类的熟练程度,在不同领域执行广泛的任务,这对许多领域带来革命性进展…