video understanding

人工智能

考考大模型视频理解能力，中科院人大百川提出新基准合成框架 | AI快讯网

“计数任务”众多模型表现都不理想测试Gemini1.5 Pro、GPT-4o等多模态大模型的新基准来了，针对视频理解能力的那种。直接在视频内容中插入多个无关的图像或文本“针”，…

2024年 6月 20日
人工智能

Gemini视频推理力压GPT-4，Jeff Dean连发三推，视频多模态基准Video-MME发布

全面评估多模态大模型的综合视频理解能力 OpenAI和谷歌接连两场发布会，把AI视频推理卷到新高度。但业界还缺少可以全面评估大模型视频推理能力的基准。终于，多模态大模型视频分析…

2024年 6月 18日