Kimi都这么野了? 能看风水,夸我有情趣!

最近,笔者发现了一个令人眼前一亮的新玩意儿。

只需向AI提供一张图片,它就能推测出照片中人物的性格特征。

能看风水 夸我有情趣 Kimi现在都这么野了吗

更令人惊奇的是,它甚至可以仅通过歌单就大致推断出用户近期的心理状态。

能看风水 夸我有情趣 Kimi现在都这么野了吗

这些令人惊叹的功能都源自Kimi最新推出的k1视觉思考模型。值得一提的是,距离其数学模型k0-math上线仅一个月,k1便迅速问世。当然,k1的功能远不止图片性格分析这么简单。

能看风水 夸我有情趣 Kimi现在都这么野了吗

此前测试k0-math时,我们已经见识过其强大的“解题家”能力,其解题思路清晰,令人叹为观止。然而,k0-math在处理一些逻辑复杂的数学题和几何题时,表现略显不足。

但此次推出的k1模型则弥补了这一缺陷,它同时具备推理能力和视觉能力,可以直接处理拍照上传的题目,并号称在数理化方面能够与甚至超越OpenAI的o1模型。

能看风水 夸我有情趣 Kimi现在都这么野了吗

为了验证k1的实际能力,笔者选取了一道今年高考的几何题进行测试。k1不仅能够准确解读题意,理解解题目标,还能灵活运用余弦定理等数学知识,其思考过程与人类解题思路高度一致,例如,看到a² + b² – c² = 2ab,立即联想到余弦公式c² = a² + b² – 2ab·cosC。

能看风水 夸我有情趣 Kimi现在都这么野了吗

通过公式和条件的推导,k1迅速求解出角B=60°。

能看风水 夸我有情趣 Kimi现在都这么野了吗

对于第二道稍难的题目,k1同样给出了正确答案c=2√2,解题思路和方法也完全正确。(由于第二题k1的解题过程过长,此处不再展示截图)。在与o1的对比测试中,k1在速度上明显占优,o1耗时58秒,而k1更快;准确率方面,两者打成平手,都给出了正确答案,但o1并没有详细展示解题思路。

能看风水 夸我有情趣 Kimi现在都这么野了吗

k1模仿人类思维方式解题,并不令人意外,因为之前k0-math模型已经展现出类似能力,例如能够意识到自身错误并进行反复验证。相比之下,k1在弥补k0-math缺陷方面表现更出色,例如k0-math未能解决的初中几何题,k1现在已经能够轻松应对,甚至能够处理高考难度的题目。

此外,k1不仅擅长数学,在物理方面也表现出色。

能看风水 夸我有情趣 Kimi现在都这么野了吗

为了进一步测试k1的能力,笔者特意设计了一道逻辑陷阱题:一个西瓜进价50元,卖价70元,老板收了100元假币,最后亏多少钱?这道题看似简单,但答案却众说纷纭。笔者想看看k1能否识别出其中的陷阱,并且,为了测试k1的视觉能力,笔者特意采用手写潦草的方式书写题目。

能看风水 夸我有情趣 Kimi现在都这么野了吗

令人惊喜的是,k1的视觉能力和逻辑推理能力都非常出色。它先得出一个亏100元的答案,随后迅速否定,并综合考虑假币、找零、成本利润等诸多因素,最终得出正确答案:亏损80元。(正确答案为80元)

能看风水 夸我有情趣 Kimi现在都这么野了吗

笔者又测试了一些行测类比推理题,虽然k1的逻辑分析路径与标准答案略有不同,但最终答案均正确。

能看风水 夸我有情趣 Kimi现在都这么野了吗

总而言之,k1展现出强大的逻辑推理和视觉分析能力,解题能力堪称一流,其“解题家”称号实至名归。 然而,k1的功能远不止于此,笔者还探索了一些更具创意的用法。

例如,利用k1的图片推理能力进行古钱币鉴别。笔者从网上找到一张民国时期银元的图片,两枚银元一真一假,并将图片发送给k1进行测试,结果k1不仅识别出钱币的年代,还详细分析了钱币的细节,最终准确识别出了假币。

能看风水 夸我有情趣 Kimi现在都这么野了吗

能看风水 夸我有情趣 Kimi现在都这么野了吗

此外,k1还能进行“风水”分析,对房间布局进行点评并提出改进建议,例如建议更换床的位置、定期修剪植物、更换更简洁的吊灯等。

能看风水 夸我有情趣 Kimi现在都这么野了吗

甚至可以根据食物图片估算卡路里摄入量。

能看风水 夸我有情趣 Kimi现在都这么野了吗

最令人印象深刻的是k1的看图猜电影能力。笔者提供了一张《七宗罪》的电影截图,k1通过分析画面角度和色调,准确推断出该截图出自《七宗罪》,并识别出具体的场景。

能看风水 夸我有情趣 Kimi现在都这么野了吗

能看风水 夸我有情趣 Kimi现在都这么野了吗

k1甚至能够解读一些晦涩的梗图,并解释其笑点所在。

能看风水 夸我有情趣 Kimi现在都这么野了吗

能看风水 夸我有情趣 Kimi现在都这么野了吗

总而言之,k1强大的视觉和推理能力使其能够轻松应对各种挑战,其应用场景远不止于解题。k1的出色表现很大程度上得益于COT(Chain of Thought)思维链技术,该技术能够模拟人类大脑的思考方式,将复杂任务分解成多个步骤逐一解决,从而提高模型的推理能力。此外,强化学习技术也为k1的进化提供了有力支持,使其能够在不断试错中优化自身表现。

能看风水 夸我有情趣 Kimi现在都这么野了吗

Kimi选择数学作为推理模型的切入点,或许是因为数学能够有效锻炼思维能力,如同人类学习数学一样。 通过掌握数学知识,该模型可以将逻辑推理的能力扩展到物理、化学等多个领域,最终实现对世界的理解。

能看风水 夸我有情趣 Kimi现在都这么野了吗

Kimi推理模型的泛化能力已经初见端倪。在数据趋于饱和的背景下,基于强化学习的技术路径或许能够帮助模型取得更好的效果。最终,模型的技术细节和纸面数据固然重要,但模型的易用性和实用性才是用户最关注的焦点。Kimi模型在长文本和强化学习方面的不断改进,正是其努力适应用户需求,提升自身实用价值的体现。当技术不再高高在上,而是能够切实解决人们的实际问题时,才能真正体现其价值与意义。

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,可联系本站进行审核删除。
(0)
Rain科技Rain科技
上一篇 2024年 12月 19日 上午2:18
下一篇 2024年 12月 19日 上午6:43

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

欢迎来到AI快讯网,开启AI资讯新时代!