
近日,国产AI模型DeepSeek V3引发轩然大波。由幻方量化旗下杭州深度求索人工智能基础技术研究有限公司研发的DeepSeek V3,因其低廉的训练成本和高性价比,被誉为“国产之光”,甚至被网友戏称为“AI界的拼多多”。然而,该模型在初步测试中却展现出令人意外的“身份认同”问题:当被询问其身份时,它声称自己是OpenAI的ChatGPT,甚至进一步“升级”为即将发布的GPT-4。
这一事件迅速在社交媒体和科技媒体如TechCrunch上引发热议。众多网友和媒体的测试结果与最初的发现一致:DeepSeek V3坚持自己是ChatGPT或GPT-4。这种“冒名顶替”行为引发了广泛的质疑和讨论,也对DeepSeek V3的声誉造成了不小的冲击。
面对外界的质疑,深度求索公司尚未公开回应。值得关注的是,目前DeepSeek V3已不再声称自己是ChatGPT或GPT-4,其身份识别问题似乎得到解决。但这更加引发了外界对于该模型异常行为背后原因的好奇。
DeepSeek V3并非首例出现身份混淆的AI模型。此前,谷歌的Gemini模型在中文环境下也曾错误地将自己识别为百度的文心一言。这些事件凸显了AI模型在身份识别和信息表达方面的挑战,尤其是在快速发展的AI技术和海量数据环境下。
业内专家分析认为,DeepSeek V3不太可能直接基于ChatGPT的输出进行训练。他们指出,随着AI生成内容的爆炸式增长,训练数据污染已成为一个日益严重的问题。DeepSeek V3的异常表现,或许正是训练数据中存在ChatGPT相关信息污染的结果。这次事件再次警示我们,在追求AI技术快速发展的同时,必须高度重视数据的准确性和可靠性,并建立完善的数据清洗和审核机制,以避免类似事件再次发生,确保AI模型的健康发展。