Llama3
-
Llama 3 比 GPT-4 更爱说谎,首个大模型“诚实性”评估基准问世
评估大模型是否诚实的基准来了! 上海交通大学生成式人工智能实验室(GAIR Lab)推出了一项开创性的评估基准——BeHonest,旨在全面评估大模型的诚实性,为安全透明的AI研发…
Llama 3 比 GPT-4 更爱说谎,首个大模型“诚实性”评估基准问世
评估大模型是否诚实的基准来了! 上海交通大学生成式人工智能实验室(GAIR Lab)推出了一项开创性的评估基准——BeHonest,旨在全面评估大模型的诚实性,为安全透明的AI研发…