据人工智能社区Hugging Face消息,DeepSeek发布了其开源多模态人工智能模型Janus-Pro。此举标志着人工智能领域又一里程碑的诞生,也再次印证了多模态AI模型的蓬勃发展。
Janus-Pro-7B在GenEval和DPG-Bench基准测试中表现出色,甚至超越了OpenAI的DALL-E 3和Stable Diffusion。这一结果令人瞩目,也引发了业界对DeepSeek技术的广泛关注和讨论。其优异性能的背后,是DeepSeek团队在模型架构和训练方法上的技术创新与突破。
令人印象深刻的是,仅仅8天前,DeepSeek才刚刚发布了DeepSeek-R1模型并开源其权重,便迅速在中、日、美三个App Store榜单上登顶。这一速度之快,充分展现了DeepSeek-R1模型的强大实力以及其在市场上的竞争力。
DeepSeek-R1在后训练阶段应用了大规模强化学习技术。即使在标注数据极其有限的情况下,仍然能够显著提升模型的推理能力。在数学、代码和自然语言推理等多个任务上,其性能已达到与OpenAI的GPT-4(o1正式版)相媲美的水平。这表明DeepSeek在模型优化和高效利用数据方面取得了重大进展。
用户可以通过DeepSeek官网或官方App,启用“深度思考”模式来调用最新版本的DeepSeek-R1,完成各种推理任务。DeepSeek-R1 API服务的价格为:每百万输入tokens 1元(缓存命中)/ 4元(缓存未命中),每百万输出tokens 16元。这一定价策略,在兼顾盈利的同时,也体现了DeepSeek致力于让更多用户能够方便地使用其先进技术。
需要特别指出的是,DeepSeek近期遭遇了大规模恶意攻击,目前已采取临时措施,限制了除+86手机号以外的注册方式,以加强平台的安全性。这一事件也凸显了在人工智能快速发展的同时,安全问题的重要性。


