3月24日晚,DeepSeek发布了模型更新——DeepSeek-V3-0324。这次更新是DeepSeek V3的小版本升级,并非市场期待的DeepSeek-V4或R2。开源版本已上线Hugging Face,参数量达6850亿。同日,DeepSeek在官方交流群宣布,欢迎用户前往官网、App和小程序试用体验新版V3,API接口和使用方式保持不变。
此前于2024年12月发布的DeepSeek-V3以高性价比著称,评测成绩超越了Qwen2.5-72B和Llama-3.1-405B等其他开源模型,性能媲美GPT-4o和Claude-3.5-Sonnet等顶尖闭源模型。但目前尚未有新版V3的能力基准测试结果。2025年1月,DeepSeek发布了性能与OpenAI o1正式版相当的DeepSeek-R1,该模型通过强化学习技术,在少量标注数据下显著提升了推理能力。2月25日,市场上有消息称DeepSeek计划提前发布R2模型,原定5月初发布,现公司希望尽早推出。