#DeepSeek-R1小版本更新、推理+文本+编码能力提升| 国海计算机(0529)

#DeepSeek-R1小版本更新、推理+文本+编码能力提升| 国海计算机(0529)
5/28,DeepSeek-R1完成小版本升级,此次小版本升级在思维链行为上出现明显变化,核心更新亮点为:1)能像谷歌模型一样深度推理;2)文本生成优化:更自然,格式更佳;3)独特的推理风格:不仅快而且更缜密;4)支持长时思考:单任务处理时长可达30分钟至60分钟。 使用体验上改进点包括: ▪️响应质量优化:DeepSeek复杂推理、多步骤计算准确度提升;长文理解与生成更连贯、逻辑更清晰;数学、编程等专业性输出可靠性提升。 ▪️响应速度提升:在网页端、App、API接口中响应更敏捷;尤其在处理超长文本输入时,延迟有所降低(约提升10%至20%)。 ▪️对话稳定性增强:上下文记忆更稳定,尤其在超长对话中(支持最多128K上下文);减少偶尔“遗忘设定”或“跑偏”的情况。 ▪️API和接口兼容性保持稳定:如公告所说,API调用方式、参数、返回结构完全不变;用户无需调整现有集成,即可无缝使用新版本。 在基座模型方面,DeepSeek-R1-0528基于DeepSeek-V3-0324训练(参数为660B)。 在LiveCodeBench基准(代码能力测试)上,DeepSeek-R1-0528性能几乎与o3-mini(High)和o4-mini(Medium)实力相当,一举超越了Gemini 2.5 Flash。 此外DeepSeek-R1在前端编码的能力上超越Claude 4 Sonnet。 #无需R2、R1小幅升级便直接对标SOTA、DeepSeek再次提升产业对R2能力的期许。 我们坚定看好AI发展,产业端日新月异,模型能力提升+AI提升企业ROI多核心催化。 我们认为,前瞻布局AI的企业有望迎来业绩的加速发展。
来源:xiaozuowen日期:2025-05-29