新京報(bào)貝殼財(cái)經(jīng)訊（記者羅亦丹）5月29日晚，DeepSeek官方微信公眾號發(fā)文稱，DeepSeek-R1模型已完成小版本升級，當(dāng)前版本為DeepSeek-R1-0528。用戶通過官方網(wǎng)站、APP 或小程序進(jìn)入對話界面后，開啟“深度思考”功能即可體驗(yàn)最新版本。API 也已同步更新，調(diào)用方式不變。

具體來看，DeepSeek-R1-0528 仍然使用 2024 年 12 月所發(fā)布的 DeepSeek V3 Base 模型作為基座，但在后續(xù)訓(xùn)練過程中投入了更多算力，顯著提升了模型的思維深度與推理能力。更新后的R1模型在數(shù)學(xué)、編程與通用邏輯等多個(gè)基準(zhǔn)測評中取得了當(dāng)前國內(nèi)所有模型中首屈一指的優(yōu)異成績，并且在整體表現(xiàn)上已接近其他國際頂尖模型，如o3與 Gemini-2.5-Pro。

相較于舊版 R1，新版模型在復(fù)雜推理任務(wù)中的表現(xiàn)有了顯著提升。例如在 AIME 2025 測試中，新版模型準(zhǔn)確率由舊版的 70% 提升至 87.5%。這一進(jìn)步得益于模型在推理過程中的思維深度增強(qiáng)：在 AIME 2025 測試集上，舊版模型平均每題使用 12K tokens，而新版模型平均每題使用 23K tokens，表明其在解題過程中進(jìn)行了更為詳盡和深入的思考。

同時(shí)，蒸餾 DeepSeek-R1-0528 的思維鏈后訓(xùn)練Qwen3-8B Base，得到了 DeepSeek-R1-0528-Qwen3-8B。該 8B 模型在數(shù)學(xué)測試 AIME 2024 中僅次于 DeepSeek-R1-0528，超越 Qwen3-8B （+10.0%），與 Qwen3-235B 相當(dāng)?！拔覀兿嘈?，DeepSeek-R1-0528 的思維鏈對于學(xué)術(shù)界推理模型的研究和工業(yè)界針對小模型的開發(fā)都將具有重要意義?！盌eepSeek方面表示。

此外，新版 DeepSeek R1 針對“幻覺”問題進(jìn)行了優(yōu)化。與舊版相比，更新后的模型在改寫潤色、總結(jié)摘要、閱讀理解等場景中，幻覺率降低了 45%～50% 左右，能夠有效地提供更為準(zhǔn)確、可靠的結(jié)果。

而在創(chuàng)意寫作方面，在舊版R1的基礎(chǔ)上，更新后的R1模型針對議論文、小說、散文等文體進(jìn)行了進(jìn)一步優(yōu)化，能夠輸出篇幅更長、結(jié)構(gòu)內(nèi)容更完整的長篇作品，同時(shí)呈現(xiàn)出更加貼近人類偏好的寫作風(fēng)格。

最后，DeepSeek保持了一貫的開源做派，提供了相關(guān)模型的下載鏈接。

編輯陳莉校對楊許麗

13 +1

微博

微信

亚洲精品朝桐光成人片_亚洲AV无码播放毛片一线天_精品少妇Ay一区二区三区_免费看成人国产一区二区三区

DeepSeek-R1模型完成小版本升級：思考更深，推理更強(qiáng)

我要評論

熱點(diǎn)

最新

熱議