5月30日 (星期五)24°C 81
  news
 
日期:

DeepSeek發布新版R1推理模型 能比照OpenAI的o3

29/5/2025 21:39
中國人工智能初創公司--DeepSeek發布R1推理模型的更新版本,加強了與OpenAI等美國同業的競爭。 公司聲稱新版R1模型強化了深度思考能力,並能夠比照OpenAI和Google推出的一些頂尖模型。

DeepSeek凌晨在開發者平台Hugging Face上,發布了版本號「DeepSeek-R1-0528」的新版R1推理模型,但並未有同時公布該模型的升級內容。

DeepSeek晚上在微信公眾號發文,披露了模型的更多細節。 公司表示,新版R1仍然使用去年12月發布的DeepSeek V3 Base模型作為基座,在後訓練過程中投入了更多算力,顯著提升了思維深度與推理能力。

DeepSeek宣稱,更新後的R1模型在數學、 編程與通用邏輯等多個基準測評中,取得了當前國內所有模型中首屈一指的優異成績,並且在整體表現上已接近其他國際頂尖模型,如OpenAI的o3,與Google的Gemini-2.5-Pro。

此外,新版R1針對「幻覺」問題進行了優化。 與舊版相比,更新後的模型在改寫潤色、 總結摘要、 閱讀理解等場景中,幻覺率降低百分之45至50左右,能夠有效地提供更為準確、可靠的結果。

其他方面的提升,包括更貼近人類偏好的創意寫作,以及更好的前端代碼生成、 角色扮演能力。

DeepSeek繼續開源了新版R1的模型,並允許用戶利用模型輸出、 通過模型蒸餾等方式訓練其他模型。

首版R1於1月份發布,導致中國以外的科技股在1月份暴跌,並對「擴大人工智能規模需要龐大的計算能力和投資」這一觀點提出了挑戰。 自R1發布以來,阿里巴巴(09988)和騰訊(00700)等中國科技巨頭,都發布了聲稱超過DeepSeek的模型。



|

回主頁關於我們 使用條款及細則版權及免責聲明私隱政策聯絡我們

新城廣播有限公司版權所有,不得轉載。
Copyright © Metro Broadcast Corporation Limited. All rights reserved.