DeepSeek又一論文上新

在業界對新一代旗艦模型DeepSeek V4的翹首期盼中,DeepSeek團隊卻悄然放出了一篇新的學術論文論文。這篇論文由DeepSeek聯合北大、清華共同撰寫,將研究方向投向了決定大模型實際應用落地的關鍵一環——推理速度,為日益複雜的AI智慧體,提供一套高效的底層系統解決方案。

具體來說,新論文介紹了一個名為DualPath的創新推理系統,專門針對智慧體工作負載下的大模型(LLM)推理效能進行最佳化論文。透過引入“雙路徑讀取KV-Cache(類似記憶快取)”機制,重新分配儲存網路負載,將離線推理吞吐量最高提升1.87倍,線上服務的每秒智慧體執行數平均提升1.96倍。(第一財經記者 劉曉潔)

本站內容來自使用者投稿,如果侵犯了您的權利,請與我們聯絡刪除。聯絡郵箱:[email protected]

本文連結://sdhbcy.com/post/17280.html

🌐 /