<匯港通訊> DeepSeek在微信公眾號公布,發布全新系列模型DeepSeek-V4的預覽版,並同步開源。現在開始,1M(一百萬)上下文將是DeepSeek所有官方服務的標配;會努力向實現AGI 的目標不斷靠近。
DeepSeek指,DeepSeek-V4 已成為公司內部員工使用的Agentic Coding模型,據評測反饋,使用體驗優於Sonnet 4.5,交付質量接近Opus 4.6非思考模式,但仍與Opus 4.6思考模式存在一定差距。在數學、STEM、競賽型代碼的測評中,DeepSeek-V4-Pro超越當前所有已公開評測的開源模型,取得比肩世界頂級閉源模型的優異成績。
DeepSeek指,V4開創一種全新的注意力機制,在token維度進行壓縮,結合DSA稀疏注意力(DeepSeek Sparse Attention),實現全球領先的長上下文能力,相比傳統方法,大幅降低對計算和顯存的需求。DeepSeek將始終秉持長期主義的原則理念,在嘗試與思考中踏實前行,努力向實現AGI的目標不斷靠近。 (WL)
新聞來源 (不包括新聞圖片): 滙港資訊