7月22日|據通義千問Qwen:今天,我們更新了旗艦版Qwen3模型,推出Qwen3-235B-A22B-FP8非思考模式(Non-thinking)的更新版本,命名為Qwen3-235B-A22B-Instruct-2507-FP8。
新的Qwen3模型,通用能力顯著提升,包括指令遵循、邏輯推理、文本理解、數學、科學、編程及工具使用等方面,在GQPA(知識)、AIME25(數學)、LiveCodeBench(編程)、Arena-Hard(人類偏好對齊)、BFCL(Agent能力)等眾多測評中表現出色,超過Kimi-K2、DeepSeek-V3等頂級開源模型以及Claude-Opus4-Non-thinking等領先閉源模型。
此外,本次更新的Qwen3模型,還增強了以下關鍵性能:
-在多語言的長尾知識覆蓋方面,模型取得顯著進步。
-在主觀及開放性任務中,模型顯著增強了對用户偏好的契合能力,能夠提供更有用的回覆,生成更高質量的文本。
-長文本提升到256K,上下文理解能力進一步增強。
目前,Qwen3新模型已在魔搭社區和HuggingFace上開源更新,歡迎開發者們體驗。
新聞來源 (不包括新聞圖片): 格隆匯