<汇港通讯> 阿里巴巴(09988)旗下千问发布新一代全模态大模型Qwen3.5-Omni,可支持文本、图片、音讯、音视频理解、推理和交互任务共取得215项任务中获得SOTA(性能最佳)成绩,更超越Google的Gemini-3.1 Pro。
据介绍,模型在海量文本、视觉及超过1亿小时音视频数据上进行原生多模态预训练,相比Qwen3-Omni,Qwen3.5-Omni多语言能力大大增强,能支持113种语种和方言语音辨识和36种语种和方言的语音生成。目前可通过Offline API和Realtime API进行体验。其中,通用音讯理解、推理、识别、翻译及对话全面超越Gemini-3.1 Pro,音视频理解能力总体达到Gemini-3.1 Pro水平,视觉及文本能力达到同尺寸Qwen3.5模型效果。
一般用户可於Qwen Chat免费体验,开发者和企业可通过阿里云百炼平台使用,每百万Tokens少於0.8元人民币,比Gemini-3.1 Pro的十分一还低。
#Qwen3.5-Omni (ST)
新闻来源 (不包括新闻图片): 汇港资讯