<匯港通訊> 短視頻平台TikTok母公司字節跳動旗下人工智能(AI)團隊,昨日全量開放豆包實時語音大模型,用戶可與AI進行實時對話,並聲稱較OpenAI旗下GPT-4o有明顯優勢。
字節跳動豆包大模型團隊表示,新發布的豆包實時語音大模型是語音理解和生成一體化的模型,相比傳統級聯模式,在語音表現力、控制力、情緒承接方面表現驚艷,並具備低時延、對話中可隨時打斷等特性。
豆包團隊指,該模型發布即上線,有能力直接服務億萬用戶,非停留在演示Demo層面;端到端語音能力加持下,豆包不僅是春節探親歡聚的神隊友,還是獻唱恭喜發財的高情商歌手。
豆包引述一些外部用戶的反饋指,該模型整體滿意度較GPT-4o有明顯優勢,特別是語音語氣自然度和情緒飽滿度遠高於後者。
字節跳動公布的數據顯示,豆包大模型上月日均tokens使用量逾4萬億,較去年5月發布時期增長超過33倍。
分析認為,字節跳動在農曆春節前夕發布該產品,或是借助傳統節日加速獲客。 (ST)
#字節跳動 #豆包實時語音大模型 #TikTok #GPT-4o
新聞來源 (不包括新聞圖片): 滙港資訊