7月4日|商湯發佈首個“可控”人物視頻生成大模型Vimi,該模型主要面向C端用户,支持聊天、唱歌、舞動等多種娛樂互動場景。商湯方面稱,Vimi可生成長達1分鐘的單鏡頭人物類視頻,畫面效果不會隨着時間的變化而劣化或失真,Vimi基於商湯日日新大模型,通過一張任意風格的照片就能生成和目標動作一致的人物類視頻,可通過已有人物視頻、動畫、聲音、文字等多種元素進行驅動。