谷歌Veo 3.1视频生成模型上线,AI创作“声画合一”,实测体验有亮点也有局限

   时间:2025-10-16 17:51 来源:快讯作者:柳晴雪

谷歌今日正式发布新一代视频生成模型Veo 3.1,在画面真实度、叙事控制及多模态生成能力方面实现突破。该模型同步赋能旗下AI影视创作平台Flow,新增音频生成功能,支持从文本到"声画合一"的完整创作流程。

Flow平台此次升级聚焦三大核心功能:素材生视频(Ingredients to Video)支持多图参考生成定制化视频,首尾帧(frames to Video)可自动生成过渡镜头,视频延展(Extend)功能则能将短片扩展至分钟级长视频。最引人注目的是AI音频生成系统的加入,该系统可根据画面内容自动匹配环境音、动作音效及氛围配乐,实现真正的多媒体创作。

针对后期编辑需求,Flow新增智能元素插入工具,可自然融入人物、动物等新元素并自动调整光影效果。即将上线的一键移除功能支持无痕删除对象,系统会自动重建背景画面。这些工具使创作者能更精准地控制最终效果。

技术测试显示,Veo 3.1在复杂光影场景中表现突出,能准确还原清晨光线的暖色调与自然氛围。实测生成的小溪画面水流平滑,反光细节处理得当,配音与画面内容高度契合。模型提供快速版(30秒-1分钟生成)和高质量版两种模式,满足不同创作需求。

但在高难度动态场景测试中,模型暴露出明显局限。当尝试生成体操动作视频时,输出画面出现严重扭曲,无法准确呈现人体结构。名人肖像测试也显示保护机制生效,上传OpenAI CEO照片生成的画面存在显著差异,系统提示不支持使用特定人物形象。

目前Veo 3.1已通过Flow平台、Gemini API、Vertex AI及Gemini应用全面开放,免费用户每月可获100个AI点数,约可生成5条视频。广告短片测试表明,模型能根据咖啡杯、人像等素材生成符合品牌调性的商业内容,广告词呈现效果达到预期要求。

 
 
更多>同类内容
全站最新
热门内容