YutoIT 博客
返回顶部
目录
刚刚结束的 Google I/O 2026 大会给科技界带来了真正的震撼,特别是新一代 AI 视频生成模型的亮相:Gemini Omni Flash(也称为 Omni Flash)。基于 Google Flow 平台,这款工具不仅超越了“前辈” Veo 3,还直接威胁到了市场上的其他强劲对手。

这篇来自 YutoIT 的文章将为您深度剖析 Gemini Omni Flash 的强大之处,从突破性的功能、使用成本,到教您如何一步步创作出超写实的 4K 视频。

什么是 Gemini Omni Flash?与 Veo 3 和 Seedance 2.0 相比水平如何?

Gemini Omni Flash 于 2026 年 5 月中旬发布,恰好在 Veo 3 轰动一时的一年后,它在物理效果和一致性方面带来了显著的改进。
  • 与 Veo 3 相比: Omni Flash 彻底修复了角色畸变、双人互动时面部混淆(例如:男女边喝咖啡边聊天)等常见错误。现在的 AI 对 Prompt(提示词)的理解极其敏锐,且能清晰区分主体。
  • 与 Seedance 2.0 相比: 虽然在处理强动作场面时可能还不及 Seedance 2.0,但 Omni Flash 在 4K 分辨率视频输出方面表现极其出色——这是目前 AI 领域中清晰度最完美的格式。
video_gemini_omni_flash.mp4
(146 MB)


Google Flow 的使用成本与积分 (Credits)

要使用该平台,您必须拥有付费账户。以下是您需要了解的内容:
  • 订阅方案要求: 您需要升级到 Google Plus / Ultra 方案,其中 Ultra 方案的费用约为每月 680 元人民币(240 万越南盾)。
  • 文生视频成本 (Text-to-Video): 使用 Omni Flash 模型生成一段 10 秒长的视频大约消耗 15 个积分。
  • 视频编辑成本 (Video-to-Video): 例如,您上传一段 15 或 16 秒长的原始视频让 AI 进行修改,系统将合理计算并扣除相应的积分。
  • 4K 文件导出成本: 默认情况下生成的视频分辨率仅为 1080p。为了下载超清 4K 文件,每次下载需额外支付 50 个积分。



Gemini Omni Flash 的强大功能


AI 智能体模式 (AI Agent) 自动生成分镜脚本

您无需自己构思每个场景。只需开启智能体模式 (AI Agent) 并对话:“创建一个 40 秒的视频,包含 4 个场景,展示一名西贡职场女性的一天”。AI 会自动编写剧本,然后免费生成分镜脚本(Storyboard,即可视化场景板)供您预览。当您点击“OK”时,AI 才会开始渲染出 4 段角色一致性极高的完整视频。

huong_dan_omni_flash.mp4
(89.2 MB)


使用您自己的数字分身 (Avatar) 生成视频

类似于 Sora 2,该功能允许您录制一段包含自己真实面部和声音的视频。随后,系统会将其保存为固定的数字分身 (Avatar)。您可以使用这个分身在成千上万个不同的视频中“出镜”,而无需再次亲自站在镜头前。

\">

随心所欲编辑视频

这是 Omni Flash 最具核心价值的功能。当您将原始视频上传到系统(需确认“我同意”隐私条款)后,您可以:
  • 更改服装、场景: 拖放 T 恤、帽子或武士服的图片并下达指令。视频中的人物会立即换上超写实的服装。
  • 流畅添加或删除细节: 下达指令“让这个人手里拿着一杯生啤酒”“有一只红耳鹎停在手上”,AI 会立即将物体融入原本空着的手中。或者使用指令“删除视频中的所有人”来清理背景中多余的人物。
20260521.mp4
(48.4 MB)


如何在 Google Flow 上生成 AI 视频并下载 4K 画质


第一步:访问 Flow 主页

通过以下链接访问 Google Flow 主页:https://labs.google/fx/tools/flow

第二步:创建新项目

在 Flow 主页屏幕上,选择下方的创建新项目按钮。

Gemini Omni Flash 太强大了!在 Google Flow 上生成 AI 视频详细教程

第三步:编写 Prompt(提示词)生成视频

输入描述您视频的指令。重要提示:请务必在指令末尾加上“用中文/越南语/日语/韩语...等等”(例如:一名女孩正在吃河内烤肉粉并用越南语进行评价)。否则,系统很容易自动生成英语对话。

设置想要生成的视频数量和时长(基础 Prompt 最多 10 秒)。渲染速度极快,生成一段视频大约只需 30 秒。

Gemini Omni Flash 太强大了!在 Google Flow 上生成 AI 视频详细教程


第四步:预览并下载视频

不要直接点击屏幕顶部的下载按钮,因为那只是低质量预览版。请回到视频管理界面,将鼠标悬停在您满意的视频上,选择三个点图标 > 下载,确认额外支付 50 积分即可获取最清晰的 4K 版本。

Gemini Omni Flash 太强大了!在 Google Flow 上生成 AI 视频详细教程

结语

Gemini Omni Flash 更改场景、服装甚至声音的能力,为内容创作者赋予了无限权力。然而,这也带来了 Deepfake(深度伪造)的巨大风险。

例如,这是一段视频,其中的服装和台词完全不是我本人的真实情况,我根本没有说过那样的话:

Man_in_áo_dài_holding_202605212245.mp4
(19.4 MB)


别有用心的人可以获取您的原始视频,将其输入系统并生成您正在做某事或说某些您从未做过的话的视频。因此,请警惕社交媒体上的个人视频,并以合乎道德、负责任的方式使用 AI。

Omni Flash 模型在未来肯定还会有更多优化版本(可能是 Veo 4)。别忘了收藏 YutoIT.com,以免错过任何关于编程和 AI 的深度教程!
分享链接:
作者
Yuto

我在2024年创建了这个博客,正值人工智能技术快速发展之际。这个博客的目标是分享基础知识、计算机技巧以及基本AI工具的使用指南。
感谢您访问我的网站。希望网站上的文章对您有所帮助。

评论

暂无评论

留下评论并获取回复通知

请登录以发表评论

登录