Gemini Omni Flash supports synchronized audio. Describe sounds, ambience, and dialogue for richer output.
Click to upload images (up to 5)
Supports JPG, PNG, WEBP, max 10MB each
Click to upload a reference video
MP4 / MOV / WEBM, max 50MB, up to 30s
Gemini Omni Flash Tips
- - Reference Images: JPEG / PNG / WEBP / JPG — max 10MB each, up to 5 images.
- - Reference Video: MP4 / MOV / WEBM — max 50MB, up to 30s, 1 video. Pick a trim segment with Start / End (seconds).
- - Duration: 4s / 6s / 8s / 10s — longer clips cost more credits (no video input).
- - Resolution (no video): 720p / 1080p tier 30 / 40 / 50 / 60 credits. 4K tier 70 / 80 / 90 / 100 credits.
- - Resolution (with video): 720p / 1080p flat 80 credits. 4K flat 120 credits.
- - Aspect Ratio: 16:9 for landscape, 9:16 for short-form vertical content.
由 Gemini Omni Flash 驱动的一站式 AI 视频生成工作室
Omni Flash 把文本、图像、音频和视频四种输入合并进同一条生成管线。平台基于具备世界感知能力的多模态模型 Gemini Omni Flash 构建,以一个统一的工作台取代了传统需要四套工具的流程——你只需写下创意,即可直接渲染出完整的 AI 视频。
全类型输入,一个生成器
文本生视频、图像生视频、音频驱动和参考视频生成共用同一个 AI 视频生成模型,不再有独立管线,也无需在工具之间反复导入导出素材。
真正的多模态融合
在同一次请求中混合使用提示词、参考图像、语音片段和短视频样本。模型会综合解读这些输入,生成一段尊重每一项素材的画面。
生产级输出质量
渲染出符合播出标准的精致视频,可直接用于社交媒体、付费广告、产品发布、剧情短片和商业交付。
扎根真实物理规律的电影级 AI 视频生成
Gemini Omni Flash 专为具备世界感知能力的生成而打造。它能建模重力、动量与流体动力学,具备广泛的科学和文化知识,并在每一个镜头之间保持角色、道具和光照的一致性——一切都可以通过自然语言对话直接编辑。
世界感知的文本生视频
提示词被转化为具备真实动作、镜头调度和光照的电影级镜头。模型理解的是创作意图而不是字面用词,从第一帧起就遵循真实的物理规律。
身份锁定的图像生视频
让一张静态图像动起来,同时在每一帧中保持人物身份、服装、材质和创作意图不变。没有变形伪影,镜头切换之间也不会出现面孔漂移。
多轮对话式编辑
通过对话调整动作、重组场景、切换艺术风格或更改运镜方式。镜头中的角色、道具和光照在多次迭代之间保持锁定,一份创意简报便能演化为完整成片。

三步完成一段 AI 视频生成
打开工作室,描述画面,直接渲染。剩下的交给 Gemini Omni Flash 管线——大多数片段都能在几分钟内完成。
进入工作室
访问 omni-flash.net 启动 AI 视频生成器。工作台高度统一,无需插件链,也不必为每个模型单独配置。
描述你的画面
输入提示词,挂载参考图或音频,选择输出风格。一份简报里可任意组合多种输入。
渲染、调整、发布
先渲染初稿,再通过对话式编辑微调细节,最后导出成片。大多数项目在 3 次以内的迭代就能定稿。
创作者为何转向 Omni Flash
为真实创意工作打造的速度、可控性与一致性——基于多模态模型 Gemini Omni Flash,并针对生产排期进行了调优的 AI 视频生成方案。
任意输入的多模态管线
一个模型同时接收文本、图像、音频和视频,彻底告别当今 AI 视频项目中四套工具拼接的碎片化工作流。
理解物理规律的生成
重力、动量、布料垂坠和流体动力学都按预期呈现——下落的物体会真实坠落,液体会像液体一样倾泻,烟雾会像烟雾一样飘散。
对话式编辑
用自然语言调整镜头:更换时段、替换角色、切换艺术风格,而画面其他部分在每次编辑之间始终保持锁定。
角色与场景一致性
主体在镜头切换、多轮修改和风格变换中保持身份一致,对系列剧情、品牌吉祥物和产品短片都至关重要。
内置世界知识
对科学、历史与文化的广泛掌握,让模型能够精准还原唐代庭院、蛋白质折叠序列或 1920 年代柏林的有轨电车。
可商用的输出
付费套餐生成的内容在套餐条款范围内授权用于客户交付、付费投放和品牌内容创作。
简单透明的积分制定价
选择与你产能匹配的套餐——按月、按年或一次性充值。同一个积分池覆盖 Gemini Omni Flash 管线上的所有输入类型和输出风格的 AI 视频生成。
每日免费积分
每24小时可领取一次免费积分
Pro
- 350 积分/月
- 一次性发放全部 4200 积分
- 最多 35 个视频/月
- 最多 350 张图片/月
- 支持所有 AI 模型
- 优先客服
- 商业使用权
- 优先处理速度
- 去除水印
Basic
- 150 积分/月
- 一次性发放全部 1800 积分
- 最多 15 个视频/月
- 最多 150 张图片/月
- 支持所有 AI 模型
- 优先客服
- 商业使用权
- 优先处理速度
- 去除水印
Max
- 750 积分/月
- 一次性发放全部 9000 积分
- 最多 75 个视频/月
- 最多 750 张图片/月
- 支持所有 AI 模型
- 优先客服
- 商业使用权
- 优先处理速度
- 去除水印
Pro Max
- 1,500 积分/月
- 一次性发放全部 18,000 积分
- 最多 150 个视频/月
- 最多 1,500 张图片/月
- 支持所有 AI 模型
- 优先客服
- 商业使用权
- 优先处理速度
- 去除水印
常见问题
关于 Gemini Omni Flash 模型、支持的输入类型、编辑流程及商用授权的直接解答。
Omni Flash 是什么?
Omni Flash 是位于 omni-flash.net 的多模态 AI 视频生成工作室。平台运行在 Gemini Omni Flash 模型上,在同一条生成流程中支持文本、图像、音频和视频四种输入。
Gemini Omni Flash 与其他视频模型有何不同?
主要有三点:它能在单次请求中接收任意输入模态;它建模真实世界的物理规律,包括重力、动量和流体动力学;并能在多轮编辑中保持角色、道具和场景的一致性。
视频生成后还能继续编辑吗?
可以。用自然语言描述改动即可——调整动作、更换时段、切换运镜或转换艺术风格。镜头其余部分保持锁定,编辑会层层累加,而不是从头再来。
模型支持哪些输入?
支持四种模态:文本提示、参考图像、音频片段以及短参考视频。可以单独使用,也可以在同一份简报中混合搭配。
能处理复杂物理或科学场景吗?
可以。模型经过世界感知生成的训练,因此流体流动、布料垂坠、光线衰减和刚体碰撞等现象都呈现出真实的物理合理性,而非传统视效的近似。
生成一段视频需要多久?
大多数片段在几分钟内即可完成,具体时间取决于时长、分辨率以及当前队列负载。对话式编辑通常比完整重渲染要快。
视频可以用于商业用途吗?
付费套餐的输出在套餐条款范围内授权用于商业用途,包括客户交付、付费广告和品牌内容。发布前请阅读套餐条款。
本平台是否与 Gemini 模型提供商存在关联?
没有。Omni Flash 是位于 omni-flash.net 的独立服务。Omni 是本站使用的产品名称,与任何第三方 AI 模型提供商不存在关联、背书或赞助关系。
开始使用 Omni Flash 创作
把提示词、图像和音频转化为精致、符合物理规律的 AI 视频——全部在基于 Gemini Omni Flash 的统一工作台中完成。
