From 114e16f32228e5a4d34b7c8ce8e283c6898a7fad Mon Sep 17 00:00:00 2001 From: lin-bot23 Date: Wed, 1 Jul 2026 18:35:14 +0800 Subject: [PATCH 1/5] docs: add Nano Banana 2 Lite and Gemini Omni Flash Partner Node tutorials - Nano Banana 2 Lite: Google's fastest, most cost-efficient image generation model (Gemini 3.1 Flash-Lite Image), with T2I and Image Edit workflows - Gemini Omni Flash: Google's conversational video generation and editing model, with T2V, I2V, and Video Edit workflows - Register both in Google nav group in docs.json --- docs.json | 4 +- .../google/gemini-omni-flash.mdx | 89 +++++++++++++++++++ .../google/nano-banana-2-lite.mdx | 73 +++++++++++++++ 3 files changed, 165 insertions(+), 1 deletion(-) create mode 100644 tutorials/partner-nodes/google/gemini-omni-flash.mdx create mode 100644 tutorials/partner-nodes/google/nano-banana-2-lite.mdx diff --git a/docs.json b/docs.json index 74cab5af7..e9cbde5ac 100644 --- a/docs.json +++ b/docs.json @@ -436,8 +436,10 @@ "group": "Google", "pages": [ "tutorials/partner-nodes/google/gemini", + "tutorials/partner-nodes/google/gemini-omni-flash", "tutorials/partner-nodes/google/nano-banana-pro", - "tutorials/partner-nodes/google/nano-banana-2" + "tutorials/partner-nodes/google/nano-banana-2", + "tutorials/partner-nodes/google/nano-banana-2-lite" ] }, { diff --git a/tutorials/partner-nodes/google/gemini-omni-flash.mdx b/tutorials/partner-nodes/google/gemini-omni-flash.mdx new file mode 100644 index 000000000..2f046bdca --- /dev/null +++ b/tutorials/partner-nodes/google/gemini-omni-flash.mdx @@ -0,0 +1,89 @@ +--- +title: "Gemini Omni Flash: Conversational Video Generation" +description: "Generate and edit videos through natural language using Gemini Omni Flash, Google's multimodal video model, available in ComfyUI through Partner Nodes" +sidebarTitle: "Gemini Omni Flash" +--- + +import ReqHint from "/snippets/tutorials/partner-nodes/req-hint.mdx"; +import UpdateReminder from "/snippets/tutorials/update-reminder.mdx"; + +Gemini Omni Flash is Google DeepMind's high-quality, cost-efficient video generation and conversational editing model. First introduced at Google I/O 2026 as part of the Gemini Omni family, it combines Gemini's multimodal reasoning with native video creation, enabling developers to generate, edit, and remix videos through natural conversation. + + + + +## What Gemini Omni Flash offers + +- **Conversational video editing**: Refine and edit videos using natural language — swap characters, relight scenes, alter angles, add or remove objects while maintaining original audio and video tracks +- **Multimodal input**: Combine text, images, and video inputs to guide generation. Natively generates synchronized audio with every video output +- **World knowledge and simulation**: Combines physics understanding with Gemini's knowledge of history, science, and cultural context, enabling meaningful storytelling beyond photorealism +- **Text and action synchronization**: Render legible text and graphics directly into video, syncing kinetic typography with on-screen movements +- **Pricing**: $0.10 per second of video output, matching Veo 3.1 Fast pricing + +## Workflows + +### Text to Video + + + + Open in Comfy Cloud + + + Download JSON or search "Gemini Omni Flash" in Template Library + + + +Generate cinematic video from natural language prompts. Transform text descriptions into video output with world-aware motion, lighting, and sound. Ideal for social media content creation, rapid video prototyping, and iterative visual storytelling. + +### Image to Video + + + + Open in Comfy Cloud + + + Download JSON or search "Gemini Omni Flash" in Template Library + + + Get the example input image for this workflow + + + Get the second example input image + + + +Generate a video from two images using Gemini Omni Flash. Interpret natural language prompts to control duration and aspect ratio. Perfect for creating short brand clips, dynamic social media content, and iterative video edits through conversational prompting. + +### Video Edit + + + + Open in Comfy Cloud + + + Download JSON or search "Gemini Omni Flash" in Template Library + + + Get the example input video for this workflow + + + +Edit videos with natural language using Gemini Omni Flash. Transform a single input video into one edited output based on your descriptive instructions. Specify the duration and aspect ratio in your prompt. Ideal for quick social media remixes, cinematic scene adjustments, and iterative video refinements. + +## Limitations + +- Currently supports 10-second video generations (longer durations coming soon) +- Audio references and scene extension are not yet supported in the API +- Character consistency has some limitations when changing scenes or panning movements + +## Get started + +1. Update ComfyUI to the latest version +2. Double-click the canvas and search for "Gemini Omni Flash" nodes +3. Or go to the Template Library to use the ready-to-go workflows +4. Choose the workflow that matches your input type (text, image, or video) +5. Enter your prompt and generate + + +For the best results, combine Gemini Omni Flash with Nano Banana 2 Lite: generate images at high speed, then use Gemini Omni Flash to animate them into video. + diff --git a/tutorials/partner-nodes/google/nano-banana-2-lite.mdx b/tutorials/partner-nodes/google/nano-banana-2-lite.mdx new file mode 100644 index 000000000..6ddaea478 --- /dev/null +++ b/tutorials/partner-nodes/google/nano-banana-2-lite.mdx @@ -0,0 +1,73 @@ +--- +title: "Nano Banana 2 Lite: Fast AI Image Generation" +description: "Generate images at Google's fastest speed and lowest cost using Nano Banana 2 Lite, the Gemini 3.1 Flash-Lite Image model in ComfyUI" +sidebarTitle: "Nano Banana 2 Lite" +--- + +import ReqHint from "/snippets/tutorials/partner-nodes/req-hint.mdx"; +import UpdateReminder from "/snippets/tutorials/update-reminder.mdx"; + +Nano Banana 2 Lite is Google DeepMind's fastest and most cost-efficient Gemini Image model, designed for rapid ideation and high-volume workflows. Powered by `gemini-3.1-flash-lite-image`, it delivers text-to-image generation in approximately 4 seconds at $0.034 per image, making it ideal for quick concept visualization, rapid prototyping, and iterative design exploration. + + + + +## What Nano Banana 2 Lite offers + +- **Ultra-fast generation**: Text-to-image outputs in as little as 4 seconds, built for interactive prototyping and rapid visual drafting +- **Cost-efficient**: Priced at $0.034 per 1K-resolution image — the most affordable option in the Nano Banana family +- **Character consistency**: Maintain character identities and object fidelity across multiple rapid generations +- **In-image text rendering**: Draft copy and render legible text directly into generated images for localized ad variations +- **Configurable model selection**: Choose between Nano Banana 2 Lite, Nano Banana 2, and Nano Banana Pro within the same node + +## Workflows + +### Text to Image + + + + Open in Comfy Cloud + + + Download JSON or search "Nano Banana 2 Lite" in Template Library + + + +Generate images from text descriptions. No file inputs required — just enter your prompt and the workflow produces one or more generated images with support for interleaved text and image inputs. + +![Nano Banana 2 Lite Text to Image](https://raw.githubusercontent.com/Comfy-Org/workflow_templates/main/output/api_nano_banana_2_lite_t2i.png) + +### Image Edit + + + + Open in Comfy Cloud + + + Download JSON or search "Nano Banana 2 Lite" in Template Library + + + Get the example input image for this workflow + + + +Upload an image and provide a text instruction to edit it. The workflow produces a side-by-side comparison of the original and edited result. + +## Which model should you pick? + +| Model | Best for | +|-------|----------| +| **Nano Banana 2 Lite** | Speed and cost — rapid iteration, high-throughput pipelines, low-latency applications | +| **Nano Banana 2** | Most creators — balanced quality and speed for general-purpose image generation and editing | +| **Nano Banana Pro** | Professional use cases — maximum quality, 4K generation, complex layouts and precise control | + +## Get started + +1. Update ComfyUI to the latest version +2. Double-click the canvas and search for the "Nano Banana 2" node (it includes Nano Banana 2 Lite as a model option) +3. Or go to the Template Library to use the ready-to-go workflow +4. Select "Nano Banana 2 Lite" from the model dropdown for fastest generation + + +Nano Banana 2 Lite is available within the existing Nano Banana 2 node. If you have old workflows using this node, you can select "Nano Banana 2 Lite" from the model version dropdown without rebuilding your workflow. + From a396bfaeecc4ced28685495ded63dcd6e13d107b Mon Sep 17 00:00:00 2001 From: lin-bot23 Date: Wed, 1 Jul 2026 18:51:29 +0800 Subject: [PATCH 2/5] docs: remove Limitations section from Gemini Omni Flash per feedback --- tutorials/partner-nodes/google/gemini-omni-flash.mdx | 6 ------ 1 file changed, 6 deletions(-) diff --git a/tutorials/partner-nodes/google/gemini-omni-flash.mdx b/tutorials/partner-nodes/google/gemini-omni-flash.mdx index 2f046bdca..c07c9cebb 100644 --- a/tutorials/partner-nodes/google/gemini-omni-flash.mdx +++ b/tutorials/partner-nodes/google/gemini-omni-flash.mdx @@ -70,12 +70,6 @@ Generate a video from two images using Gemini Omni Flash. Interpret natural lang Edit videos with natural language using Gemini Omni Flash. Transform a single input video into one edited output based on your descriptive instructions. Specify the duration and aspect ratio in your prompt. Ideal for quick social media remixes, cinematic scene adjustments, and iterative video refinements. -## Limitations - -- Currently supports 10-second video generations (longer durations coming soon) -- Audio references and scene extension are not yet supported in the API -- Character consistency has some limitations when changing scenes or panning movements - ## Get started 1. Update ComfyUI to the latest version From 4414431607d154f901d21c5b12976fdf89ac38c7 Mon Sep 17 00:00:00 2001 From: lin-bot23 Date: Wed, 1 Jul 2026 18:52:08 +0800 Subject: [PATCH 3/5] docs: link to existing Nano Banana 2 and Pro docs in comparison table --- tutorials/partner-nodes/google/nano-banana-2-lite.mdx | 4 ++-- 1 file changed, 2 insertions(+), 2 deletions(-) diff --git a/tutorials/partner-nodes/google/nano-banana-2-lite.mdx b/tutorials/partner-nodes/google/nano-banana-2-lite.mdx index 6ddaea478..6f4e71938 100644 --- a/tutorials/partner-nodes/google/nano-banana-2-lite.mdx +++ b/tutorials/partner-nodes/google/nano-banana-2-lite.mdx @@ -58,8 +58,8 @@ Upload an image and provide a text instruction to edit it. The workflow produces | Model | Best for | |-------|----------| | **Nano Banana 2 Lite** | Speed and cost — rapid iteration, high-throughput pipelines, low-latency applications | -| **Nano Banana 2** | Most creators — balanced quality and speed for general-purpose image generation and editing | -| **Nano Banana Pro** | Professional use cases — maximum quality, 4K generation, complex layouts and precise control | +| **[Nano Banana 2](/tutorials/partner-nodes/google/nano-banana-2)** | Most creators — balanced quality and speed for general-purpose image generation and editing | +| **[Nano Banana Pro](/tutorials/partner-nodes/google/nano-banana-pro)** | Professional use cases — maximum quality, 4K generation, complex layouts and precise control | ## Get started From ff0280a0b53ff9588857d042906bace5566d7d88 Mon Sep 17 00:00:00 2001 From: lin-bot23 Date: Wed, 1 Jul 2026 18:57:43 +0800 Subject: [PATCH 4/5] docs: add Image Edit before/after preview images to Nano Banana 2 Lite --- tutorials/partner-nodes/google/nano-banana-2-lite.mdx | 5 +++++ 1 file changed, 5 insertions(+) diff --git a/tutorials/partner-nodes/google/nano-banana-2-lite.mdx b/tutorials/partner-nodes/google/nano-banana-2-lite.mdx index 6f4e71938..f506b46d7 100644 --- a/tutorials/partner-nodes/google/nano-banana-2-lite.mdx +++ b/tutorials/partner-nodes/google/nano-banana-2-lite.mdx @@ -53,6 +53,11 @@ Generate images from text descriptions. No file inputs required — just enter y Upload an image and provide a text instruction to edit it. The workflow produces a side-by-side comparison of the original and edited result. +
+ Nano Banana 2 Lite Image Edit - Input + Nano Banana 2 Lite Image Edit - Output +
+ ## Which model should you pick? | Model | Best for | From 780e6b27a67c11484a0a23991e2bccb048ea3dfc Mon Sep 17 00:00:00 2001 From: lin-bot23 Date: Wed, 1 Jul 2026 18:59:38 +0800 Subject: [PATCH 5/5] i18n(zh,ja,ko): translate Nano Banana 2 Lite and Gemini Omni Flash tutorials --- docs.json | 12 ++- .../google/gemini-omni-flash.mdx | 85 +++++++++++++++++++ .../google/nano-banana-2-lite.mdx | 80 +++++++++++++++++ .../google/gemini-omni-flash.mdx | 85 +++++++++++++++++++ .../google/nano-banana-2-lite.mdx | 80 +++++++++++++++++ .../google/gemini-omni-flash.mdx | 85 +++++++++++++++++++ .../google/nano-banana-2-lite.mdx | 80 +++++++++++++++++ 7 files changed, 504 insertions(+), 3 deletions(-) create mode 100644 ja/tutorials/partner-nodes/google/gemini-omni-flash.mdx create mode 100644 ja/tutorials/partner-nodes/google/nano-banana-2-lite.mdx create mode 100644 ko/tutorials/partner-nodes/google/gemini-omni-flash.mdx create mode 100644 ko/tutorials/partner-nodes/google/nano-banana-2-lite.mdx create mode 100644 zh/tutorials/partner-nodes/google/gemini-omni-flash.mdx create mode 100644 zh/tutorials/partner-nodes/google/nano-banana-2-lite.mdx diff --git a/docs.json b/docs.json index e9cbde5ac..8026244bb 100644 --- a/docs.json +++ b/docs.json @@ -2991,8 +2991,10 @@ "group": "Google", "pages": [ "zh/tutorials/partner-nodes/google/gemini", + "zh/tutorials/partner-nodes/google/gemini-omni-flash", "zh/tutorials/partner-nodes/google/nano-banana-pro", - "zh/tutorials/partner-nodes/google/nano-banana-2" + "zh/tutorials/partner-nodes/google/nano-banana-2", + "zh/tutorials/partner-nodes/google/nano-banana-2-lite" ] }, { @@ -5544,8 +5546,10 @@ "group": "Google", "pages": [ "ja/tutorials/partner-nodes/google/gemini", + "ja/tutorials/partner-nodes/google/gemini-omni-flash", "ja/tutorials/partner-nodes/google/nano-banana-pro", - "ja/tutorials/partner-nodes/google/nano-banana-2" + "ja/tutorials/partner-nodes/google/nano-banana-2", + "ja/tutorials/partner-nodes/google/nano-banana-2-lite" ] }, { @@ -8175,8 +8179,10 @@ "group": "Google", "pages": [ "ko/tutorials/partner-nodes/google/gemini", + "ko/tutorials/partner-nodes/google/gemini-omni-flash", "ko/tutorials/partner-nodes/google/nano-banana-pro", - "ko/tutorials/partner-nodes/google/nano-banana-2" + "ko/tutorials/partner-nodes/google/nano-banana-2", + "ko/tutorials/partner-nodes/google/nano-banana-2-lite" ] }, { diff --git a/ja/tutorials/partner-nodes/google/gemini-omni-flash.mdx b/ja/tutorials/partner-nodes/google/gemini-omni-flash.mdx new file mode 100644 index 000000000..e1c3fc441 --- /dev/null +++ b/ja/tutorials/partner-nodes/google/gemini-omni-flash.mdx @@ -0,0 +1,85 @@ +--- +title: "Gemini Omni Flash: 会話型ビデオ生成" +description: "Gemini Omni Flashは、Googleのマルチモーダルビデオモデルです。パートナーノードを通じてComfyUIで利用でき、自然言語でビデオを生成・編集できます。" +sidebarTitle: "Gemini Omni Flash" +translationSourceHash: 6e1aa7a0 +translationFrom: tutorials/partner-nodes/google/gemini-omni-flash.mdx +--- + +import ReqHint from "/snippets/ja/tutorials/partner-nodes/req-hint.mdx"; +import UpdateReminder from "/snippets/ja/tutorials/update-reminder.mdx"; + +Gemini Omni Flashは、Google DeepMindの高品質でコスト効率の高いビデオ生成および会話型編集モデルです。Google I/O 2026でGemini Omniファミリーの一部として初めて発表され、Geminiのマルチモーダル推論とネイティブビデオ作成を組み合わせ、開発者が自然な会話を通じてビデオを生成、編集、リミックスできるようにします。 + + + + +## Gemini Omni Flashが提供する機能 + +- **会話型ビデオ編集**: 自然言語を使用してビデオを洗練・編集します。キャラクターの入れ替え、シーンの再照明、アングルの変更、オブジェクトの追加・削除が可能で、オリジナルのオーディオとビデオトラックは保持されます。 +- **マルチモーダル入力**: テキスト、画像、ビデオ入力を組み合わせて生成をガイドします。すべてのビデオ出力に同期されたオーディオをネイティブ生成します。 +- **世界知識とシミュレーション**: 物理理解とGeminiの歴史、科学、文化的背景に関する知識を組み合わせ、フォトリアリズムを超えた意味のあるストーリーテリングを実現します。 +- **テキストとアクションの同期**: ビデオに直接読みやすいテキストやグラフィックスをレンダリングし、動きのあるタイポグラフィを画面上の動きと同期させます。 +- **料金**: ビデオ出力1秒あたり0.10ドル。Veo 3.1 Fastと同じ料金設定です。 + +## ワークフロー + +### テキストから動画へ + + + + Comfy Cloudで開く + + + JSONをダウンロードするか、テンプレートライブラリで「Gemini Omni Flash」を検索 + + + +自然言語のプロンプトから映画的なビデオを生成します。テキストによる説明を、世界認識に基づく動き、照明、音声を備えたビデオ出力に変換します。ソーシャルメディアコンテンツ作成、迅速なビデオプロトタイピング、反復的なビジュアルストーリーテリングに最適です。 + +### 画像から動画へ + + + + Comfy Cloudで開く + + + JSONをダウンロードするか、テンプレートライブラリで「Gemini Omni Flash」を検索 + + + このワークフローで使用する例の入力画像を取得 + + + 2つ目のサンプル入力画像を取得 + + + +Gemini Omni Flashを使用して2枚の画像からビデオを生成します。自然言語のプロンプトを解釈して、再生時間とアスペクト比を制御します。短いブランドクリップ、ダイナミックなソーシャルメディアコンテンツ、会話型プロンプトによる反復的なビデオ編集に最適です。 + +### ビデオ編集 + + + + Comfy Cloudで開く + + + JSONをダウンロードするか、テンプレートライブラリで「Gemini Omni Flash」を検索 + + + このワークフローで使用する例の入力ビデオを取得 + + + +Gemini Omni Flashを使用して、自然言語でビデオを編集します。単一の入力ビデオを、説明文に基づいて1つの編集済み出力に変換します。プロンプトで再生時間とアスペクト比を指定します。ソーシャルメディアでの素早いリミックス、映画的なシーン調整、反復的なビデオの洗練に最適です。 + +## はじめる + +1. ComfyUIを最新バージョンにアップデートする +2. キャンバスをダブルクリックし、「Gemini Omni Flash」ノードを検索する +3. またはテンプレートライブラリから既製のワークフローを使用する +4. 入力タイプ(テキスト、画像、ビデオ)に合ったワークフローを選択する +5. プロンプトを入力して生成する + + +最良の結果を得るには、Gemini Omni FlashをNano Banana 2 Liteと組み合わせて使用してください。高速度で画像を生成し、その後Gemini Omni Flashでアニメーション化してビデオにします。 + \ No newline at end of file diff --git a/ja/tutorials/partner-nodes/google/nano-banana-2-lite.mdx b/ja/tutorials/partner-nodes/google/nano-banana-2-lite.mdx new file mode 100644 index 000000000..a4d9419d0 --- /dev/null +++ b/ja/tutorials/partner-nodes/google/nano-banana-2-lite.mdx @@ -0,0 +1,80 @@ +--- +title: "Nano Banana 2 Lite: 高速AI画像生成" +description: "ComfyUIのGemini 3.1 Flash-Lite ImageモデルであるNano Banana 2 Liteを使用して、Google最速・最低コストで画像を生成します" +sidebarTitle: "Nano Banana 2 Lite" +translationSourceHash: 1e93bcfa +translationFrom: tutorials/partner-nodes/google/nano-banana-2-lite.mdx +--- + +import ReqHint from "/snippets/ja/tutorials/partner-nodes/req-hint.mdx"; +import UpdateReminder from "/snippets/ja/tutorials/update-reminder.mdx"; + +Nano Banana 2 Liteは、Google DeepMindの最速かつ最もコスト効率の高いGemini Imageモデルです。迅速な発想と大量のワークフロー向けに設計されています。`gemini-3.1-flash-lite-image`を搭載し、約4秒・1画像あたり$0.034でテキストから画像への生成を実現。コンセプトの素早い可視化、高速プロトタイピング、反復的なデザイン探索に最適です。 + + + + +## Nano Banana 2 Liteの特長 + +- **超高速生成**: テキストから画像への出力をわずか4秒で実現。インタラクティブなプロトタイピングと迅速なビジュアルドラフトに最適です。 +- **コスト効率**: 1K解像度の画像1枚あたり$0.034 — Nano Bananaファミリーで最も手頃なオプションです。 +- **キャラクターの一貫性**: 複数の高速生成間でキャラクターのアイデンティティとオブジェクトの忠実性を維持します。 +- **画像内テキストレンダリング**: 生成画像に直接、読み取り可能なテキストをドラフトコピーしてレンダリングし、ローカライズされた広告バリエーションを作成できます。 +- **設定可能なモデル選択**: 同じノード内でNano Banana 2 Lite、Nano Banana 2、Nano Banana Proを切り替えられます。 + +## ワークフロー + +### テキストから画像へ + + + + Open in Comfy Cloud + + + Download JSON or search "Nano Banana 2 Lite" in Template Library + + + +テキストの説明から画像を生成します。ファイル入力は不要 — プロンプトを入力するだけで、ワークフローが1つ以上の生成画像を出力します。テキストと画像の入力を交互に使用することもできます。 + +![Nano Banana 2 Lite Text to Image](https://raw.githubusercontent.com/Comfy-Org/workflow_templates/main/output/api_nano_banana_2_lite_t2i.png) + +### 画像編集 + + + + Open in Comfy Cloud + + + Download JSON or search "Nano Banana 2 Lite" in Template Library + + + Get the example input image for this workflow + + + +画像をアップロードし、編集用のテキスト指示を入力します。ワークフローはオリジナルと編集結果の比較画像を並べて出力します。 + +
+ Nano Banana 2 Lite Image Edit - Input + Nano Banana 2 Lite Image Edit - Output +
+ +## どのモデルを選ぶべきか? + +| モデル | 最適な用途 | +|-------|----------| +| **Nano Banana 2 Lite** | 速度とコスト: 高速な反復、高スループットパイプライン、低レイテンシアプリケーション | +| **Nano Banana 2** | ほとんどのクリエイター向け: 汎用画像生成と編集において品質と速度のバランス | +| **Nano Banana Pro** | プロフェッショナルユースケース: 最高品質、4K生成、複雑なレイアウトと精密な制御 | + +## はじめる + +1. ComfyUIを最新バージョンにアップデートします +2. キャンバスをダブルクリックし、"Nano Banana 2"ノードを検索します(モデルオプションとしてNano Banana 2 Liteを含みます) +3. または、テンプレートライブラリに移動して、すぐに使えるワークフローを使用します +4. モデルドロップダウンから"Nano Banana 2 Lite"を選択すると最速の生成が可能です + + +Nano Banana 2 Liteは既存のNano Banana 2ノード内で利用できます。このノードを使用した古いワークフローがある場合、ワークフローを再構築せずにモデルバージョンのドロップダウンから"Nano Banana 2 Lite"を選択できます。 + \ No newline at end of file diff --git a/ko/tutorials/partner-nodes/google/gemini-omni-flash.mdx b/ko/tutorials/partner-nodes/google/gemini-omni-flash.mdx new file mode 100644 index 000000000..7d5786ca3 --- /dev/null +++ b/ko/tutorials/partner-nodes/google/gemini-omni-flash.mdx @@ -0,0 +1,85 @@ +--- +title: "Gemini Omni Flash: 대화형 비디오 생성" +description: "Gemini Omni Flash를 사용하여 자연어로 비디오를 생성하고 편집하세요. Google의 멀티모달 비디오 모델로, ComfyUI에서 파트너 노드를 통해 사용 가능합니다." +sidebarTitle: "Gemini Omni Flash" +translationSourceHash: 6e1aa7a0 +translationFrom: tutorials/partner-nodes/google/gemini-omni-flash.mdx +--- + +import ReqHint from "/snippets/ko/tutorials/partner-nodes/req-hint.mdx"; +import UpdateReminder from "/snippets/ko/tutorials/update-reminder.mdx"; + +Gemini Omni Flash는 Google DeepMind의 고품질, 비용 효율적인 비디오 생성 및 대화형 편집 모델입니다. Google I/O 2026에서 Gemini Omni 제품군의 일부로 처음 소개되었으며, Gemini의 멀티모달 추론과 네이티브 비디오 생성을 결합하여 개발자가 자연어 대화를 통해 비디오를 생성, 편집 및 리믹스할 수 있도록 합니다. + + + + +## Gemini Omni Flash가 제공하는 기능 + +- **대화형 비디오 편집**: 자연어를 사용하여 비디오를 다듬고 편집하세요. 캐릭터 교체, 장면 조명 변경, 각도 변경, 객체 추가 또는 제거를 수행하면서 원본 오디오 및 비디오 트랙을 유지합니다. +- **멀티모달 입력**: 텍스트, 이미지 및 비디오 입력을 결합하여 생성을 안내합니다. 모든 비디오 출력에 동기화된 오디오를 기본적으로 생성합니다. +- **세계 지식 및 시뮬레이션**: 물리 이해와 Gemini의 역사, 과학 및 문화적 맥락에 대한 지식을 결합하여 사실적 표현을 넘어 의미 있는 스토리텔링을 가능하게 합니다. +- **텍스트 및 동작 동기화**: 읽기 쉬운 텍스트와 그래픽을 비디오에 직접 렌더링하여 동적 타이포그래피를 화면 움직임과 동기화합니다. +- **가격**: 비디오 출력 초당 $0.10, Veo 3.1 Fast 가격과 동일 + +## 워크플로 + +### 텍스트 기반 비디오 생성 + + + + Comfy Cloud에서 열기 + + + JSON 다운로드 또는 템플릿 라이브러리에서 "Gemini Omni Flash" 검색 + + + +자연어 프롬프트로 시네마틱 비디오를 생성합니다. 텍스트 설명을 세계 인식 모션, 조명 및 사운드가 포함된 비디오 출력으로 변환합니다. 소셜 미디어 콘텐츠 생성, 빠른 비디오 프로토타이핑 및 반복적인 시각적 스토리텔링에 이상적입니다. + +### 이미지 기반 비디오 생성 + + + + Comfy Cloud에서 열기 + + + JSON 다운로드 또는 템플릿 라이브러리에서 "Gemini Omni Flash" 검색 + + + 이 워크플로의 예제 입력 이미지 가져오기 + + + 두 번째 예제 입력 이미지 가져오기 + + + +Gemini Omni Flash를 사용하여 두 이미지로 비디오를 생성합니다. 자연어 프롬프트를 해석하여 지속 시간과 화면 비율을 제어합니다. 짧은 브랜드 클립, 다이나믹한 소셜 미디어 콘텐츠 제작 및 대화형 프롬프트를 통한 반복적인 비디오 편집에 적합합니다. + +### 비디오 편집 + + + + Comfy Cloud에서 열기 + + + JSON 다운로드 또는 템플릿 라이브러리에서 "Gemini Omni Flash" 검색 + + + 이 워크플로의 예제 입력 비디오 가져오기 + + + +Gemini Omni Flash를 사용하여 자연어로 비디오를 편집합니다. 하나의 입력 비디오를 설명 지침에 따라 하나의 편집된 출력으로 변환합니다. 프롬프트에서 지속 시간과 화면 비율을 지정합니다. 빠른 소셜 미디어 리믹스, 시네마틱 장면 조정 및 반복적인 비디오 다듬기에 이상적입니다. + +## 시작하기 + +1. ComfyUI를 최신 버전으로 업데이트하세요. +2. 캔버스를 더블 클릭하고 "Gemini Omni Flash" 노드를 검색하세요. +3. 또는 템플릿 라이브러리에서 바로 사용할 수 있는 워크플로를 사용하세요. +4. 입력 유형(텍스트, 이미지 또는 비디오)에 맞는 워크플로를 선택하세요. +5. 프롬프트를 입력하고 생성하세요. + + +최상의 결과를 위해 Gemini Omni Flash를 Nano Banana 2 Lite와 결합하세요: 고속으로 이미지를 생성한 다음, Gemini Omni Flash를 사용하여 비디오로 애니메이션화하세요. + \ No newline at end of file diff --git a/ko/tutorials/partner-nodes/google/nano-banana-2-lite.mdx b/ko/tutorials/partner-nodes/google/nano-banana-2-lite.mdx new file mode 100644 index 000000000..d60f05f49 --- /dev/null +++ b/ko/tutorials/partner-nodes/google/nano-banana-2-lite.mdx @@ -0,0 +1,80 @@ +--- +title: "Nano Banana 2 Lite: 빠른 AI 이미지 생성" +description: "ComfyUI에서 Gemini 3.1 Flash-Lite Image 모델인 Nano Banana 2 Lite를 사용하여 Google의 가장 빠른 속도와 가장 낮은 비용으로 이미지를 생성하세요." +sidebarTitle: "Nano Banana 2 Lite" +translationSourceHash: 1e93bcfa +translationFrom: tutorials/partner-nodes/google/nano-banana-2-lite.mdx +--- + +import ReqHint from "/snippets/ko/tutorials/partner-nodes/req-hint.mdx"; +import UpdateReminder from "/snippets/ko/tutorials/update-reminder.mdx"; + +Nano Banana 2 Lite는 Google DeepMind의 가장 빠르고 비용 효율적인 Gemini Image 모델로, 빠른 아이디어 구상과 대용량 워크플로를 위해 설계되었습니다. `gemini-3.1-flash-lite-image`를 기반으로 하여 텍스트 기반 이미지 생성을 약 4초 만에 이미지당 $0.034의 비용으로 제공하므로, 신속한 개념 시각화, 빠른 프로토타이핑, 반복적인 디자인 탐색에 이상적입니다. + + + + +## Nano Banana 2 Lite의 기능 + +- **초고속 생성**: 텍스트 기반 이미지 출력을 단 4초 만에 제공하여 대화형 프로토타이핑 및 신속한 시각적 초안 작성에 적합합니다. +- **비용 효율성**: 1K 해상도 이미지당 $0.034로 책정되어 Nano Banana 제품군 중 가장 저렴한 옵션입니다. +- **캐릭터 일관성**: 여러 번의 빠른 생성에서 캐릭터 정체성과 객체 충실도를 유지합니다. +- **이미지 내 텍스트 렌더링**: 생성된 이미지에 직접 읽을 수 있는 텍스트를 초안 복사 및 렌더링하여 지역화된 광고 변형을 만듭니다. +- **구성 가능한 모델 선택**: 동일한 노드 내에서 Nano Banana 2 Lite, Nano Banana 2 및 Nano Banana Pro 중에서 선택할 수 있습니다. + +## 워크플로 + +### 텍스트 기반 이미지 생성 + + + + Comfy Cloud에서 열기 + + + JSON 다운로드 또는 템플릿 라이브러리에서 "Nano Banana 2 Lite" 검색 + + + +텍스트 설명에서 이미지를 생성합니다. 파일 입력이 필요 없으며, 프롬프트를 입력하면 워크플로가 하나 이상의 생성된 이미지를 출력하고, 텍스트와 이미지 입력을 혼합하여 사용할 수 있습니다. + +![Nano Banana 2 Lite 텍스트 기반 이미지 생성](https://raw.githubusercontent.com/Comfy-Org/workflow_templates/main/output/api_nano_banana_2_lite_t2i.png) + +### 이미지 편집 + + + + Comfy Cloud에서 열기 + + + JSON 다운로드 또는 템플릿 라이브러리에서 "Nano Banana 2 Lite" 검색 + + + 이 워크플로의 예제 입력 이미지 다운로드 + + + +이미지를 업로드하고 편집할 텍스트 명령을 입력합니다. 워크플로는 원본과 편집된 결과를 나란히 비교하여 보여줍니다. + +
+ Nano Banana 2 Lite 이미지 편집 - 입력 + Nano Banana 2 Lite 이미지 편집 - 출력 +
+ +## 어떤 모델을 선택해야 할까요? + +| 모델 | 적합한 용도 | +|-------|----------| +| **Nano Banana 2 Lite** | 속도와 비용: 빠른 반복, 높은 처리량 파이프라인, 저지연 애플리케이션 | +| **[Nano Banana 2](/ko/tutorials/partner-nodes/google/nano-banana-2)** | 대부분의 크리에이터: 일반 목적의 이미지 생성 및 편집을 위한 균형 잡힌 품질과 속도 | +| **[Nano Banana Pro](/ko/tutorials/partner-nodes/google/nano-banana-pro)** | 전문 사용 사례: 최고 품질, 4K 생성, 복잡한 레이아웃 및 정밀 제어 | + +## 시작하기 + +1. ComfyUI를 최신 버전으로 업데이트하세요. +2. 캔버스를 더블 클릭하고 "Nano Banana 2" 노드를 검색하세요(이 노드에는 모델 옵션으로 Nano Banana 2 Lite가 포함되어 있습니다). +3. 또는 템플릿 라이브러리로 이동하여 즉시 사용 가능한 워크플로를 이용하세요. +4. 가장 빠른 생성을 위해 모델 드롭다운에서 "Nano Banana 2 Lite"를 선택하세요. + + +Nano Banana 2 Lite는 기존 Nano Banana 2 노드 내에서 사용할 수 있습니다. 이 노드를 사용하는 이전 워크플로가 있는 경우 워크플로를 다시 빌드하지 않고 모델 버전 드롭다운에서 "Nano Banana 2 Lite"를 선택할 수 있습니다. + \ No newline at end of file diff --git a/zh/tutorials/partner-nodes/google/gemini-omni-flash.mdx b/zh/tutorials/partner-nodes/google/gemini-omni-flash.mdx new file mode 100644 index 000000000..e6ce5a394 --- /dev/null +++ b/zh/tutorials/partner-nodes/google/gemini-omni-flash.mdx @@ -0,0 +1,85 @@ +--- +title: "Gemini Omni Flash:对话式视频生成" +description: "通过合作节点在 ComfyUI 中使用 Google 的多模态视频模型 Gemini Omni Flash,以自然语言生成和编辑视频" +sidebarTitle: "Gemini Omni Flash" +translationSourceHash: 6e1aa7a0 +translationFrom: tutorials/partner-nodes/google/gemini-omni-flash.mdx +--- + +import ReqHint from "/snippets/zh/tutorials/partner-nodes/req-hint.mdx"; +import UpdateReminder from "/snippets/zh/tutorials/update-reminder.mdx"; + +Gemini Omni Flash 是 Google DeepMind 推出的高质量、经济高效的视频生成与对话式编辑模型。该模型于 Google I/O 2026 作为 Gemini Omni 家族成员首次亮相,将 Gemini 的多模态推理能力与原生的视频创建功能结合,使开发者能够通过自然对话生成、编辑和重新混合视频。 + + + + +## Gemini Omni Flash 提供的功能 + +- **对话式视频编辑**:使用自然语言精炼和编辑视频——替换角色、重新布光、改变角度、添加或移除物体,同时保留原始音视频轨道 +- **多模态输入**:结合文本、图像和视频输入来引导生成。每次输出视频时原生生成同步音频 +- **世界知识与模拟**:将物理理解与 Gemini 在历史、科学及文化背景方面的知识相结合,实现超越照片真实感的有意义叙事 +- **文本与动作同步**:直接在视频中渲染清晰文本和图形,使动态排版与屏幕上的运动同步 +- **定价**:每秒钟视频输出 $0.10,与 Veo 3.1 Fast 定价一致 + +## 工作流 + +### 文本转视频 + + + + 在 Comfy Cloud 中打开 + + + 下载 JSON,或在模板库中搜索“Gemini Omni Flash” + + + +根据自然语言提示生成电影级视频。将文本描述转换为具有世界感知的运动、光照和声音的视频输出。非常适合社交媒体内容创作、快速视频原型制作以及迭代式视觉叙事。 + +### 图像转视频 + + + + 在 Comfy Cloud 中打开 + + + 下载 JSON,或在模板库中搜索“Gemini Omni Flash” + + + 获取此工作流的示例输入图像 + + + 获取第二张示例输入图像 + + + +使用 Gemini Omni Flash 从两张图像生成视频。解释自然语言提示以控制时长和画面比例。非常适合制作简短品牌剪辑、动态社交媒体内容,以及通过对话式提示进行迭代视频编辑。 + +### 视频编辑 + + + + 在 Comfy Cloud 中打开 + + + 下载 JSON,或在模板库中搜索“Gemini Omni Flash” + + + 获取此工作流的示例输入视频 + + + +使用 Gemini Omni Flash 以自然语言编辑视频。根据描述性指令将单个输入视频转换为经过编辑的输出。在提示中指定时长和画面比例。非常适合快速社交媒体混剪、电影场景调整以及迭代视频精修。 + +## 开始使用 + +1. 将 ComfyUI 更新到最新版本 +2. 双击画布,搜索“Gemini Omni Flash”节点 +3. 或者进入模板库,使用现成的工作流 +4. 选择与输入类型(文本、图像或视频)匹配的工作流 +5. 输入提示并生成 + + +为获得最佳效果,可将 Gemini Omni Flash 与 Nano Banana 2 Lite 组合使用:先高速生成图像,再用 Gemini Omni Flash 将它们动画化为视频。 + \ No newline at end of file diff --git a/zh/tutorials/partner-nodes/google/nano-banana-2-lite.mdx b/zh/tutorials/partner-nodes/google/nano-banana-2-lite.mdx new file mode 100644 index 000000000..d4becff91 --- /dev/null +++ b/zh/tutorials/partner-nodes/google/nano-banana-2-lite.mdx @@ -0,0 +1,80 @@ +--- +title: "Nano Banana 2 Lite:快速 AI 图像生成" +description: "使用 Nano Banana 2 Lite(ComfyUI 中的 Gemini 3.1 Flash-Lite Image 模型)以谷歌最快速度和最低成本生成图像" +sidebarTitle: "Nano Banana 2 Lite" +translationSourceHash: 1e93bcfa +translationFrom: tutorials/partner-nodes/google/nano-banana-2-lite.mdx +--- + +import ReqHint from "/snippets/zh/tutorials/partner-nodes/req-hint.mdx"; +import UpdateReminder from "/snippets/zh/tutorials/update-reminder.mdx"; + +Nano Banana 2 Lite 是 Google DeepMind 速度最快、成本效益最高的 Gemini Image 模型,专为快速构思和高吞吐量工作流而设计。该模型基于 `gemini-3.1-flash-lite-image`,可在约 4 秒内以每张 $0.034 的价格完成文生图,非常适合快速概念可视化、快速原型设计和迭代式设计探索。 + + + + +## Nano Banana 2 Lite 的功能 + +- **超快生成**:文生图输出仅需 4 秒,专为交互式原型设计和快速视觉草拟而构建 +- **成本高效**:每张 1K 分辨率图像仅需 $0.034 —— Nano Banana 系列中最经济的选择 +- **角色一致性**:在多次快速生成中保持角色身份和物体保真度 +- **图像内文本渲染**:将草稿文案和可读文本直接渲染到生成的图像中,用于本地化广告变体 +- **可配置模型选择**:在同一节点中选择 Nano Banana 2 Lite、Nano Banana 2 和 Nano Banana Pro + +## 工作流 + +### 文本转图像 + + + + 打开 Comfy Cloud + + + 下载 JSON 或在模板库中搜索“Nano Banana 2 Lite” + + + +根据文本描述生成图像。无需文件输入 —— 只需输入提示词,工作流即可生成一张或多张已生成图像,并支持交错文本和图像输入。 + +![Nano Banana 2 Lite 文本转图像](https://raw.githubusercontent.com/Comfy-Org/workflow_templates/main/output/api_nano_banana_2_lite_t2i.png) + +### 图像编辑 + + + + 打开 Comfy Cloud + + + 下载 JSON 或在模板库中搜索“Nano Banana 2 Lite” + + + 获取此工作流的示例输入图像 + + + +上传图片并提供文本指令进行编辑。工作流将生成原始结果和编辑结果的并排对比。 + +
+ Nano Banana 2 Lite 图像编辑 - 输入 + Nano Banana 2 Lite 图像编辑 - 输出 +
+ +## 如何选择模型 + +| 模型 | 最佳用途 | +|------|----------| +| **Nano Banana 2 Lite** | 速度和成本 —— 快速迭代、高吞吐量管道、低延迟应用 | +| **[Nano Banana 2](/zh/tutorials/partner-nodes/google/nano-banana-2)** | 大多数创作者 —— 在常规文生图和编辑中平衡质量与速度 | +| **[Nano Banana Pro](/zh/tutorials/partner-nodes/google/nano-banana-pro)** | 专业用例 —— 最高质量、4K 生成、复杂布局和精确控制 | + +## 开始使用 + +1. 更新 ComfyUI 至最新版本 +2. 双击画布并搜索“Nano Banana 2”节点(其中包含 Nano Banana 2 Lite 作为模型选项) +3. 或者前往模板库使用即用工作流 +4. 从模型下拉菜单中选择“Nano Banana 2 Lite”以获得最快生成 + + +Nano Banana 2 Lite 可在现有的 Nano Banana 2 节点中使用。如果你有使用此节点的旧工作流,可以从模型版本下拉菜单中选择“Nano Banana 2 Lite”,而无需重建工作流。 + \ No newline at end of file