Skip to content

Latest commit

 

History

History
582 lines (445 loc) · 28.3 KB

File metadata and controls

582 lines (445 loc) · 28.3 KB

FramePack-eichi 擴充文檔 | 日本語 | English | Русский

本文件是 FramePack-eichi 主 README 的詳細版本,提供了有關每個功能和配置的詳細資訊。有關更實用的使用方法,請參閱使用指南,更新歷史請參閱更新日誌

🌟 進階設定

模型選擇(v1.9.1新增)

  • F1模型:正向生成方式、更動態的運動、簡單操作
  • 標準模型:逆向生成方式、精確控制、功能豐富

F1模型的特點和優勢

  • 正向生成方式:以正常生成方向(從頭到尾)生成直觀的動作
  • 簡單界面:省略區段(關鍵幀圖像)和Final(最終幀)功能
  • 動作豐富性:比標準版更容易生成動態動作
  • 適合初學者:設置較少,操作直觀
  • Image影響度:用於控制初次區段中Image的變化度(可調範圍100.0%至102.0%)

標準模型的特點和優勢

  • 逆向生成方式:從最終幀反向計算生成的獨特方法
  • 功能豐富界面:允許詳細設置的複雜UI
  • 關鍵幀控制:使用Image、Final和區段圖像進行精細控制
  • 適合高級用戶:通過詳細設置實現高度控制

關鍵幀設定 ※nirvash新增功能

  • Image:主要的起始關鍵幀
  • Final Frame:最終幀(可選)
  • 區段設定:可為每個區段設定關鍵幀圖像和提示詞

關鍵幀自動複製功能 ※v1.7強化

  • 紅框(區段0):自動複製到所有偶數區段(0,2,4,6...)
  • 藍框(區段1):自動複製到所有奇數區段(1,3,5,7...)
  • 可透過核取方塊開啟/關閉
  • 這樣只需2個關鍵幀設定即可覆蓋所有區段

區段專屬提示詞 ※v1.2新增【測試功能】

  • 可為每個區段設定獨立的提示詞
  • 區段專屬提示詞僅在該區段生成時使用
  • 空白時使用通用提示詞
  • 注意:此功能為測試功能,效果無法保證

PNG元數據功能 ※v1.9.1新增

  • 自動在生成圖像中嵌入提示詞、種子值和區段信息
  • 可從已保存的圖像中檢索設置
  • 與SD系列工具兼容的標準元數據格式
  • 分享圖像時也可同時分享設置信息

FP8優化 ※v1.9.1新增

  • 使用8位浮點格式降低LoRA應用時的VRAM使用量
  • 通過RTX 40系列GPU的scaled_mm優化提高性能
  • 建議默認禁用(在某些環境中可能導致警告或錯誤)

Hunyuan LoRA設定 ※v1.3新增,v1.9大幅改進

  • 「使用LoRA」核取方塊:切換LoRA的啟用/停用
  • LoRA檔案選擇:選擇要使用的LoRA檔案
  • 應用強度滑桿:在0.0〜1.0範圍內調整LoRA的影響程度
  • 格式:v1.9起統一為HunyuanVideo格式,提升兼容性
  • 注意:使用Hunyuan LoRA時,進度條開始前會有讀取等待時間,整體處理時間會變長
  • v1.9引入kohya-ss/FramePack-LoRAReady代碼,高VRAM模式和低VRAM模式使用相同的直接應用方式,大幅提高穩定性

輸出資料夾設定 ※v1.2新增

  • 可指定輸出資料夾名稱
  • 「儲存並開啟輸出資料夾」按鈕可同時儲存設定和開啟資料夾
  • 設定在應用程式重新啟動時也會保留

MP4 壓縮設定 ※從 1.6.2 版本合併而來

  • 滑桿範圍從 0 到 100(0 = 無壓縮,16 = 默認,值越高 = 壓縮越多,品質越低)
  • 數字越小,品質越高,但檔案大小越大。
  • 如果出現黑屏,將其設為 16 可能會解決問題。

FramePack-eichi畫面3

🧠 關鍵幀圖像設定的機制與思路

FramePack 的工作原理

FramePack最大的特點是其獨特的影片生成方式:「從未來到過去」。傳統的影片生成AI都是從第一幀開始依序生成,因此影片越長,畫質越容易下降,一致性也越低。

FramePack 首先從輸入影像產生最終幀,然後向後建立每個幀。即使是長影片也能保持高品質和一致性。

F1模型則是採用傳統方向(從頭到尾)進行生成。 這使得創建動態動作更加容易,但設置的複雜性大幅簡化。

FramePack-eichi的擴充功能

FramePack-eichi透過策略性地配置多個關鍵幀圖像,進一步提升品質:

  1. 防止最終區段的劇烈變化

    • 原始endframe中僅在最後1秒區段設定圖像時,在最終區段(最初1秒附近)會出現圖像突然變化的問題
    • FramePack-eichi採取了在所有區段都加入關鍵幀圖像的簡單粗暴方法
    • 特別重要的關鍵幀用紅框強調顯示,設定這些圖像後會自動複製
    • 如前所述,FramePack從最終區段開始生成影片,因此區段排列和關鍵幀設定也是從最後開始
    • 在6秒模式下,FramePack可能來不及發揮全力就結束循環,無法到達循環模式的關鍵幀圖像
    • 8秒模式下,圖像的過渡比6秒模式更平緩
    • 無論哪種情況(包括後述的多場景模式),圖像差異越大,動作變化越大,可以生成更流暢的動作
  2. 循環功能的最佳化

    • 在循環模式下,第一個關鍵幀會自動複製到Final Frame
    • 從v1.5.1開始,一般模式中從輸入圖像的複製處理已停止,僅在循環模式中啟用圖像複製
    • 在關鍵幀圖像1中設定循環的起始姿勢,可以創建流暢的循環影片
  3. 區段專屬提示詞設定:※v1.2新增【測試功能】

    • 為每個區段設定獨特的提示詞,可以在各區段實現不同的動作和表現
    • 例如,可以自然表現「走路」→「坐下」→「揮手」等動作變化
    • 提示詞的影響很微妙,但與關鍵幀圖像結合使用會更有效
  4. 短影片模式的添加:※v1.6.1新增

    • 支援1秒、2秒、3秒、4秒的短影片模式
    • 設定每個模式的節數和最佳化的複製模式
    • 啟用針對短影片表現的專門控制

F1模型的差異(v1.9.1新增)

F1模型與標準版有以下主要差異:

  1. 正向生成方法

    • 從第一幀順序生成,實現更自然的動作轉換
    • 區段(關鍵幀圖像)和Final(endframe)功能變得不必要
  2. 界面簡化

    • 僅設置「Image」圖像
    • 通過「Image影響度」滑桿(100.0%至102.0%)調整初始區段的變化程度
  3. 操作性和結果

    • 使用更少的設置即可獲得高品質結果
    • 產生更多動作和動態影像
    • 操作簡單,適合初學者使用

基本關鍵幀圖像的關係(標準版)

Image(輸入圖像)、Final Frame(最終幀)與關鍵幀圖像的關係

  1. 優先順序
    • 基本上,除了最後一節,圖像都是根據前面的部分線性生成的。
    • 如果此部分設定了關鍵影格影像,則將使用它。如果不是,則將使用從其他影像推斷出的中間狀態。
    • **如果在最後一節設定了關鍵影格影像,則它將優先於影像。 **

這種結構使得可以進行細緻的區段控制,實現更自然且連貫的動作。

v1.7的革新:紅框/藍框關鍵幀系統

v1.7大幅改進了關鍵幀圖像的複製功能,引入了更高效且直覺的系統:

  1. 紅框/藍框視覺區分

    • 紅框(區段0):自動複製到所有偶數區段(0,2,4,6...)
    • 藍框(區段1):自動複製到所有奇數區段(1,3,5,7...)
  2. 關鍵幀設定效率化

    • 僅需2個關鍵幀設定即可覆蓋所有區段
    • 以前需要為每個區段單獨設定,現在透過模式化自動複製大幅提高效率
  3. 動態區段數對應

    • 根據選擇的影片長度和幀大小精確計算區段數
    • 自動調整複製目標以符合計算出的區段數
  4. 核取方塊靈活控制

    • 可選擇性地啟用/停用自動複製功能
    • 提供更細緻的控制選項

該系統大大減少了設定關鍵影格所需的工作量,尤其是在製作長影片(超過 10 秒)時。

設定提示的技巧

提示設定與關鍵影格影像同樣重要:

  1. 提示的基本結構
  • 依照主題 → 動作 → 其他元素的順序進行寫作是有效的。
  • 例如:The character walks gracefully, with clear movements, across the room.
  1. 動畫的指定程度:
  • 無示範:基本動畫生成
  • 簡易動畫:即使是 moves back and forth, side to side 也能產生基本動畫。
  • 工具動效影片:如果您指定諸如 dances powerfully, with clear movements, full of energy 等細節,則會產生額外的動效影片。
  1. 注意事項
  • 使用暗示大動作的詞語,例如“跳舞”,可能會導致動作比你預期的更誇張。
  • 實用提示範例:
    • 穩定的動作:The character breathes calmly, with subtle body movements.
    • 中程度的動作:The character walks forward, gestures with hands, with natural posture.
    • 複雜的動作:The character performs dynamic movements with energy and flowing motion.
  1. 提示深層結構(LLAMA 和 CLIP 分離):
  • 在 FramePack 內部,提示由兩種不同的模型處理:

  • LLAMA 模型(限制 256 個 token)

    • 負責文本的詳細理解和上下文處理
    • 用於控制影片的整體內容和順序
    • 預計字元數:約 1000-1300 個字元(英文)或 200-400 個字元(日文)
    • 參與控制場景的脈絡和敘事
  • CLIP 模型(限制 77 個 token)

    • 專門用於將圖像與文字關聯的模型
    • 影響視訊畫面特定視覺特徵的生成
    • 預計字元數:約 300-400 個字元(英文)或 50-150 個字元(日文)
    • 參與控制風格、主題和視覺屬性
  1. 撰寫有效提示的策略
  • 前 300-400 個字元(英文)/50-150 個字元(日文)

    • LLAMA 和 CLIP 均涉及的重要“視覺部分”。
    • 包括主要視覺元素、風格、主題和整體基調。
    • 範例:A young woman with long flowing hair, cinematic lighting, detailed facial features, soft expressions, gentle movements
  • 後者 600-900 個字元(英語)/150-250 個字元(日文)

    • 僅由 LLAMA 處理的“敘事部分”。
    • 您可以在此處撰寫動作細節、場景背景和序列訊息。
    • 例如:The camera slowly pans from left to right. The woman gradually turns her head, her expressions changing from neutral to a slight smile. There is a sense of emotional buildup as if emotional music is playing in the background.
  1. 如何使用特定章節提示:※新增於 v1.2 [測試實作]
  • 特定章節提示應簡短,並專注於該章節的重要操作
  • 清晰、具體的指示比長句更有效
  • 例:第 1 節“行走動作”,第 2 節“坐下動作”,第 3 節“揮手動作”
  • 注意:章節提示的效果微妙,務必將其與圖片設定結合
  1. F1模型提示詞(v1.9.1)
  • 明確指定動作的表達尤其有效
  • 具體指定情感表達和動作速度也能獲得良好結果
  • 例如:A character enthusiastically dancing with dynamic movements, arms swinging freely, head nodding to the rhythm, full of energy and life
  1. LoRA 使用:※v1.3新增,v1.9改進
  • LoRA 的選擇和呈現組合可透過特定樣式或表達方式進行增強
  • LoRA 效果傳輸強度調節(0.1-0.3 為細微,0.5-0.8 為顯著)
  • 配對提示詞和 LoRA 選擇可最大程度提高效率

選擇有效的差異影像

FramePack 產生的視訊品質很大程度上取決於關鍵影格影像的選擇。選擇理想差異影像的重點:

  1. 最佳差異等級

    • 差異過小:使用幾乎相同的影像(即所謂的「智慧差異」)幾乎不會產生任何運動。
    • 差異過大:使用完全不相關的影像將無法產生自然的運動。
    • 理想差異:最佳差異是AI能夠找到相關變化的差異,例如同一角色的不同姿勢。
  2. 保持相關性

  • 例如,簡單地水平翻轉影像會被 AI 識別為完全不同的影像,並且不會產生自然的移動。
  • 臉部方向、手部位置、身體姿勢等的變化是理想的差異元素。
  • 盡可能保持背景和服裝的一致性,使 AI 能夠專注於角色的動作。
  • 諷刺的是,圖像生成 AI 根據相似提示創建的角色的波動,正是理想的差異元素之一。
  1. 理想的差異影像特徵
  • 同一角色,姿勢略有變化
  • 面部表情細微變化(例如,從面無表情到微笑。然而,如果面部位置不變,則動作較弱)
  • 姿勢變化伴隨手和手臂的自然運動
  • 頭部方向逐漸變化
  1. 實驗方法
  • 選擇差異圖像更具藝術性而非科學性,因此反覆試驗至關重要。
  • 從相似姿勢的差異開始,逐步調整差異大小是有效的。
  • 記錄成功的組合,並將它們應用到未來的作品中。
  1. ** 影像生成 AI 與不同影像組合 **:
  • 當不存在理想的差異影像時,可使用影像產生 AI 產生相同角度的不同姿勢。
  • 當前句子中指定的姿勢變化將導致迴避程度發生變化,因此實際的自然動作也會發生變化。

這種結構化的方法有助於我們充分利用兩種模型的優勢並產生更具表現力的影片。

F1的Image影響度 vs 標準版的EndFrame影響度和All Padding

F1模型的Image影響度(v1.9.1)

F1模型引入了一個名為「Image影響度」的新參數:

作用對象:這直接調整初始區段中Image的變化程度

技術機制

  • 設置範圍非常窄,從100.0%到102.0%
  • 設置為100.0%時保持對Image的忠實度
  • 隨著接近102.0%,動作減少,接近靜止狀態

效果

  • 100.0%時,生成自然動作
  • 約101.0%時,初始幀的變化更加漸進
  • 102.0%時,幾乎不生成動作

標準版的EndFrame影響度和All Padding

標準版FramePack-eichi有兩個重要功能來控制視頻動作:「EndFrame影響度調整」和「All Padding」。雖然這兩個看起來很相似,但它們的運作原理和效果完全不同。

兩個函數的根本區別

FramePack-eichi 有兩個重要的函數用來控制影片的動態。 “EndFrame 影響調整”和“All Padding”。雖然乍看之下這兩個函數似乎很相似,但它們的工作原理和效果卻完全不同。

1. EndFrame 影響調整(v1.3 版本引入)

影響:這會直接改變最終幀本身的強度。

技術機制

  • 將最後一幀的潛在表示與指定值精確相乘
  • 程式碼實作為 modified_end_frame_latent = end_frame_latent * end_frame_strength
  • 值範圍從 0.01 到 1.00,預設值為 1.00(無變化)

效果

  • 將數值從 1.0 降低到 0.5,將使最後一幀的「整體」影響精確減半
  • 值為 0.3,將使最後一格的「整體」影響精確減半 30%
  • 減少最後一格的直接影響,以便第一幀(輸入影像)的特徵更快地顯現
2. 所有填充(v1.4 中引入)

作用:這會改變各部分之間的連接方式

技術機制

  • 通常情況下,各部分之間的填充值會自動計算為 [3, 2, 2, 2, 1, 0]
  • 啟用所有填滿後,此值將統一為您指定的單一值(例如 [1.5, 1.5, 1.5, 1.5, 1.5, 0]
  • 值的範圍為 0.2 到 3.0,標準值為 1.0
  • 最後一個部分(第 0 個部分)始終強制為 0

效果

  • 較高的值(例如 1.5)會使每個部分更強烈地引用前一個部分,從而導致變化較少。
  • 較低的值(例如 0.5)會使每個部分更弱地引用前一個部分,從而導致變化較多。
  • 變化量的「分佈」會發生變化,但框架的整體強度不會改變。

類比解釋具體差異

為了使為了更容易理解這些差異,我們將用三個類比來解釋:

音樂類比

  • EndFrame Influence:這就像調整管弦樂團「主旋律的音量」。 0.5 的音量相當於將整個主旋律的音量減半。
  • All Padding:它調整「每個樂章之間過渡的平滑度」。值越大,過渡越平滑,值越小,每個樂章之間的變化越突兀。

烹飪類比

  • EndFrame Influence:這就像調整「主要調味料的用量」。如果將醬汁本身的用量設定為 0.5,食材的原味自然會更濃鬱。
  • All Padding:它調整在每個烹飪步驟中保留前一道工序風味的程度。數值越高,每個工序的特性就會融合得更緊密,數值越低,每個工序就會擁有各自獨特的風味。

漸層類比

  • 結束畫面影響:這就像在從紅色到藍色的漸變中調整「紅色原色的強度」。紅色強度為 0.5 時,漸層顏色將從淺紅色(接近粉紅色)變為藍色。
  • 所有填滿:使用相同的漸層調整「顏色混合」。值較高時,從紅色到藍色的過渡是漸進且堆疊的,而值較低時,從紅色到紫色再到藍色的過渡是突然的。

補充技術說明

即使在原始碼層面,這兩個函數的操作也完全不同:

// 實作 EndFrame 影響調整
// 直接乘以最後一幀本身的潛在表示

if end_frame_strength != 1.0:
    modified_end_frame_latent = end_frame_latent * end_frame_strength
    history_latents[:, :, 0:1, :, :] = modified_end_frame_latent
else:
    history_latents[:, :, 0:1, :, :] = end_frame_latent
// 實作所有填充
// 使用統一值覆寫各部分之間的填滿數組

if use_all_padding:
    padding_value = round(all_padding_value, 1) # 固定為小數點後一位
    latent_paddings = [padding_value] * total_latent_sections
    # 最後一段強制為 0
    latent_paddings[-1] = 0
else:
    # 正常填充值計算
    latent_paddings = reversed(range(total_latent_sections))
    if total_latent_sections > 4:
        latent_paddings = [3] + [2] * (total_latent_sections - 3) + [1, 0]

這樣,EndFrame influence 只是簡單地將最終幀本身的潛在表示相乘,而 All Padding 則執行了一個最佳化過程,用相同的值重寫每個部分之間的填充數組。

組合效果

這兩個參數的工作方式完全不同,因此您可以如下組合它們:

  1. EndFrame Influence 0.5 + Normal Padding
  • 最後一格的影響減半
  • 各部位之間的過渡正常
  • 結果:從最後一幀到第一幀的過渡整體更快
  1. EndFrame Influence 1.0 + All Padding 1.5
  • 最後一幀的影響正常
  • 各部分之間的過渡更平滑
  • 結果:部分劃分更不明顯,過渡更純粹
  1. EndFrame Influence 0.3 + All Padding 0.5
  • 最後一幀的影響大為減弱
  • 各部分變得更獨立,變化量增加
  • 結果:創造出非常活躍的動作和快速的變化

EndFrame Influence 和 All Padding 選擇指南

根據場景:

合適的 EndFrame Influence 值
  • 差異較大影像:0.3-0.6(實現漸層)
  • 差異中等:0.5-0.8(過渡均衡)
  • 差異較小:0.8-1.0(接近標準效果)
  • 臉部表情變化:0.7-0.8(過渡自然)
  • 肢體和手部動作較大:0.3-0.5(中間畫面較自然)
所有 padding 的適當值
  • 平滑過渡:1.5-2.0(純過渡,片段邊界不明顯)
  • 標準動作:1.0(過渡均衡)
  • 主動動作:0.5-0.7(每個片段變化較大)
  • 極端動作: 0.2-0.4(產生非常活躍且難以預測的運動)
實用技巧
  • Influence 0.5 + 所有填充 0.5:如果您想要更動態的運動
  • Influence 0.3 + 短模式:用於創建快速變化的循環動畫
  • Influence 0.8 + 長模式:用於表達緩慢變化的平緩運動
  • 非常低的影響 (0.01-0.1):思維模式的改變,幾乎忽略了最後一幀,而將第一幀作為“目標”
  • 較高的所有填充值(2.0 或更高)+ Influence 0.5:降低最後一幀的影響,同時不突出片段邊界
調整過程和實驗。環境
  • 先使用預設值 (1.0) 生成
  • 如果運動不自然,請嘗試將值降低到 0.7 左右
  • 如果需要進一步調整,請嘗試使用 0.5、0.3 等值線。
  • 僅更改相同影像對的影響度以進行比較和驗證也是有效的。
  • 為了探索結果,請嘗試更改所有填充值,這將使您更接近指定的運動效果。

EndFrame 影響度和填充值之間的關係就像烹飪中「開始時使用的調味料量」和「每個過程中參考上一步的量」。透過適當結合兩者,您可以實現理想的運動效果。

🛠️ 設定資訊

基本設定(Windows 系統為 bat 檔案)

  • 連接埠設定--port 參數(預設值:8001)

    • WebUI 使用的連接埠號碼
    • 如果與其他應用程式衝突,請更改
  • 伺服器位址--server 參數(預設值:'127.0.0.1')

    • 如果在本地網路內訪問,請更改為 0.0.0.0
  • 自動啟動瀏覽器--inbrowser 選項

    • 啟動時自動開啟瀏覽器

性能設定

  • GPU 記憶體預留設定gpu_memory_preservation 滑桿(預設值:9GB)※現有功能

    • 值越小 = 顯示佔用越多 = 處理速度越快
    • 值越大 = 顯示佔用越少 = 運作更穩定
    • 運作原理:數值越小,為 Transformer 模型釋放的記憶體越多
    • 計算方法:工具可用的記憶體大小(保證至少 6GB)等於工具可用的記憶體大小(保證至少 6GB)
    • 範例:對於 16GB 顯示記憶體,如果加上餘裕並將其設為 14GB,則將使用“14-(10-6)=10GB”
    • 如果將其設為下限 6GB,則將使用“14-(6-6)=14GB”,這幾乎是最大值(1 個部分的處理時間會減少約 10 秒,並且存在記憶體交換的風險)
    • 建議值:
      • 8GB 記憶體:7-8GB
      • 12GB 記憶體:6-8GB
      • 16GB 或以上:約 6GB
    • 注意:如果您同時執行其他應用程序,請增加此值。
    • 此工具會預留 3GB 內存,以便其他影像產生工具在背景運行,從而防止內存交換。
    • 如果您使用的是 LoRA,建議您預留更多記憶體。
  • 高記憶體模式:自動偵測(v1.5.1:60GB 或以上,v1.6:100GB 或以上可用記憶體)*功能改進

    • 啟用後:模型始終保留在 GPU 上,減少記憶體傳輸開銷
    • 效果:處理速度提升高達 20%
    • 在 v1.6 中,標準值已提高,現在大多數環境中都使用低 VRAM 模式
    • 低 VRAM 模式採用與高 VRAM 模式相同的直接應用方法,提高了功能的一致性

生成設定

  • 幀大小設定frame_size 下拉選單(預設值:1 秒)※v1.5 新增

    • 0.5 秒:產生 0.5 秒的畫面。片段數量和處理時間幾乎會翻倍。
    • 在 All-Budding 0 模式下,您可以透過為每個畫面影像添加差異來創建更激烈的運動。
    • 1 秒:產生 1 秒的畫面。
  • 步數steps 滑桿(預設值:25)※現有功能

    • 增加該值可以提高質量,但處理時間也會相應增加。
    • 建議範圍:20-30(20 通常可以獲得幾乎相同的品質)
    • 15 或更低:品質明顯下降
  • TeaCacheuse_teacache 複選框(預設:啟用)※現有功能

    • 啟用:處理速度提升約 15-20%
    • 副作用:手和指尖等精細細節可能會略有下降
    • 用途:建議用於一般視訊生成,當精細細節很重要時停用
  • 隨機種子值seed 輸入一個值或勾選「使用隨機種子」複選框 ※由 nirvash 新增

    • 相同的種子值 = 可重複的結果
    • 隨機種子:每次產生不同的動作
    • 注意:即使種子相同,如果提示或影像發生變化,結果也會發生變化
  • 精煉 CFG 比例gs 滑桿(預設值:10.0)※現有功能

    • 精煉引導比例值
    • 值越小,移動越自由(與提示偏差越大)
    • 值越大,移動越忠實於提示(移動可能會受到限制)
    • 建議:保留預設值(進階使用者可以更改)
  • MP4 壓縮設定mp4_crf 滑桿(預設值:16)*與 v1.6.2 中的原版合併

    • 範圍:0-100(0=無壓縮,100=最大壓縮)
    • 數字越小,影片品質越高,但檔案大小也越大
    • 數字越大,壓縮率越高,檔案大小越小,但影像品質越低
    • 如果您遇到黑屏問題,請將其設為 16 以解決問題
    • 用途:低值 (0-10) 用於存儲,中等值 (16-30) 用於網路共享

LoRA 設定(v1.3 新增,v1.6 改進)

  • 使用 LoRAuse_lora 複選框(預設為停用)

    • 啟用:使用 LoRA 檔案自訂模型
    • 使用 LoRA 時,計數器啟動前的等待時間可能會更長。
  • LoRA 檔案lora_file 檔案選擇元件

    • 指定要使用的 LoRA 文件
    • 支援格式:僅 FramePack 格式(已在 v1.3.2 版本中驗證)
  • LoRA 強度lora_strength 滑桿(預設值:0.8)

    • 範圍:0.0 至 1.0
    • 值較小:影響較小
    • 值較大:影響較大
    • 最佳值因 LoRA 檔案而異
  • LoRA 格式:單選按鈕

    • HunyuanVideo:適用於 Hunyuan Video 的 LoRA 格式
    • Diffusers:Diffusers 格式的 LoRA

幀設置

  • 影片長度:單選按鈕 + total_second_length 滑桿 *獨特功能擴展

    • 1 秒:超短影片(約 30 幀 @ 30fps) - v1.5.1 版本新增
    • 2 秒:短片(約 60 幀 @ 30fps) - v1.6.1 版本新增
    • 3 秒:短片(約 90 幀 @ 30fps) - v1.6.1 版本新增
    • 4 秒:短片(約 120 幀 @ 30fps) - v1.6.1 版本新增
    • 6 秒:標準模式(約 180 幀 @ 30fps)
    • 8 秒:擴展模式(約 240 幀 @ 30fps)
    • 10 秒:複合視訊(約 300 幀 @ 30fps)
    • 12 秒:複合視訊(約 360 幀 @ 30fps)
    • 16 秒:複合視訊(約 480 幀 @ 30fps)
    • 20 秒:複合視訊(約 600 幀 @ 30fps)
  • 自動關鍵影格複製enable_keyframe_copy 複選框(預設:停用 - 在 v1.5.1 中變更)※獨特功能

    • 啟用:關鍵影格影像自動複製到其他部分
    • 停用:每個關鍵影格必須單獨設置
    • 用途:設計複雜動作的進階使用者可以停用此功能

輸出設定

  • 輸出資料夾:輸出資料夾設定欄位(預設值:outputs)※v1.2 新增

    • 用於保存生成的影片和圖片的目標位置
    • 您可以在輸入欄位中直接輸入資料夾名稱
    • 您可以使用「開啟已儲存和輸出資料夾」按鈕開啟資料夾
    • 設定以 JSON 格式儲存,即使重新啟動後仍會保留
  • 儲存章節靜態影像:勾選 save_section_frames 複選框(預設為停用)※nirvash 新增的功能

    • 啟用:每個章節的最後一幀將儲存為靜態影像
    • 用途:當您想檢查每個章節之間的連接時非常有用
  • 儲存片段影片:勾選 keep_section_videos 複選框(預設為停用)※獨特功能

    • 啟用:每個片段的影片檔案都會被保留,如果您點擊「結束」按鈕,影片檔案也會保留。
    • 停用:僅儲存最終完成的影片(中間檔案會被刪除),因此請小心不要將其放入回收站。
    • 用途:當您想單獨查看每個片段的進度時非常有用。

提示符號管理

  • 儲存預設:「儲存」按鈕

    • 使用名稱儲存目前提示符
    • 使用空名稱儲存,將其設定為啟動時的預設提示符
  • 套用預設:「套用」按鈕

    • 將所選預設的提示符號套用到目前生成設定
  • 預設管理

    • 刪除:刪除不需要的預設(預設預設無法刪除)
    • 清除:清除編輯字段

FP8優化設定(v1.9.1新增)

  • FP8優化:核取方塊(預設:停用)
    • 啟用時:應用使用8位浮點格式的量化
    • 效果:顯著降低VRAM使用量,在RTX 40系列GPU上也能提高處理速度
    • 注意:在某些環境中可能會導致警告或錯誤
    • 建議:通常保持停用,僅在低VRAM環境中使用LoRA時考慮啟用

PNG元數據設定(v1.9.1新增)

  • 元數據嵌入:自動啟用
    • 自動在生成圖像中保存提示詞、種子值和區段信息
    • 與SD系列工具兼容的標準元數據格式
    • 分享圖像時也可同時分享設置信息

Docker設定(v1.9.1新增)

  • 語言選擇:在docker-compose.yml中用command參數設定

    # 日文:
    command: ["--lang", "ja"]
    
    # 繁體中文:
    command: ["--lang", "zh-tw"]
    
    # 英文(預設):
    command: ["--lang", "en"]
  • 卷設定:在docker-compose.yml中用volumes參數設定

    volumes:
      - ./data:/app/framepack/data
      - ./models:/app/framepack/hf_download
      - ./outputs:/app/framepack/outputs
    • data:配置文件等的存儲位置
    • models:下載模型的放置位置
    • outputs:生成視頻的存儲位置