Skip to content

Latest commit

 

History

History
650 lines (484 loc) · 30.5 KB

File metadata and controls

650 lines (484 loc) · 30.5 KB

FramePack-eichi | 日本語 | English | Русский

Ask DeepWiki

FramePack-eichi 是基於 lllyasviel 的 lllyasviel/FramePack 分支,由 nirvash 的 nirvash/FramePack 開發的功能增強版本。在 nirvash 的開創性改進基礎上,增加了許多細緻的功能。此外,從 v1.9 開始,在 Kohya Tech 的許可下,引入了 kohya-ss/FramePack-LoRAReady 的代碼,大幅提升了 LoRA 功能的性能和穩定性。

📘 名稱的由來

Endframe Image CHain Interface (EICHI)

  • Endframe: 強化和最佳化終端幀功能
  • Image: 改善關鍵幀圖像處理和視覺回饋
  • CHain: 複數的關鍵幀間的連接和關係的強化
  • Interface: 直感性的使用者體驗和 UI/UX 的提升

「eichi」是日本語的「睿智」(深刻的智慧、英知)的表達,代表著 AI 技術的進化和人間創造性的的融合,象征著本專案的哲學。 即現地世界範圍內叡智的差分幀製作改修規格。叡智已經跨越海洋!

感謝您 https://github.com/hinablue Hina Chen 對多語言支援的協助。

🌟 新功能:FramePack-oichi 添加 (v1.9.2)

FramePack-eichi v1.9.2引入了一個新功能「FramePack-oichi」。這是一個從單一輸入圖像預測生成下一幀未來圖像的專用工具。

FramePack-oichi 截圖

🤔 什麼是 FramePack-oichi?

  • 單幀推論:僅生成下一幀,而非整個視頻
  • 輕量級處理:比常規視頻生成更輕便快速,允許快速確認結果
  • 用戶友好:簡單的UI設計,即使初學者也能直觀操作
  • 多語言支持:完全支持日語、英語和繁體中文

💡 使用場景

  • 創意探索:快速查看「圖像可能如何移動」
  • 資源節省:與完整視頻生成相比,使用更少的資源處理
  • 連續生成:可以將生成的圖像作為輸入再次使用,構建多幀序列

🚀 啟動方式

提供專用啟動腳本:

  • 日語版:run_oneframe_ichi.bat
  • 英語版:run_oneframe_ichi_en.bat
  • 繁體中文版:run_oneframe_ichi_zh-tw.bat

🌟 新功能:F1 模型添加 (v1.9.1)

FramePack-eichi v1.9.1 在傳統的逆向生成模型「FramePack-eichi」(標準版)基礎上,添加了一個支持正向生成的新模型「FramePack-eichi F1」。

FramePack-eichi畫面1

🆚 F1 模型和標準模型的區別

特點 F1 模型 標準模型
生成方向 正向生成(從首到尾) 逆向生成(從尾到首)
動作特點 動作更多,結果更直觀 可進行更精確的控制
UI 元素 簡化設計 可使用詳細設定
易用性 適合初學者,更直觀 適合高級用戶,可進行複雜控制
關鍵幀 僅使用 Image Image、Final、分段圖像
啟動方式 run_endframe_ichi_f1.bat run_endframe_ichi.bat

💡 應該選擇哪一個?

  • 初次使用或想要簡單操作的用戶 → 推薦使用 F1 模型

    • 更容易獲得自然流暢的動態效果
    • 設定項目較少,操作更直觀
    • 通過專用啟動腳本(run_endframe_ichi_f1.bat)使用
  • 想要更高級控制或有經驗的用戶 → 推薦使用 標準模型

    • 可使用多個關鍵幀圖像進行細致控制
    • 可使用分段提示詞等高級功能
    • 通過傳統啟動腳本(run_endframe_ichi.bat)使用

注意: 首次啟動 F1 模型時,除了標準模型外,還會下載約 24GB 的額外模型。標準模型也會被保留,您可以在兩者之間切換使用。

🌟 主要功能

  • 高品質影片生成:從單一圖像生成自然流暢的影片 ※現有功能
  • F1 模型支持:支持正向生成的新模型,實現更直觀的影片創建 ※v1.9.1 新增
  • 靈活的影片長度設定:支援 1-20 秒的各個區段模式 ※獨特功能
  • 區段幀大小設定:可切換 0.5 秒模式和 1 秒模式 ※v1.5 新增
  • 全填充功能:所有區段使用相同的填充值 ※v1.4 新增
  • 多區段支援:可在多個區段指定關鍵幀圖像,實現複雜動畫 ※nirvash 新增功能
  • 區段專用提示詞設定:可為每個區段指定獨立的提示詞 ※v1.2 新增
  • 紅框/藍框關鍵幀圖像高效複製:僅需兩個關鍵幀即可覆蓋所有區段 ※v1.7 新增
  • 張量數據保存與合併:可保存影片的潛在表示,並合併多個影片 ※v1.8 新增
  • 提示詞管理功能:輕鬆保存、編輯和重用提示詞 ※v1.3 新增
  • PNG 元數據嵌入:自動記錄生成圖像中的提示詞、種子值和分段信息 ※v1.9.1 新增
  • Hunyuan/FramePack LoRA 支援:通過模型自定義添加獨特表現 ※v1.9/v1.9.1 大幅改進
  • FP8 優化:降低 LoRA 應用時的 VRAM 使用量並優化處理速度 ※v1.9.1 新增
  • MP4 壓縮設定:可調整影片檔案大小與品質的平衡 ※v1.6.2 從主版本合併
  • 輸出資料夾管理功能:支援指定輸出資料夾和與作業系統無關的開啟方式 ※v1.2 新增
  • 多語言支援(i18n):支援日語、英語、繁體中文的 UI ※v1.8.1 新增
  • Docker 支持:在容器化環境中輕鬆運行 FramePack-eichi ※v1.9.1 新增

FramePack-eichi畫面2

分段設定畫面 FramePack-eichi畫面3

📚 相關文檔

📝 最新更新資訊 (v1.9.2)

主要變更

1. 「FramePack-oichi」新功能添加

  • 下一幀預測:從單一輸入圖像預測生成下一幀未來圖像的新功能
  • 專用啟動腳本:添加了run_oneframe_ichi.bat和其他語言版本
  • 輕量便捷:比常規視頻生成更輕便,可快速查看下一幀
  • 完整多語言支持:完全支持日語、英語和中文

2. 幀圖像保存功能

  • 幀保存選項:添加保存所有生成幀圖像的選項
  • 靈活選擇:可選擇保存所有分段的所有幀或僅保存最終分段的幀
  • 更易可視化:使中間視頻過程的可視化和作為素材資源的使用更加容易

3. 分段信息批量管理增強

  • ZIP文件批量下載:添加了通過ZIP文件批量下載分段信息的功能
  • 高效多項目管理:更高效地管理和備份多個項目
  • 批量上傳支持:支持批量上傳開始圖像、結束圖像和分段信息(提示詞、圖像)

4. LoRA功能增強

  • 同時使用多個LoRA:支持同時使用三個LoRA
  • 目錄選擇默認:默認從目錄選擇,能夠選擇/webui/lora文件夾中的LoRA
  • 全模式支持:在所有模式(標準版、F1版、oneframe版)中支持LoRA功能增強

5. VAE緩存功能(基於furusu研究)

  • 逐幀VAE解碼:通過逐幀VAE解碼提高處理速度 - 基於furusu的研究FramePack實現
  • 靈活平衡調整:可調整內存使用量和處理速度之間的平衡
  • 輕鬆開關切換:從設置屏幕簡單切換
  • 無默認影響:默認為關閉,因此除非啟用否則沒有影響
  • 性能提升:通過利用幀間獨立性的計算緩存實現高達30%的速度提升

📝 更新資訊 (v1.9.1)

主要變更

1. F1 模型添加

  • 新的正向生成模型:引入了支持正常生成方向(從首到尾)的 "FramePack_F1_I2V_HY_20250503" 模型
  • 簡化的界面:F1 模型中移除了分段(關鍵幀圖像)和 Final(終端幀)功能
  • 專用啟動腳本:添加了 run_endframe_ichi_f1.bat 和多語言版本腳本
  • 圖像影響度調整:添加了控制首個分段中初始圖像變化程度的功能(可在 100.0% 至 102.0% 範圍內調整)

2. 記憶體管理優化

  • 增強的模型管理:通過 transformer_manager.pytext_encoder_manager.py 實現高效記憶體管理
  • FP8 優化:通過 8 位浮點格式減少 LoRA 應用時的 VRAM 使用量
  • RTX 40 系列 GPU 優化:通過 scaled_mm 優化提升性能

3. PNG 元數據功能

  • 元數據嵌入:自動在生成圖像中保存提示詞、種子值和分段信息
  • 元數據提取:能夠從保存的圖像中檢索設置
  • 與 SD 工具兼容:通過標準元數據格式實現與其他工具的兼容性

4. 剪貼板支持增強

  • 統一支持:標準版的 Image 和 Final 以及 F1 版的 Image 均支持剪貼板功能

5. 批量分段信息添加功能

  • ZIP 文件導入:可通過 zip 文件批量設置分段圖像和提示詞
  • 自動分段配置:基於 zip 文件中的編號圖像和 YAML 配置文件自動設置
  • 組合支持:批量註冊起始幀、結束幀以及每個分段圖像和提示詞

6. Docker 支持增強

  • 容器化環境:使用 Dockerfile 和 docker-compose.yml 實現簡單設置
  • 多語言支持:支持多種語言(日語、英語、中文)的容器鏡像

📝 更新資訊 (v1.9)

主要變更

1. 導入 kohya-ss/FramePack-LoRAReady

  • LoRA 功能顯著改進:在 Kohya Tech 許可下,提高了 LoRA 應用的穩定性和一致性
  • 高 VRAM 模式和低 VRAM 模式統一:兩種模式採用相同的直接應用方式
  • 代碼複雜性降低:通過使用共同的 load_and_apply_lora 函數提高可維護性
  • 廢棄 DynamicSwap 掛鉤方法:完全過渡到更穩定的直接應用方式

2. 標準化為 HunyuanVideo 格式

  • LoRA 格式標準化:統一為 HunyuanVideo 格式,提高不同格式之間的兼容性

📝 更新資訊 (v1.8.1)

主要變更

1. 多語言支援(i18n)的實現

  • 支援語言:支援日語、英語、繁體中文三種語言
  • 語言切換:可通過以下執行檔切換語言
    • run_endframe_ichi.bat - 日語版(預設)
    • run_endframe_ichi_en.bat - 英語版
    • run_endframe_ichi_zh-tw.bat - 繁體中文版
  • UI 國際化:按鈕、標籤、訊息等幾乎所有 UI 元素都已多語言化
  • 顯示語言保存:可通過命令行參數選擇語言(例如:--lang en

📝 更新資訊 (v1.8)

主要變更

1. 張量數據合併功能的添加

  • 張量數據保存功能:將生成的影片的潛在表示(張量數據)以 .safetensors 格式保存
  • 張量數據合併:將保存的張量數據合併到新生成影片的「後方(末尾)」

2. VAE 解碼處理的優化

  • 分塊處理方式的引入:將大型張量分割成小塊進行高效處理
  • 記憶體效率的提升:通過 GPU 和 CPU 之間的明確數據移動,減少記憶體使用量
  • 相容性的強化:通過設備和類型的明確調整提高穩定性

3. 中間檔案管理的改進

  • 中間檔案的自動刪除:自動檢測和刪除合併處理過程中生成的中間檔案
  • 刪除檔案的 feedback:明確顯示已刪除檔案的資訊

MP4 合併處理的詳細說明

  1. 自動合併流程:當張量數據被合併時,對應的 MP4 影片也會自動合併
  2. 中間處理檔案:合併處理過程中會暫時生成「{檔案名稱}combined_interim{編號}.mp4」的中間檔案,處理完成後會自動刪除
  3. 原始檔案的保存:同時保存生成的原始影片檔案「{檔案名稱}.mp4」和合併影片「{檔案名稱}_combined.mp4」
  4. 分塊處理的優化:即使是大型 MP4 檔案也能高效處理,在控制記憶體使用量的同時實現高品質合併
  5. 進度顯示:合併處理過程中會在 UI 上顯示進度,可以確認處理進行到哪個階段

張量數據的使用方法

張量數據保存功能

  1. 進行一般的影片生成設定(上傳圖像、輸入提示詞等)
  2. 勾選 「保存張量數據」 核取方塊(在 UI 右側新增)
  3. 點擊 「開始生成」 按鈕生成影片
  4. 生成完成時,除了影片(.mp4)外,還會保存張量數據(.safetensors)
  5. 保存的張量數據會以與原始影片相同的檔案名稱(副檔名不同)保存在輸出資料夾中

張量數據合併功能

  1. 「張量數據上傳」 欄位上傳已保存的 .safetensors 檔案
  2. 照常設定圖像和提示詞,點擊 「開始生成」 按鈕
  3. 新影片生成後,會自動生成將上傳的張量數據合併到「後方(末尾)」的影片
  4. 合併後的影片會以「原始檔案名稱_combined.mp4」的形式保存
  5. 如果開啟了張量數據保存,合併後的張量數據也會被保存

MP4 合併處理的詳細說明

  1. 自動合併流程:當張量數據被合併時,對應的 MP4 影片也會自動合併
  2. 中間處理檔案:合併處理過程中會暫時生成「{檔案名稱}combined_interim{編號}.mp4」的中間檔案,處理完成後會自動刪除
  3. 原始檔案的保存:同時保存生成的原始影片檔案「{檔案名稱}.mp4」和合併影片「{檔案名稱}_combined.mp4」
  4. 分塊處理的優化:即使是大型 MP4 檔案也能高效處理,在控制記憶體使用量的同時實現高品質合併
  5. 進度顯示:合併處理過程中會在 UI 上顯示進度,可以確認處理進行到哪個階段

應用場景

  • 長時間影片的分割生成:將超出 GPU 記憶體限制的長影片分成多個會話生成
  • 影片的連續性:跨越多個會話創建具有一致性的長影片
  • 現有影片的擴展:在之前生成的影片中添加新場景
  • 實驗性生成:保存幀,作為新生成的起點重複使用

終點和關鍵幀圖像的持續性問題(正在處理中)

部分用戶報告了以下問題,目前正在考慮對策:

  • 生成中斷後重新開始生成時,終點和關鍵幀圖像可能不會被使用
  • 刪除圖像後重新上傳可以解決問題,但在開始生成前很難發現問題
  • 如果確認存在此問題,請關閉圖像後重新上傳
  • 在 v1.5.1 中,已修改為在按下 Start 按鈕時明確重新獲取圖像

Hunyuan LoRA對應情況

暫定對應狀態:

  • 在 v1.6 中,LoRA 應用邏輯已統一,高 VRAM 模式和低 VRAM 模式使用相同的直接應用方式
  • VRAM 管理的基準值已更改(60GB→100GB),使更多用戶可以在低 VRAM 模式下運行
  • 使用時 VRAM 16GB 可能稍顯緊張,但處理本身比開始前的磁碟讀取時間更短。建議使用較多記憶體
  • 也收到了一些關於在高 VRAM 電腦上無法正常運行的詢問,正在考慮進行根本性檢討

💻 安裝方法

必要條件

  • Windows 10/11(Linux/Mac也可能支援基本功能)
  • NVIDIA GPU(建議RTX 30/40系列,最低8GB VRAM)
  • CUDA Toolkit 12.6
  • Python 3.10.x
  • 最新版NVIDIA GPU驅動程式

※ Linux支援在v1.2得到加強,並添加了開啟功能,但部分功能可能有限制。

步驟

安裝官方套件

首先需要安裝原始的FramePack。

  1. 官方FramePack下載Windows一鍵安裝包。 點擊「Click Here to Download One-Click Package (CUDA 12.6 + Pytorch 2.6)」。

  2. 解壓下載的套件,執行update.bat後再執行run.bat啟動。 執行update.bat很重要。如果不執行,可能會使用包含潛在錯誤的舊版本。

  3. 首次啟動時會自動下載所需模型(約30GB)。 如果已有下載好的模型,請放置在framepack\webui\hf_download資料夾中。

  4. 此時可以運行,但如果未安裝加速庫(Xformers、Flash Attn、Sage Attn),處理速度會較慢。

    Currently enabled native sdp backends: ['flash', 'math', 'mem_efficient', 'cudnn']
    Xformers is not installed!
    Flash Attn is not installed!
    Sage Attn is not installed!
    

    處理時間差異:※RAM:32GB、RXT4060Ti(16GB)的情況

    • 未安裝加速庫時:約4分46秒/25步驟
    • 安裝加速庫時:約3分17秒〜3分25秒/25步驟
  5. 要安裝加速庫,請從Issue #138下載package_installer.zip,解壓後在根目錄執行package_installer.bat(在命令提示字元中按Enter)。

  6. 重新啟動確認加速庫是否安裝成功:

    Currently enabled native sdp backends: ['flash', 'math', 'mem_efficient', 'cudnn']
    Xformers is installed!
    Flash Attn is not installed!
    Sage Attn is installed!
    

    作者執行時,Flash Attn未安裝。 注意:即使未安裝Flash Attn,對處理速度影響很小。測試結果顯示,Flash Attn的有無造成的速度差異很小,「Flash Attn is not installed!」狀態下約3分17秒/25步驟,與全部安裝時(約3分25秒/25步驟)幾乎相同。 Xformers是否安裝影響最大。

安裝FramePack-eichi

  1. 將執行檔放置在 FramePack 的根目錄中:

    • run_endframe_ichi.bat - 標準版/日語用(預設)
    • run_endframe_ichi_en.bat - 標準版/英語用
    • run_endframe_ichi_zh-tw.bat - 標準版/繁體中文用
    • run_endframe_ichi_f1.bat - F1版/日語用(v1.9.1新增)
    • run_endframe_ichi_en_f1.bat - F1版/英語用(v1.9.1新增)
    • run_endframe_ichi_zh-tw_f1.bat - F1版/繁體中文用(v1.9.1新增)
    • run_oneframe_ichi.bat - 單幀推論/日語用(v1.9.2新增)
    • run_oneframe_ichi_en.bat - 單幀推論/英語用(v1.9.2新增)
    • run_oneframe_ichi_zh-tw.bat - 單幀推論/繁體中文用(v1.9.2新增)
  2. 將以下檔案和資料夾放在webui資料夾中:

    • endframe_ichi.py - 標準版主應用程式檔案
    • endframe_ichi_f1.py - F1版主應用程式檔案(v1.9.1新增)
    • oneframe_ichi.py - 單幀推論版主應用程式檔案(v1.9.2新增)
    • eichi_utils 資料夾 - 工具模組
      • __init__.py
      • frame_calculator.py - 幀大小計算模組
      • keyframe_handler.py - 關鍵幀處理模組
      • keyframe_handler_extended.py - 關鍵幀處理模組
      • preset_manager.py - 預設管理模組
      • settings_manager.py - 設定管理模組
      • tensor_combiner.py - 張量合併模組(v1.8新增)
      • ui_styles.py - UI樣式定義模組(v1.6.2新增)
      • video_mode_settings.py - 影片模式設定模組
      • png_metadata.py - PNG元數據模組(v1.9.1新增)
      • text_encoder_manager.py - 文本編碼器管理模組(v1.9.1新增)
      • transformer_manager.py - 轉換器模型管理模組(v1.9.1新增)
      • section_manager.py - 分段信息管理模組(v1.9.2新增)
      • vae_cache.py - VAE緩存模組(v1.9.2新增)
      • README_vae_cache.md - VAE緩存功能說明(v1.9.2新增)
    • lora_utils 資料夾 - LoRA相關模組
      • __init__.py
      • dynamic_swap_lora.py - LoRA管理模組(為兼容性保留)
      • lora_loader.py - LoRA載入模組
      • lora_check_helper.py - LoRA應用狀態確認模組
      • lora_utils.py - LoRA狀態字典合併和轉換功能(v1.9新增)
      • fp8_optimization_utils.py - FP8優化功能(v1.9.1新增)
    • diffusers_helper 資料夾 - 模型記憶體管理改進工具
      • memory.py - 提供記憶體管理功能
      • bucket_tools.py - 解析度桶功能(v1.9.1新增)
      • 注意:此目錄替換原始工具的源文件,請根據需要進行備份
    • locales 資料夾 - 多語言支援模組
      • i18n.py - 國際化(i18n)功能的核心實現
      • i18n_extended.py - 擴展國際化功能(v1.9.1新增)
      • ja.json - 日語翻譯檔案(預設語言)
      • en.json - 英語翻譯檔案
      • zh-tw.json - 繁體中文翻譯檔案
  3. 執行所需版本和語言的執行檔,FramePack-eichi 的 WebUI 將以對應設定啟動:

    • 標準版/日語:run_endframe_ichi.bat
    • 標準版/英語:run_endframe_ichi_en.bat
    • 標準版/繁體中文:run_endframe_ichi_zh-tw.bat
    • F1版/日語:run_endframe_ichi_f1.bat(v1.9.1新增)
    • F1版/英語:run_endframe_ichi_en_f1.bat(v1.9.1新增)
    • F1版/繁體中文:run_endframe_ichi_zh-tw_f1.bat(v1.9.1新增)

    或者,也可以從命令行直接指定語言啟動:

    python endframe_ichi.py --lang en  # 以標準版/英語啟動
    python endframe_ichi_f1.py --lang zh-tw  # 以F1版/繁體中文啟動

Docker 安裝

FramePack-eichi 可以通過 Docker 輕鬆設置,在不同系統之間提供一致的環境。

Docker 安裝前提條件
  • 系統已安裝 Docker
  • 系統已安裝 Docker Compose
  • NVIDIA GPU(至少 8GB VRAM,推薦 RTX 30/40 系列)
Docker 設置步驟
  1. 語言選擇: Docker 容器默認以英文啟動。您可以通過修改 docker-compose.yml 中的 command 參數來更改:

    # 日文:
    command: ["--lang", "ja"]
    
    # 繁體中文:
    command: ["--lang", "zh-tw"]
    
    # 英文(默認):
    command: ["--lang", "en"]
  2. 構建並啟動容器:

    # 構建容器(首次或 Dockerfile 更改後)
    docker-compose build
    
    # 啟動容器
    docker-compose up

    要在後台運行(分離模式):

    docker-compose up -d
  3. 訪問 Web 界面: 容器運行後,通過以下地址訪問 Web 界面:

    http://localhost:7861
    
  4. 首次運行注意事項:

    • 首次運行時,容器將下載必要的模型(約 30GB)
    • 初始啟動期間可能會看到「h11 錯誤」(請參閱故障排除部分)
    • 如果您已經下載了模型,請將它們放在 ./models 目錄中

Linux安裝方法

在Linux上,可以按照以下步驟執行:

  1. 下載並放置上述必要檔案和資料夾。
  2. 在終端機中執行以下命令:
    python endframe_ichi.py

Google Colab 安裝方法

Mac(mini M4 Pro) 安裝方法

🚀 使用方法

基本動畫生成 ※既存功能

  1. 上傳圖片: 「Image」 框中上傳圖片
  2. 輸入提示詞: 輸入角色動作提示詞
  3. 設定調整: 調整動畫長度和種子值
  4. 開始生成: 「開始生成」 按鈕點擊

高級設定

  • 生成模式選擇: ※獨自功能

    • 通常模式: 一般動畫生成
    • 循環模式: 最終幀返回最初幀的循環動畫
  • 所有邊距選擇: ※v1.4 添加、此值越小1次會動畫越激烈

    • 所有邊距: 所有區段使用同一邊距值
    • 邊距值: 0~3 的整數值
  • 影片長度設定:※獨有功能的擴展

    • 1~20秒

    繼續閱讀

🛠️ 配置資訊

FP8 優化設定 (v1.9.1)

  • FP8 優化: 使用 8 位浮點格式降低 LoRA 應用時的 VRAM 使用量
  • RTX 40 系列 GPU: 通過 scaled_mm 優化加速
  • 預設為關閉: 啟用時可在低 VRAM 環境下更易使用 LoRA

語言設定

  1. 通過執行檔選擇語言:

    • run_endframe_ichi.bat - 標準版/日語(預設)
    • run_endframe_ichi_en.bat - 標準版/英語
    • run_endframe_ichi_zh-tw.bat - 標準版/繁體中文
    • run_endframe_ichi_f1.bat - F1版/日語
    • run_endframe_ichi_en_f1.bat - F1版/英語
    • run_endframe_ichi_zh-tw_f1.bat - F1版/繁體中文
  2. 通過命令行指定語言:

    python endframe_ichi.py --lang en  # 以標準版/英語啟動
    python endframe_ichi_f1.py --lang zh-tw  # 以F1版/繁體中文啟動

※ README 的多語言版本將陸續推出。繁體中文版本請參閱 README_zh.md

🔧 故障排除

關於 h11 錯誤

當您首次啟動該工具並匯入圖像時,您可能會遇到許多類似以下的錯誤: *控制台中將顯示錯誤,且 GUI 中不會顯示任何影像。

**大多數情況下,圖片其實已經上傳了,只是縮圖顯示不正常,所以還是可以產生影片的。 **

FramePack-eichi錯誤畫面1

ERROR:    Exception in ASGI application
Traceback (most recent call last):
  File "C:\xxx\xxx\framepack\system\python\lib\site-packages\uvicorn\protocols\http\h11_impl.py", line 404, in run_asgi

當處理 HTTP 回應時出現問題時,會顯示此錯誤。 如上所述,這通常發生在啟動過程的早期,即 Gradio 尚未完成啟動時。

解決方案:

  1. 刪除有「X」按鈕的圖片,然後重新嘗試上傳。
  2. 如果上傳同一文件重複失敗: - 完全停止 Python 進程,然後重新啟動應用程式 - 重新啟動電腦,然後重新啟動應用程式

如果錯誤仍然存在,請嘗試其他圖片檔案或減小圖片大小。

記憶體不足錯誤

在 Windows 系統中,如果顯示「CUDA out of memory」或「RuntimeError: CUDA error」,請按照以下步驟操作:

  1. gpu_memory_preservation 的值設定為 12-16GB
  2. 關閉其他使用 GPU 的應用程式
  3. 重新啟動應用程式
  4. 降低圖片解析度(640x640 附近)

記憶體消耗的詳細分析

根據對整個源代碼的詳細分析,實際記憶體消耗如下:

基本模型配置和加載時的記憶體消耗

  • transformer (FramePackI2V_HY):約 25-30GB(狀態字典完全展開時)
  • text_encoder, text_encoder_2, vae 總計:約 8-10GB v1.9.1 添加了卸載處理來減少 RAM 使用量
  • 其他輔助模型 (image_encoder等):約 3-5GB
  • 基礎 RAM 消耗總計:約 36-45GB

LoRA 應用時的記憶體消耗模式

LoRA 應用處理流程:

  1. 原始狀態字典:約 25-30GB(transformer 大小)
  2. LoRA 文件加載:50MB 至 500MB
  3. 合併處理期間:由於需要複製原始狀態字典並與 LoRA 合併,臨時需要額外 25-30GB 注意:v1.9.1 重新審視了此過程,大幅降低了 RAM 消耗
  4. 應用過程的峰值:基本消耗 + 狀態字典複製 ≈ 約 70-90GB

重要:這種顯著的記憶體消耗增加僅發生在初次 LoRA 加載時。當加載不同的 LoRA 文件或更改 LoRA 應用強度或 FP8 設置時,不會發生這種大型記憶體峰值。初次加載後的正常視頻生成操作中,記憶體使用量維持在基本消耗水平(約 36-45GB)。

推薦系統要求

  • 標準執行 RAM 要求:36-45GB
  • LoRA 應用期間的臨時峰值:70-90GB
  • 推薦頁面文件:與 RAM 總計至少應為 40GB

例如:

  • 32GB RAM 系統 → 頁面文件約 40GB
  • 64GB RAM 系統 → 頁面文件約 20GB

使用 F1 模型時的額外記憶體要求

使用 F1 模型時,除標準模型外,還需以下額外記憶體:

  • F1 模型初次下載:約 24GB
  • 兩種模型共存時的存儲容量:約 54GB

Google Colab 等無交換空間環境注意事項

在無交換記憶體的環境中運行有很嚴格的限制:

  • RAM 限制(13-15GB)使得即使加載基本模型也很困難
  • 無法處理 LoRA 應用時所需的 70-90GB 臨時記憶體峰值
  • 沒有交換空間,記憶體不足時系統會立即崩潰出現 OOM 錯誤

影片顯示問題

產生的影片在某些瀏覽器(尤其是 Firefox)和 macOS 上無法顯示:

  • 症狀:影片無法在 Gradio UI 中顯示,縮圖無法在 Windows 上顯示,無法在某些播放器上播放
  • 原因:\framepack\webui\diffusers_helper\utils.py 中的視訊編解碼器設定有問題

此問題已透過合併原始 MP4 壓縮功能解決

🤝 謝辞

本項目基於以下項目的貢獻:

📄 許可證

本項目遵循 Apache 許可證 2.0 發布。這與原 FramePack 專案的授權一致。

📝 更新日誌

最新的更新資訊如下所示。完整的更新歷史請參考更新日誌

2025-05-11:版本 1.9.2

  • 「FramePack-oichi」新功能添加
    • 從單一輸入圖像預測生成下一幀未來圖像的新功能
    • 添加專用啟動腳本(run_oneframe_ichi.bat等)
    • 比常規視頻生成更輕便,可快速查看下一幀
    • 完全支持多語言(日語、英語、中文)
  • 幀圖像保存功能
    • 添加保存所有生成幀圖像的選項
    • 可選擇保存所有分段的所有幀或僅保存最終分段的幀
    • 使中間視頻過程的可視化和作為素材資源的使用更加容易
  • 分段信息批量管理增強
    • 添加了通過ZIP文件批量下載分段信息的功能
    • 更高效地管理和備份多個項目
    • 支持批量上傳開始圖像、結束圖像和分段信息並在內容修改後重新下載
  • LoRA功能增強
    • 支持同時使用三個LoRA
    • 默認從目錄選擇,能夠選擇/webui/lora文件夾中的LoRA
    • 在所有模式(標準版、F1版、oneframe版)中支持LoRA功能增強
  • VAE緩存功能
    • 通過逐幀VAE解碼提高處理速度 - 基於furusu研究 詳情1 詳情2
    • 可調整內存使用量和處理速度之間的平衡
    • 從設置屏幕簡單切換開/關
    • 默認為關閉,因此沒有影響
    • 通過利用幀間獨立性的計算緩存實現高達30%的速度提升

2025-05-04:版本 1.9.1

  • F1 模型添加:引入了支持正向生成的新模型 "FramePack_F1_I2V_HY_20250503"
  • 記憶體管理優化:通過 transformer_manager.py 和 text_encoder_manager.py 實現高效模型管理
  • Docker 支持增強:在容器化環境中實現簡單設置
  • PNG 元數據功能:自動在生成圖像中嵌入提示詞、種子值和分段信息
  • 最佳解析度桶系統:根據縱橫比自動選擇最佳解析度
  • 剪貼板支持增強:支持標準版的 Image 和 Final 以及 F1 版的 Image 的剪貼板功能

FramePack-eichi - 端幀圖片連結口 旨在實現更直覺、更靈活的影片生成