Skip to content

Latest commit

 

History

History
511 lines (394 loc) · 51.5 KB

File metadata and controls

511 lines (394 loc) · 51.5 KB

Расширенная документация FramePack-eichi | 日本語 | English | 繁體中文

Этот документ предоставляет подробную информацию о функциях и настройках FramePack-eichi в качестве расширенной версии основного README. Для практического использования см. Руководство пользователя, а для истории обновлений - Журнал изменений.

🌟 Расширенные настройки

Выбор модели (добавлено в v1.9.1)

  • Модель F1: Прямой метод генерации, более динамичные движения, простая операция
  • Стандартная модель: Обратный метод генерации, точный контроль, многофункциональность

Особенности и преимущества модели F1

  • Прямой метод генерации: Интуитивное движение в обычном направлении генерации (от начала к концу)
  • Простой интерфейс: Функции секций (ключевые изображения) и Final (endframe) опущены
  • Богатство движений: Легче генерировать динамичные движения по сравнению со стандартной версией
  • Для начинающих: Меньше настроек, интуитивно понятное управление
  • Степень влияния изображения: Функция для подавления изменений от изображения в первой секции (настраивается в диапазоне от 100,0% до 102,0%)

Особенности и преимущества стандартной модели

  • Обратный метод генерации: Уникальная техника генерации с обратным отсчетом от последнего кадра
  • Многофункциональный интерфейс: Сложный интерфейс с возможностью детальной настройки
  • Контроль ключевых кадров: Тонкий контроль с помощью изображений Image, Final и секций
  • Для продвинутых пользователей: Расширенный контроль с помощью детальных настроек

Настройки ключевых кадров ※Функция добавлена nirvash

  • Image: Основной начальный ключевой кадр
  • Final Frame: Конечный кадр (опционально)
  • Настройки секций: Индивидуальная настройка изображений ключевых кадров и промптов для каждой секции

Функция автоматического копирования ключевых кадров ※Улучшена в v1.7

  • Красная рамка (секция 0): Автоматическое копирование в четные секции (0,2,4,6...)
  • Синяя рамка (секция 1): Автоматическое копирование в нечетные секции (1,3,5,7...)
  • Включение/выключение с помощью флажка
  • Это позволяет охватить все секции только двумя настройками ключевых кадров

Промпты для каждой секции ※Добавлено в v1.2【Экспериментальная реализация】

  • Возможность установки индивидуальных промптов для каждой секции
  • Промпт, специфичный для секции, используется только при генерации этой секции
  • При пустом поле используется общий промпт
  • Внимание: эта функция является экспериментальной, эффект не гарантируется

Функция метаданных PNG ※Добавлено в v1.9.1

  • Автоматическое встраивание промптов, значений seed и информации о секциях в сгенерированные изображения
  • Возможность повторного получения настроек из сохраненных изображений
  • Стандартный формат метаданных, совместимый с инструментами SD
  • Возможность совместного использования информации о настройках при обмене изображениями

Оптимизация FP8 ※Добавлено в v1.9.1

  • Сокращение использования VRAM при применении LoRA с использованием 8-битного формата с плавающей точкой
  • Улучшение производительности за счет оптимизации scaled_mm для GPU RTX серии 40
  • Обычно рекомендуется отключить (возможны предупреждения или ошибки в некоторых средах)

Настройки Hunyuan LoRA ※Добавлено в v1.3, значительно улучшено в v1.9

  • Флажок "Использовать LoRA": Включение/выключение LoRA
  • Выбор файла LoRA: Выбор используемого файла LoRA
  • Ползунок силы применения: Регулировка степени влияния LoRA от 0,0 до 1,0
  • Формат: С v1.9 унифицирован в формат HunyuanVideo, улучшена совместимость
  • Внимание: При использовании LoRA происходит задержка для загрузки перед началом прогресс-бара
  • В v1.9 благодаря внедрению кода kohya-ss/FramePack-LoRAReady используется тот же метод прямого применения в режимах высокого и низкого VRAM, что значительно повышает стабильность

Настройка выходной папки ※Добавлено в v1.2

  • Возможность указания имени выходной папки
  • Кнопка "Сохранить и открыть выходную папку" позволяет сохранить настройки и открыть папку
  • Настройки сохраняются при перезапуске приложения

Настройки сжатия MP4 ※Объединено из оригинала в v1.6.2

  • Настраивается ползунком в диапазоне 0-100 (0=без сжатия, 16=по умолчанию, высокие значения=высокое сжатие·низкое качество)
  • Чем меньше число, тем выше качество, но больше размер файла
  • При возникновении проблемы с черным экраном установка значения 16 может решить проблему

🧠 Принципы и концепции настройки изображений ключевых кадров

Принцип работы FramePack

Главная особенность FramePack заключается в уникальном подходе к генерации видео "из будущего в прошлое". Обычные AI для генерации видео последовательно создают кадры от первого к будущим, что приводит к ухудшению качества и потере согласованности в длинных видео.

В FramePack сначала генерируется конечный кадр из входного изображения, а затем создаются кадры в обратном направлении. Это позволяет сохранять высокое качество и согласованность даже в длинных видео.

В случае модели F1 генерация происходит в обычном направлении (от начала к концу). Это облегчает создание динамичных движений, но значительно упрощает сложность настроек.

Расширенные функции FramePack-eichi

FramePack-eichi дополнительно улучшает качество благодаря стратегическому размещению нескольких изображений ключевых кадров:

  1. Предотвращение резких изменений в последней секции:

    • В оригинальном endframe настройка изображений только для первой (последней 1 секунды) секции приводила к резкому изменению изображения в последней секции (около первой 1 секунды)
    • FramePack-eichi применяет простой силовой метод: вставлять изображения ключевых кадров во все секции
    • Особенно важные ключевые кадры выделены красной рамкой, и при установке в них изображений происходит автоматическое копирование
    • Поскольку FramePack генерирует видео с последней секции, порядок секций и ключевых кадров также устанавливается с конца
    • В 6-секундном режиме FramePack может не успеть достичь изображений ключевых кадров режима цикла, и цикл может закончиться
    • В 8-секундном режиме переходы изображений более плавные, чем в 6-секундном режиме
    • В обоих случаях (включая упомянутые ниже для нескольких сцен) чем больше разница в изображениях, тем больше изменение движения, что позволяет генерировать более плавные движения
  2. Оптимизация функции цикла:

    • В режиме цикла первый ключевой кадр автоматически копируется в Final Frame
    • С v1.5.1 копирование из входного изображения в обычном режиме остановлено, копирование изображений активно только в режиме цикла
    • Установка начальной позы цикла в изображение ключевого кадра 1 позволяет создавать плавные циклические видео
  3. Настройка промптов для каждой секции: ※Добавлено в v1.2【Экспериментальная реализация】

    • Установка уникальных промптов для каждой секции позволяет реализовать различные движения и выражения в каждой секции
    • Например, можно естественно выразить изменения движений, такие как "ходьба" → "сидение" → "махание рукой"
    • Влияние промпта тонкое, но эффективно в сочетании с изображениями ключевых кадров
  4. Добавление режима коротких видео: ※Добавлено в v1.6.1

    • Поддержка режимов коротких видео 1, 2, 3, 4 секунды
    • Оптимизированное количество секций и шаблоны копирования для каждого режима
    • Возможен специализированный контроль для выражения в короткое время

Различия модели F1 (добавлено в v1.9.1)

Модель F1 имеет следующие основные отличия от стандартной версии:

  1. Подход прямой генерации:

    • Поскольку генерация происходит последовательно от первого кадра, возможны более естественные переходы движения
    • Функции секций (изображения ключевых кадров) и Final (endframe) становятся ненужными
  2. Упрощение интерфейса:

    • Настройка только изображения "Image"
    • Регулировка степени изменения первой секции с помощью ползунка "Степень влияния изображения" (100,0%~102,0%)
  3. Управляемость и результаты:

    • Высококачественные результаты с меньшим количеством настроек
    • Легче генерировать видео с большим количеством движений и динамикой
    • Простое управление, удобное для начинающих

Основные отношения изображений ключевых кадров (стандартная версия)

Отношения между Image (входное изображение), Final Frame (конечный кадр) и изображениями ключевых кадров:

  1. О приоритетах:
    • В основном, за исключением самой последней секции, используется изображение из предыдущей секции, сгенерированной по прямой линии
    • Если в текущей секции установлено изображение ключевого кадра, оно используется, в противном случае используется промежуточное состояние, предполагаемое из других изображений
    • Если изображение ключевого кадра установлено в последней секции, оно имеет приоритет над Image.

Такая структура позволяет осуществлять детальный контроль для каждой секции, реализуя более естественные и согласованные движения.

Инновация v1.7: Система ключевых кадров с красной/синей рамкой (стандартная версия)

В v1.7 функция копирования изображений ключевых кадров была значительно улучшена, введена более эффективная и интуитивная система:

  1. Визуальное различие с помощью красной/синей рамки:

    • Красная рамка (секция 0): Автоматическое копирование во все четные секции (0,2,4,6...)
    • Синяя рамка (секция 1): Автоматическое копирование во все нечетные секции (1,3,5,7...)
  2. Повышение эффективности настройки ключевых кадров:

    • Возможность охватить все секции всего двумя настройками ключевых кадров
    • Значительное повышение эффективности за счет автоматического копирования на основе шаблонов вместо необходимости индивидуальной настройки каждой секции
  3. Поддержка динамического количества секций:

    • Точный расчет количества секций на основе выбранной длины видео и размера кадра
    • Автоматическая настройка мест копирования в соответствии с рассчитанным количеством секций
  4. Гибкий контроль с помощью флажков:

    • Простое включение/выключение функции автоматического копирования ключевых кадров
    • При необходимости можно отключить для сложных видео и контролировать каждую секцию индивидуально

Эта система значительно сокращает усилия по настройке ключевых кадров, особенно при создании длинных видео (10 секунд и более).

Советы по настройке промптов

Настройка промптов так же важна, как и изображения ключевых кадров:

  1. Базовая структура промпта:

    • Эффективно описывать в порядке: субъект → движение → другие элементы
    • Пример: The character walks gracefully, with clear movements, across the room.
  2. Уровень указания движения:

    • Без промпта: почти не создается движения
    • Простое движение: даже moves back and forth, side to side генерирует базовые движения
    • Конкретное движение: более детальное указание, такое как dances powerfully, with clear movements, full of energy, генерирует более сложные движения
  3. Примечания:

    • Использование слов, обозначающих большие движения, таких как "танец", может привести к неожиданно преувеличенным движениям
    • Примеры практичных промптов:
      • Спокойное движение: The character breathes calmly, with subtle body movements.
      • Среднее движение: The character walks forward, gestures with hands, with natural posture.
      • Сложное движение: The character performs dynamic movements with energy and flowing motion.
  4. Глубинная структура промптов (разделение LLAMA и CLIP):

    • Внутри FramePack промпты обрабатываются двумя различными моделями:

    • Модель LLAMA (ограничение 256 токенов):

      • Отвечает за детальное понимание текста и обработку контекста
      • Используется для управления общим содержанием видео и последовательностями
      • Примерное количество символов: около 1000-1300 символов (английский) или 200-400 символов (японский)
      • Связана с контролем контекста сцены и повествовательности
    • Модель CLIP (ограничение 77 токенов):

      • Модель, специализирующаяся на связывании изображений и текста
      • Влияет на генерацию конкретных визуальных характеристик видеокадров
      • Примерное количество символов: около 300-400 символов (английский) или 50-150 символов (японский)
      • Связана с контролем стиля, объектов и визуальных атрибутов
  5. Стратегия эффективного описания промптов:

    • Первые 300-400 символов (английский)/50-150 символов (японский):

      • Важная "визуальная часть", обрабатываемая и LLAMA, и CLIP
      • Здесь описываются основные визуальные элементы, стиль, объекты, общий тон
      • Пример: A young woman with long flowing hair, cinematic lighting, detailed facial features, soft expressions, gentle movements
    • Вторая половина 600-900 символов (английский)/150-250 символов (японский):

      • "Повествовательная часть", обрабатываемая только LLAMA
      • Здесь описываются детали движения, контекст сцены, информация о последовательности
      • Пример: The camera slowly pans from left to right. The woman gradually turns her head, her expressions changing from neutral to a slight smile. There is a sense of emotional buildup as if emotional music is playing in the background.
  6. Использование промптов для каждой секции: ※Добавлено в v1.2【Экспериментальная реализация】

    • Промпты, специфичные для секции, должны быть краткими и фокусироваться на важных движениях в этой секции
    • Ясные и конкретные указания более эффективны, чем длинные предложения
    • Пример: секция 1 "движение ходьбы", секция 2 "движение сидения", секция 3 "движение махания рукой"
    • Внимание: эффект промптов секции тонкий, важно сочетание с настройками изображений
  7. Промпты для модели F1 (v1.9.1):

    • Выражения, четко указывающие движения, особенно эффективны
    • Конкретное указание эмоциональных выражений и скорости движения дает хорошие результаты
    • Пример: A character enthusiastically dancing with dynamic movements, arms swinging freely, head nodding to the rhythm, full of energy and life
  8. Настройка стиля с использованием LoRA: ※Добавлено в v1.3【Экспериментальная реализация】

    • Комбинирование выбора LoRA и промптов позволяет подчеркнуть определенные стили или выражения ※предположительно
    • Эффект LoRA регулируется силой применения (0,1-0,3 тонкий эффект, 0,5-0,8 заметный эффект)
    • Эффект максимизируется при совпадении выбора промпта и LoRA

Выбор эффективных изображений с различиями

Качество генерации видео FramePack в значительной степени зависит от выбора изображений ключевых кадров. Важные моменты для выбора идеальных изображений с различиями:

  1. Оптимальный уровень различий:

    • Слишком малые различия: Использование почти одинаковых изображений ("так называемые мудрые различия") приводит к почти полному отсутствию генерации движения
    • Слишком большие различия: Использование совершенно несвязанных изображений не приводит к естественному движению
    • Идеальные различия: Оптимальны изменения, при которых AI может найти связь, например, разные позы одного и того же персонажа
  2. Сохранение связанности:

    • Например, просто зеркально отраженное изображение воспринимается AI как совершенно другое изображение и не приводит к естественному движению
    • Изменения направления лица, положения рук, позы тела являются идеальными элементами различий
    • Сохранение максимальной согласованности фона и одежды позволяет AI сосредоточиться на движениях персонажа
    • Парадоксально, но вариации персонажей, созданных AI генерацией изображений с похожими промптами, являются одним из идеальных элементов различий
  3. Характеристики идеальных изображений с различиями:

    • Один и тот же персонаж с легким изменением позы
    • Тонкие изменения выражения лица (безэмоциональное → легкая улыбка и т.д. Однако, если положение лица не меняется, движение слабое)
    • Изменения позы с естественными движениями рук или кистей
    • Постепенные изменения направления головы
  4. Экспериментальный подход:

    • Выбор изображений с различиями больше относится к искусству, чем к науке, поэтому важны пробы и ошибки
    • Эффективно начинать с различий похожих поз и постепенно регулировать величину различий
    • Запоминание успешных комбинаций позволяет применять их в будущих работах
  5. Комбинация с AI генерацией изображений:

    • Если нет идеальных изображений с различиями, эффективно использовать AI генерацию изображений для создания разных поз одного и того же персонажа
    • Изменения поз, указанные в промптах, должны быть умеренными, избегая значительных изменений для достижения более естественного движения

Такой структурированный подход помогает максимально использовать сильные стороны обеих моделей и генерировать более выразительные видео.

F1 и степень влияния изображения vs Стандартная степень влияния EndFrame и All Padding

Степень влияния изображения модели F1 (v1.9.1)

В модели F1 введен новый параметр "Степень влияния изображения":

На что влияет: Это напрямую регулирует степень изменения от изображения в первой секции.

Технический механизм:

  • Диапазон установлен в очень узких пределах от 100,0% до 102,0%
  • При установке на 100,0% сохраняется состояние, верное изображению
  • При приближении к 102,0% движение уменьшается, приближаясь к почти статичному состоянию

Эффект:

  • При значении 100,0% генерируется естественное движение
  • При значении около 101,0% изменения от начального кадра становятся более плавными
  • При значении 102,0% движение почти не генерируется

Степень влияния EndFrame и All Padding стандартной версии

В стандартной версии FramePack-eichi есть две важные функции для управления движением видео: "Регулировка степени влияния EndFrame" и "All Padding". Хотя на первый взгляд они кажутся похожими, принципы работы и эффекты совершенно различны.

1. Регулировка степени влияния EndFrame (введено в v1.3)

На что влияет: Это напрямую изменяет силу самого конечного кадра (Final Frame).

Технический механизм:

  • Точно умножает скрытое представление (latent representation) конечного кадра на указанное значение
  • В коде реализовано как modified_end_frame_latent = end_frame_latent * end_frame_strength
  • Диапазон значений 0,01~1,00, где 1,00 - по умолчанию (без изменений)

Эффект:

  • При снижении значения с 1,0 до 0,5 влияние конечного кадра точно уменьшается вдвое "в целом"
  • При значении 0,3 влияние конечного кадра точно становится 30% "в целом"
  • Поскольку прямое влияние конечного кадра ослабевает, характеристики первого кадра (Input Image) проявляются раньше
2. All Padding (введено в v1.4)

На что влияет: Это изменяет способ соединения между секциями.

Технический механизм:

  • Обычно значения отступов между секциями автоматически рассчитываются как [3, 2, 2, 2, 1, 0]
  • При включении All Padding это значение унифицируется в одно указанное значение (например: [1.5, 1.5, 1.5, 1.5, 1.5, 0])
  • Диапазон значений 0,2~3,0, где 1,0 - стандартное значение
  • Последняя секция (0-я) всегда принудительно устанавливается в 0

Эффект:

  • При высоких значениях, таких как 1,5, каждая секция сильнее ссылается на предыдущую, поэтому изменения становятся редкими
  • При низких значениях, таких как 0,5, каждая секция меньше ссылается на предыдущую, поэтому изменений становится больше
  • Изменяется "распределение" количества изменений, но общая сила кадров не меняется

Руководство по выбору степени влияния EndFrame и All Padding

Рекомендации по подходящим значениям настроек в зависимости от сцены:

Подходящие значения степени влияния EndFrame
  • Изображения с большими различиями: 0,3~0,6 (плавные изменения)
  • Средние различия: 0,5~0,8 (сбалансированный переход)
  • Малые различия: 0,8~1,0 (степень влияния близка к стандартной)
  • Изменения выражения лица: 0,7~0,8 (естественный переход выражений)
  • Большие движения тела или рук: 0,3~0,5 (более естественные промежуточные кадры)
Подходящие значения All Padding
  • Плавные переходы: 1,5~2,0 (чистые переходы с незаметными границами секций)
  • Стандартные движения: 1,0 (сбалансированный переход)
  • Активные движения: 0,5~0,7 (большие изменения в каждой секции)
  • Экстремальные движения: 0,2~0,4 (очень активные и непредсказуемые движения)
Практические техники использования
  • Степень влияния 0,5 + All Padding 0,5: Когда нужны более динамичные движения
  • Степень влияния 0,3 + режим коротких видео: При создании циклических анимаций с быстрыми изменениями
  • Степень влияния 0,8 + режим длинных видео: Выражение спокойных движений с медленными изменениями
  • Сверхнизкая степень влияния (0,01~0,1): Переворот концепции - почти игнорирование конечного кадра и использование первого кадра как "цели"
  • Высокое значение All Padding (2,0 и выше) + степень влияния 0,5: Ослабление влияния конечного кадра без заметных границ секций

🛠️ Информация о настройках

Базовые настройки (bat-файлы для Windows)

  • Настройка порта: параметр --port (по умолчанию: 8001)

    • Номер порта, используемый WebUI
    • Измените, если конфликтует с другими приложениями
  • Адрес сервера: параметр --server (по умолчанию: '127.0.0.1')

    • Измените на 0.0.0.0 для доступа в локальной сети
  • Автоматический запуск браузера: опция --inbrowser

    • Автоматически открывает браузер при запуске

Настройки модели F1 (добавлено в v1.9.1)

  • Степень влияния изображения: ползунок (по умолчанию: 100,0%)
    • Диапазон: 100,0%~102,0%
    • Регулировка степени изменения от изображения в первой секции
    • Маленькое значение: более активные движения (100,0% - стандарт)
    • Большое значение: более статичные движения (102,0% - почти статично)

Настройки производительности

  • Настройка сохранения памяти GPU: ползунок gpu_memory_preservation (по умолчанию: 10GB) ※Существующая функция

    • Малое значение = больше использования VRAM = быстрая обработка
    • Большое значение = меньше использования VRAM = стабильная работа
    • Механизм: чем меньше значение настройки, тем больше VRAM освобождается для модели трансформера
    • Метод расчета: остаток после вычитания установленного значения из верхнего предела VRAM (с учетом запаса) - это доступный объем VRAM для инструмента (минимум 6GB гарантировано)
      • Пример: при VRAM 16GB, с учетом запаса 14GB, будет использовано "14-(10-6)=10GB"
      • При установке нижнего предела в 6GB будет "14-(6-6)=14GB", используется почти до предела (сокращение времени обработки на 10 секунд на секцию, риск замены памяти)
    • Рекомендуемые значения:
      • 8GB VRAM: 7-8GB
      • 12GB VRAM: 6-8GB
      • 16GB и выше: около 6GB
    • Внимание: увеличьте значение при одновременном выполнении других приложений
    • Этот инструмент обеспечивает запас в 3GB для защиты от замены памяти, чтобы в фоновом режиме могли работать другие инструменты генерации изображений
    • При использовании LoRA лучше предусмотреть дополнительный запас
  • Режим высокого VRAM: автоматическое определение (v1.5.1: 60GB и более, v1.6: 100GB и более свободного VRAM) ※Улучшена функция

    • При включении: модель постоянно хранится в GPU, сокращаются накладные расходы на передачу памяти
    • Эффект: повышение скорости обработки до 20%
    • В v1.6 порог был повышен, и в большинстве сред используется режим низкого VRAM
    • В режиме низкого VRAM используется тот же метод прямого применения, что и в режиме высокого VRAM, улучшена согласованность функций

Настройки оптимизации FP8 (добавлено в v1.9.1)

  • Оптимизация FP8: флажок (по умолчанию: отключено)
    • При включении: применяется квантизация с использованием 8-битного формата с плавающей точкой
    • Эффект: значительно сокращается использование VRAM, повышается скорость обработки на GPU RTX серии 40
    • Внимание: возможны предупреждения или ошибки в некоторых средах
    • Рекомендация: обычно отключено, рассмотрите включение только при использовании LoRA в среде с низким VRAM

Настройки генерации

  • Настройка размера кадра: выпадающее меню frame_size (по умолчанию: 1 секунда) ※Добавлено в v1.5

    • 0,5 секунды: генерация кадров на 0,5 секунды. Количество секций и время обработки почти удваиваются
    • В режиме All Padding 0 возможны более интенсивные движения за счет придания различий каждому кадру
    • 1 секунда: генерация кадров на 1 секунду
  • Количество шагов: ползунок steps (по умолчанию: 25) ※Существующая функция

    • Увеличение значения улучшает качество, но пропорционально увеличивает время обработки
    • Рекомендуемый диапазон: 20-30 (часто при 20 достигается почти такое же качество)
    • 15 и ниже: происходит заметное снижение качества
  • TeaCache: флажок use_teacache (по умолчанию: включено) ※Существующая функция

    • Включено: обработка ускоряется примерно на 15-20%
    • Побочный эффект: может произойти незначительное ухудшение выражения деталей, таких как руки и кончики пальцев
    • Применение: рекомендуется включать для обычной генерации видео, отключать, когда важны детали
  • Значение случайного seed: числовой ввод seed или флажок "Use Random Seed" ※Функция добавлена nirvash

    • Одинаковое значение seed = воспроизводимые результаты
    • Случайный seed: каждый раз генерируются разные движения
    • Внимание: при изменении промпта или изображения результаты изменятся даже при одинаковом seed
  • Distilled CFG Scale: ползунок gs (по умолчанию: 10.0) ※Существующая функция

    • Значение масштаба дистиллированного руководства
    • Малое значение = более свободные движения (увеличение отклонения от промпта)
    • Большое значение = верность промпту (движения могут быть ограничены)
    • Рекомендация: сохранение значения по умолчанию (изменение для продвинутых пользователей)
  • Настройка сжатия MP4: ползунок mp4_crf (по умолчанию: 16) ※Объединено из оригинала в v1.6.2

    • Диапазон: 0~100 (0=без сжатия, 100=максимальное сжатие)
    • Чем меньше число, тем выше качество видео, но больше размер файла
    • Чем больше число, тем выше степень сжатия, меньше размер файла, но ниже качество
    • При возникновении проблемы с черным экраном установка на 16 может решить проблему
    • Применение: для сохранения низкие значения (0~10), для веб-обмена средние значения (16~30)

Настройки LoRA (добавлено в v1.3, значительно улучшено в v1.9)

  • Использование LoRA: флажок use_lora (по умолчанию: отключено)

    • Включено: использование файла LoRA для настройки модели
    • При использовании LoRA время ожидания перед началом счетчика может увеличиться
  • Файл LoRA: компонент выбора файла

    • Указание используемого файла LoRA
    • Поддерживаемый формат: с v1.9 унифицирован в формат HunyuanVideo
  • Сила LoRA: ползунок lora_strength (по умолчанию: 0.8)

    • Диапазон: 0.0~1.0
    • Малое значение: незначительный эффект
    • Большое значение: сильный эффект
    • Оптимальное значение зависит от каждого файла LoRA
  • Улучшения в v1.9

    • Значительное повышение стабильности благодаря внедрению кода kohya-ss/FramePack-LoRAReady
    • Унификация методов применения в режимах высокого и низкого VRAM
    • Общее использование функции load_and_apply_lora, снижение сложности кода

Настройки кадров

  • Длина видео: радиокнопки + ползунок total_second_length ※Расширение уникальной функции

    • 1 секунда: сверхкороткое видео (около 30 кадров @ 30fps) - добавлено в v1.5.1
    • 2 секунды: короткое видео (около 60 кадров @ 30fps) - добавлено в v1.6.1
    • 3 секунды: короткое видео (около 90 кадров @ 30fps) - добавлено в v1.6.1
    • 4 секунды: короткое видео (около 120 кадров @ 30fps) - добавлено в v1.6.1
    • 6 секунд: стандартный режим (около 180 кадров @ 30fps)
    • 8 секунд: стандартный режим (около 240 кадров @ 30fps)
    • 10 секунд: длинное видео (около 300 кадров @ 30fps)
    • 12 секунд: длинное видео (около 360 кадров @ 30fps)
    • 16 секунд: длинное видео (около 480 кадров @ 30fps)
    • 20 секунд: длинное видео (около 600 кадров @ 30fps)
  • Автоматическое копирование ключевых кадров: флажок enable_keyframe_copy (по умолчанию: отключено - изменено в v1.5.1) ※Уникальная функция

    • Включено: изображения ключевых кадров автоматически копируются в другие секции
    • Отключено: необходимо установить каждый ключевой кадр индивидуально
    • Применение: продвинутые пользователи, проектирующие сложные движения, могут отключить

Настройки вывода

  • Выходная папка: поле настройки выходной папки (по умолчанию: 'outputs') ※Добавлено в v1.2

    • Место сохранения сгенерированных видео и изображений
    • Можно вводить имя папки непосредственно в поле ввода
    • Кнопка "Сохранить и открыть выходную папку" позволяет открыть папку
    • Настройки сохраняются в формате JSON и сохраняются после перезапуска
  • Сохранение статичных изображений секций: флажок save_section_frames (по умолчанию: отключено) ※Функция добавлена nirvash

    • Включено: последний кадр каждой секции сохраняется как статичное изображение
    • Применение: полезно для проверки соединений секций
  • Сохранение видео секций: флажок keep_section_videos (по умолчанию: отключено) ※Уникальная функция

    • Включено: файлы видео каждой секции сохраняются, остаются при завершении с "End"
    • Отключено: сохраняется только финальное видео (промежуточные файлы удаляются), не попадает в корзину, будьте осторожны
    • Применение: полезно для индивидуальной проверки движений каждой секции
  • Сохранение тензорных данных: флажок (по умолчанию: отключено) ※Добавлено в v1.8

    • Включено: скрытое представление сгенерированного видео сохраняется в формате .safetensors
    • Применение: полезно для последующего объединения с другими видео или сохранения процесса генерации

Управление промптами

  • Сохранение пресета: кнопка "Сохранить"

    • Сохранение текущего промпта с именем
    • Сохранение с пустым именем устанавливает как промпт по умолчанию при запуске
  • Применение пресета: кнопка "Применить"

    • Применение промпта выбранного пресета к текущим настройкам генерации
  • Управление пресетами:

    • Удалить: удаление ненужных пресетов (пресет по умолчанию нельзя удалить)
    • Очистить: очистка полей редактирования

Настройки метаданных PNG (добавлено в v1.9.1)

  • Встраивание метаданных: автоматически включено
    • Автоматическое сохранение промптов, значений seed и информации о секциях в сгенерированных изображениях
    • Стандартный формат метаданных, совместимый с инструментами SD
    • Возможность совместного использования информации о настройках при обмене изображениями

Настройки Docker (добавлено в v1.9.1)

  • Выбор языка: настройка параметром command в docker-compose.yml

    # Для японского языка:
    command: ["--lang", "ja"]
    
    # Для традиционного китайского:
    command: ["--lang", "zh-tw"]
    
    # Для английского языка (по умолчанию):
    command: ["--lang", "en"]
  • Настройка томов: настройка параметром volumes в docker-compose.yml

    volumes:
      - ./data:/app/framepack/data
      - ./models:/app/framepack/hf_download
      - ./outputs:/app/framepack/outputs
    • data: место хранения файлов настроек и т.д.
    • models: место размещения загруженных моделей
    • outputs: место сохранения сгенерированных видео