Skip to content

[Add] VibeVoice (microsoft/VibeVoice) #23

@9bow

Description

@9bow

프로젝트 정보

  • 이름: VibeVoice
  • GitHub URL: https://github.com/microsoft/VibeVoice
  • Website: https://microsoft.github.io/VibeVoice/
  • 설명(한국어): Microsoft가 공개한 오픈소스 음성 AI 모델 패밀리로, TTS(텍스트-투-스피치)와 ASR(자동 음성 인식) 모델을 포함합니다. Hugging Face Transformers를 통해 다른 AI 서비스에 음성 처리 컴포넌트로 통합할 수 있습니다.
  • Stars: 41,001
  • Forks: 4,730
  • License: MIT
  • Language: Python
  • Topics: (none)

제안 모듈/카테고리

  • Module: model-algorithm (모델 & 알고리즘)
  • Category: multimodal (멀티모달 모델)

근거

TTS(VibeVoice-Realtime-0.5B, VibeVoice-TTS-1.5B)와 ASR(VibeVoice-ASR-7B) 모델 가중치를 HuggingFace에 공개하고 있으며, transformers 라이브러리로 직접 통합 가능합니다. 텍스트↔음성 간 멀티모달 모델 패밀리로 multimodal 카테고리가 가장 적합합니다.

제안 태그

tts, asr, speech, multimodal, microsoft

한국어 지원

없음 (koreanSupport: false)

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Type

    No type

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions