프로젝트 정보
제안 모듈/카테고리
- Module:
model-algorithm (모델 & 알고리즘)
- Category:
multimodal (멀티모달 모델)
근거
TTS(VibeVoice-Realtime-0.5B, VibeVoice-TTS-1.5B)와 ASR(VibeVoice-ASR-7B) 모델 가중치를 HuggingFace에 공개하고 있으며, transformers 라이브러리로 직접 통합 가능합니다. 텍스트↔음성 간 멀티모달 모델 패밀리로 multimodal 카테고리가 가장 적합합니다.
제안 태그
tts, asr, speech, multimodal, microsoft
한국어 지원
없음 (koreanSupport: false)
프로젝트 정보
제안 모듈/카테고리
model-algorithm(모델 & 알고리즘)multimodal(멀티모달 모델)근거
TTS(VibeVoice-Realtime-0.5B, VibeVoice-TTS-1.5B)와 ASR(VibeVoice-ASR-7B) 모델 가중치를 HuggingFace에 공개하고 있으며,
transformers라이브러리로 직접 통합 가능합니다. 텍스트↔음성 간 멀티모달 모델 패밀리로multimodal카테고리가 가장 적합합니다.제안 태그
tts,asr,speech,multimodal,microsoft한국어 지원
없음 (koreanSupport: false)