Qwen3-TTS를 이용한 음성 생성 예제

Qwen3-TTS는 알리바바 클라우드의 Qwen 팀이 개발한 오픈소스 텍스트-음성 변환(TTS) 모델 시리즈입니다. 10개 주요 언어와 방언을 지원하며, 안정적이고 표현력 있는 스트리밍 음성 생성, 자유로운 음성 설계, 생생한 음성 복제 기능을 제공합니다.

아주 따끈따끈한데요. 직접 체험해보고 싶어서 예제를 만들어봤습니다. 2번째 예제의 경우 직접 목소리를 녹음한 후, 복제한 음성을 만들 수 있는데요. 아내가 듣고 "당신 목소리랑 진짜 비슷한데 훨씬 상냥하네" 라고 말하네요. T_T

자연어로 음성에 대한 디자인을 하여 음성을 생성할 수 도 있습니다. 말그대로 노인목소리, 아이목소리등 다양한 목소리를 자연어로 설명하여 생성할 수 있는데요. 이 부분은 품질이 좋은가? 하는 의문이 들긴 하더라고요. 빠르게 만든 예제이고 다양한 옵션을 사용하지 않아서 제가 오해할수도 있습니다.

https://github.com/urstory/qwen3-tts-examples

Qwen3-TTS를 이용한 음성 생성 예제

댓글