AI 버튜버 레트로겜순이 개발 일지 – 004

겜순이의 의목소리 생성이 너무 오래 걸립니다. Zyphra 의 zonos api를 사용중인데, 여기서 서비스 하는 음성 모델이 정말 쏙 마음에 드는데… 문제는 서버가 자주 다운되고, 음성 하나 생성하는데 시간이 적게는 15초에서 많게는 1분 이상 걸린다는점 입니다. 안그래도 유튜브 라이브 방송은 실제 채팅 올라오는 시간과 방송에 송출되는 시간의 갭이 적게는 수초에서 많게는 십여초 까지 있는데, 음성 생성마저 이렇게 오래 걸리면 채팅에 참여하는 분들은 겜순이가 즉각적인 대응을 하지 못한다고 생각 하실 수 있습니다. 때문에 테스트 방송 안켜고 작업일지 안올렸던 기간 동안… TTS의 개발 또는 공개 TTS로 겜순이 목소리를 내는 방법을 찾고 연구하고 있었습니다. 공개 TTS 설치도 여러종류로 해 보고… 아예 TTS를 개발 해 보기도 했습니다. 배포 할거도 아니고, 서비스를 할거도 아니기에…

원문 전체 보기


이 글은 네이버 블로그 원문을 바탕으로 작성된 요약 안내 페이지입니다.

조회수: 0

Keep Reading

이전다음

댓글

답글 남기기