AI 버튜버 레트로겜순이 개발 일지 – 002

GPT 모델 업그레이드 더 자연스러운 답변과 혼잣말을 생성합니다. 기존 : TTS서비스를 이용해 바로 음성 출력 – 어색한 인공지능 같은 목소리 현재 : TTS로 생성된 음성을 보이스클로닝 적용해서 자연스러운 말투와 감정을 담음. 성우 느낌의 과장된 말투를 사용하도록 학습시킴. TTS만 사용 했을 때 보다 음성 출력까지의 시간이 더 걸리지만, 높은 품질의 음성을 출력합니다. 검색 결과를 답변에 반영 날씨, 행사정보, 발매일 등에 대한 답변을 할 때 웹 검색을 이용해 답변을 생성합니다. 정확도가 높진 않지만 그럭저럭 쓸만한 답변을 생성합니다. 답변은 100자 이하로 짧게 하도록 변경 답변이 너무 길면 TTS 변환 및 보이스 클로닝에서 오류가 발생하거나 품질이 떨어지는 경우가 생김 답변이 길 수록 보이스클로닝에 소요되는 시간이 길어짐 때문에 답변은 항상 100자 이하로 간결하게 함으로서 적절한…

원문 전체 보기


이 글은 네이버 블로그 원문을 바탕으로 작성된 요약 안내 페이지입니다.

조회수: 0

Keep Reading

이전다음

댓글

답글 남기기