Sonos Voice Control용 음성을 녹음하고 있는 Giancarlo Esposito
서울--(뉴스와이어)--다양한 기업에 인공지능(AI) 음성합성을 제공하고 있는 리드스피커코리아는 세계 최고의 사운드 기업 Sonos의 Sonos Voice Control에 맞춤형 음성합성기를 제공했다고 밝혔다.
이번 사례는 기존 보유 음색을 제공한 것이 아닌 고객이 원하는 목소리를 음성합성으로 개발해 맞춤 제공한 것으로, Sonos가 최첨단 AI 기반 TTS(텍스트 음성 변환) 분야에서 입증된 경험과 전문성을 보유한 ReadSpeaker의 VoiceLab을 선택했다는 데 의미가 있다.
최근 기업들은 브랜드 가치를 높이고 해당 영역에서 선도적인 일관된 브랜드 이미지를 유지하기 위해 다양한 시도를 하고 있다. 특히 고객과의 친밀한 소통과 참여를 유도하기 위해 자체 음성 비서를 적용하는 것은 필수 조건으로 자리 잡고 있다.
Sonos처럼 소비자 개인의 정보 보호에 대한 신뢰감의 비중이 큰 경우 소비자 요구·기대를 만족시킬 방법에 대한 고민은 더 클 수밖에 없다. 이번 적용된 AI 기반 음성합성은 이런 Sonos의 민감하고 광범위한 고민을 해결해 주는 도구가 됐다.
ReadSpeaker VoiceLab은 드라마·영화로 알려진 할리우드 배우 지안카를로 에스포지토(Giancarlo Esposito)의 △목소리 녹음 △녹음된 데이터 처리 △해당 데이터에 대한 DNN 모델 교육 △품질 관리 △전달 및 필요한 모든 품질 보증 단계 관리를 포함한 개발 프로세스를 관리했다. 정확한 발음과 특징을 살린 목소리를 일관되고 정확하게 음성합성으로 전달해야 하는 맞춤형 음성합성기는 오랜 기간 연구와 다국어 음성 개발 경험을 바탕으로 한 ReadSpeaker의 VoiceLab 전문가들이기에 가능했다.
Sonos의 맞춤형 음성합성 핵심 과제는 음악 산업에서 흔히 볼 수 있는 비표준 텍스트 콘텐츠를 이해하고 발음해야 한다는 것이었다. 또 어시스턴트가 아티스트 트랙이나 앨범 정보를 다양한 언어로 읽어내는 것도 중요했다. VoiceLab팀은 Sonos 및 Esposito와 긴밀하게 협력해 이 방대한 영역에 대한 음성 출력을 최적화할 수 있었고, 완성도 높은 결과물을 얻을 수 있었다.
Sonos 부사장 Joseph Dureau는 Sonos Voice Control의 맞춤형 음성을 지원하기 위해 ReadSpeaker를 선택한 이유로 “개발 단계부터 납품까지 긴밀하게 협력할 수 있는 능력과 맞춤형 음성합성에 대한 혁신적 접근 방식, 철저함이 느껴지는 언어 전문팀에 대한 신뢰”를 꼽으며 결과물에 대한 만족감 및 기대감을 드러냈다.
Giancarlo Esposito의 목소리가 적용된 Sonos Voice Control은 미국에서는 6월, 프랑스에서는 올해 말부터 모든 음성 지원 Sonos 제품에서 사용할 수 있다.
리드스피커코리아의 인공지능 음성합성기는 게임, 키오스크, 고객 센터, 방송, 교육, 이북(e-book) 등 분야에 제한이 없어 음성이 필요한 대부분의 분야에서 회사의 고품질 음성합성기를 접할 수 있다.
리드스피커코리아 개요
리드스피커코리아(옛 보이스웨어)는 20년 넘게 음성 기술을 연구·개발한 기업이다. 고품질 음성합성기(ReadSpeaker™)는 국내외 1만여개 이상 납품 이력으로 오래전부터 기술력을 인정받고 있다. 현재 37개 언어 98개 음색을 보유하고 있으며, 짧은 녹음 시간과 합리적 비용으로 고객이 원하는 Custom Voice를 VoiceLab을 통해 개발·제공하고 있다.