본문 바로가기

심층기획 목소리·영상에 인공지능(AI) 기술 더해 일상 속 편의 높인다

AI 기반 솔루션으로 음성 제어 및 가상음성 콘텐츠 제작 가능

[산업일보]
가정, 기업, 산업 등 다양한 분야에서 인공지능(AI)의 활용도가 커지고 있다. 한국IDC는 올해 전 세계 인공지능 분야 매출이 전년 대비 15.2% 증가한 3천418억 달러에 이를 것으로 예상했다.

특히 음성 및 영상과 결합한 인공지능 기술은 우리의 일상을 더욱 편리하게 만드는 방향으로 진화하고 있다. 본보는 지난 6일 서울 코엑스(COEX)에서 열린 ‘대한민국 4차 산업혁명 페스티벌 & 블록체인 서울’에 참가한 몇몇 기업을 만나 음성·영상 관련 인공지능 기술에 대해 들어봤다.
목소리·영상에 인공지능(AI) 기술 더해 일상 속 편의 높인다
(주)인텔로이드 최윤석 팀장

자동차·병원·산업현장까지…AI 기반 음성인식으로 업무를 한결 편하게

음성인식 AI 전문기업인 (주)인텔로이드는 가정용, 기업용, 의료용, 차량용의 다양한 보이스 AI 솔루션을 공급하는 회사다. 인텔로이드가 보유한 음성인식의 원천기술을 바탕으로 8년 전부터 고객의 요구에 맞는 보이스 AI 기술을 제공하고 있다.

인텔로이드의 음성인식 솔루션은 자동차(내비게이션), 산업현장, 병원(의무기록 자동화 STT) 등 다양한 분야에서 활용되고 있다. 특히 의무기록 자동화 STT(Speech-To-Text)는 병원 내 의무기록 작성 시 타이핑 혹은 녹취 후 옮겨적는 과정을 음성인식으로 자동 기록하는 솔루션이다.

인텔로이드 최윤석 팀장은 최근 비대면 경제가 활성화하면서 엘리베이터, 에어컨, 로봇청소기 등을 음성으로 제어할 수 있는 AI 기반 음성인식기술에 대한 수요가 높아졌다고 언급한 뒤, “스마트홈 외에도 실버 케어 분야에서 반려로봇, 인형 등에 쓰이는 음성인식 솔루션을 찾는 사례도 증가하고 있다”고 말했다.

향후 TA(Text Analysis) 기술과 이미지 인식 기술을 덧붙여 영상, 음성 및 문자 합성 기능을 제공하는 통합플랫폼을 제공할 예정이라는 최 팀장은 “아직 실생활에 음성인식 솔루션을 적용하는 사례가 흔하지 않으나, 점차 활용 범위가 넓어질 것”이라고 전망했다.
목소리·영상에 인공지능(AI) 기술 더해 일상 속 편의 높인다
'대한민국 4차 산업혁명 페스티벌 & 블록체인 서울'에 참가한(주)자이냅스

딥러닝 기반 가상음성 콘텐츠로 아웃풋 내다

2017년 챗봇 서비스로 시작한 (주)자이냅스는 음성합성, 영상합성 엔진과 자연어이해(NLU) 엔진을 보유한 AI 기술 스타트업이다.

티맵 모빌리티의 ‘가상음성 길 안내 서비스’에 100% 딥러닝 기반 가상음성 콘텐츠를 공급했으며, 가상 음성 바이블 서비스를 출시하기도 했다.

이 회사 천정균 선임컨설턴트는 “자이냅스는 최대 65문장의 학습으로 가상음성을 생성할 수 있는 음성합성 기술력과 사진 한 장으로 가상영상 콘텐츠를 제작할 수 있는 기술력을 갖췄다”고 말했다. 자이냅스는 AI가 합성한 음성·영상을 바탕으로 고인이 된 가족을 디지털 환경에서 만날 수 있는 AI 추모관 서비스도 기획하고 있다고 덧붙였다.

천 컨설턴트는 지속적인 연구개발을 통해 자연스러운 AI 기반 솔루션 제공에 힘쓰겠다며 “다국어 서비스로 전환하는 부분 등에서 기술 개발이 활발히 이뤄지면 음성합성 기술도 더욱 발전할 것”이라고 말했다.
ad광고추천제품

0 / 1000

추천제품

1/9

가상화폐 시세

loader
Bitcoin logo icon

비트코인

%
Ethereum logo icon

이더리움

%
Ripple logo icon

리플

%
Provided by Bithumb logo icon