▲ 네이버가 27일 클로바X에 시각정보 처리 기술을 추가한다. 사진은 하이퍼클로바X가 이미지를 해석해 차트의 내용을 이해한 모습. <네이버>
하이퍼클로바X에 이미지 처리 능력이 추가되면서 이용자는 클로바X에서 이미지 기반으로 대화를 나눌 수 있다.
클로바X는 사진 속 현상을 묘사하거나 상황을 추론하는 등 다양한 지시를 수행할 수 있다. 예를 들어 이미지나 그림 형식으로 되어 있는 표, 그래프 등을 이해하고 분석할 수 있다.
네이버는 기존 클로바X가 논리적 글쓰기, 코드 작성, 번역 등의 작업에 사용됐다면, 이번 기능 추가로 활용 범위가 한층 넓어질 것으로 기대했다.
또 네이버는 지난 20일 '클로바' 공식 사이트의 기술 블로그를 통해 생성형 AI 기반 음성합성 기술을 공개했다.
기존의 음성인식, 음성합성 기술보다 한층 모델을 발전시켜 언어구조와 발음 정확도 개선은 물론 감정표현까지 더한 자연스러운 대화가 가능해졌다고 회사 측은 설명했다.
네이버는 이 기술이 실시간 음성번역, 언어학습, 상담 등 음성 멀티모달 거대언어모델(LLM)의 다양한 서비스로 이어질 수 있을 것으로 기대했다.
성낙호 네이버클라우드 하이퍼스케일 AI 기술 총괄은 "거대 언어 모델로 출발한 하이퍼클로바X는 이미지 이해 능력을 더한 거대 시각 언어 모델, 나아가 음성 멀티모달 언어 모델로 발전하고 있다"며 "여러 네이버 서비스에 도입해 하이퍼클로바X 생태계를 더욱 확장해나갈 것"이라고 말했다. 정희경 기자