오픈AI 구글 애플 생성AI 기술 진화 속도 무섭다, 네이버 카카오 위기감 고조

▲ 오픈AI의 새 생성형 인공지능(AI) 모델 'GPT-4o'(지피티-포오)가 '로봇이 친구에게 문자 메시지를 보낼 때 스마트폰을 보는 1인칭 시점'을 그림으로 그려달라는 요청을 처리한 예시 이미지. <오픈AI 홈페이지 캡처> 

[비즈니스포스트] 오픈AI, 구글, 메타, 테슬라, 아마존, 애플 등 미국 빅테크 기업들이 막대한 자금력을 바탕으로 더 진화한 생성형 인공지능(AI) 기술을 내놓는다. 

이제 막 생성형 AI 기술 개발 경쟁에 뛰어들었지만, 자금력이 턱없이 부족한 네이버, 카카오 등 국내 IT기업이 이들을 원천 기술에서 따라잡는 건 거의 불가능해 보인다. 

오픈AI는 14일 '봄 업데이트' 온라인 행사를 열고 멀터모달 기술을 적용한 새 플래그십 생성형 AI 모델 'GPT-4o(지피티-포오)'를 공개했다.

새 모델은 2023년 11월 공개된 GPT-4의 업그레이드 버전이다. 알파벳 'o'는 '전능하다'는 뜻의 '옴니'(Omni)에서 따왔다.

GPT-4가 텍스트 기반의 거대언어 AI 모델이었다면 GPT-4o는 텍스트만이 아니라 사용자가 음성으로 질문하면 사람과 같은 응답 속도로 답을 내놓는다.

거의 인간처럼 대화가 가능하다. 단순히 대화만 가능한 게 아니라 인간의 음성과 표정까지 인식해 대답하고, 궁금한 것은 거꾸로 인간에게 물어보는 기능까지 갖췄다. 대답도 음성 외에 이미지나 동영상까지 만들어 보여주기까지 한다.

이날 유튜브에서 실시간 GP4-4o 시연을 본 사람들은 "애플의 AI 비서 '시리'를 처음 봤을때의 충격과 비슷하다"거나 "영화 '허'(HER)에 나오는 인간과 똑같은 인공지능 연인 프로그램을 생각나게 한다" 등 기술적 진보에 놀라움을 금치 못했다.

특히 한국 시청자들은 이 모델의 한국어 관련 성과에 주목했다.
 
오픈AI 구글 애플 생성AI 기술 진화 속도 무섭다, 네이버 카카오 위기감 고조

▲ 미라 무라티 오픈AI 최고기술책임자(왼쪽)가 생성형 인공지능 모델인 GPT4o의 기능과 향후 운영계획을 설명하고 있다. <오픈AI 유튜브채널>

오픈AI는 이날 50개 언어 해석 효율이 기존보다 높아졌다고 설명했는데, 특히 GPT-4o가 한국어를 해석할때 사용하는 자원(토큰) 효율이 기존 GPT4보다 1.7배 최적화됐다고 밝혔다.

한국어에 특화된 네이버 하이퍼클로바X의 한국어 해석 효율이 GPT-4 대비 2.1배 정도인 것을 고려하면 한국어 해석과 관련한 격차도 상당 부분 따라잡은 셈이다.

GPT-4o의 한글 모델을 사용해봤다는 한 커뮤니티 이용자는 "기존 챗GPT-4를 쓰고 있는데 GPT-4o는 한글 답변 속도가 2배 빨라진 것을 체감했다"며 "최근 인공지능을 써야할 이유를 찾지 못해 구독 취소를 고려하고 있었는데, 이번 오픈AI의 업데이트를 보고 재구독을 결심했다"고 말했다.

또 다른 이용자는 "프로그래밍 코딩과 관련한 한글 질문에 대해서는 기존보다 5배 빨라진 것을 체감했다"고 했다.

또 한 이용자는 "챗GPT의 발전속도가 너무 빨라, 화이트칼라 직종이 빠르게 사라질 것 같다"는 반응도 나왔다.

오픈AI의 이날 GPT-4o 발표는 15일 새벽 구글이 발표할 새로운 생성 AI 모델인 '제미나이' 차기 버전을 견제하기 위한 것이라는 해석을 일각에서 제기하고 있다. 

구글은 15일 새벽 안드로이이 개발진영의 연례 개발자 행사인 I/O 2024를 열고 '제미나이'에 기반한 차세대 AI 비서 기술을 공개할 것으로 전해졌다. 

사실상 오픈AI의 유일한 대항마로 꼽히는 구글이 챗GPT-4o와 견줄만한 제미나이 차기 버전을 내놓을 것이란 관측이 나오고 있다. 

기존 제미나이는 안드로이드12 이상 버전에서만 제공됐지만, 차기 버전은 안드로이드10 버전 이상에서 사용할 수 있을 것으로 예상된다. 왠만한 안드로이드 스마트폰을 가지고 있는 사람이면 누구나 제미나이를 쓸 수 있게 되는 셈이다.  
 
오픈AI 구글 애플 생성AI 기술 진화 속도 무섭다, 네이버 카카오 위기감 고조

▲ GPT4o는 대부분의 인공지능 모델 평가에서 현존하는 주요 인공지능보다 높은 점수를 받았다. <오픈AI 홈페이지>

차기 버전은 GPT-4o처럼 음성 대화 모드도 추가될 것으로 예상된다. 또 사용자가 질문하면 텍스트나 이미지 외에 영상으로도 답변을 내놓은 기능을 추가할 것으로 전망되고 있다. 

또 픽시(Pixie)라 불리는 새로운 개인용 디지털 AI 비서가 공개될 것으로 예상된다. 제미나이 기반으로 작동하는 이 AI 비서는 사진으로 어떤 물건의 사용법을 배우거나 해당 사물을 구입할 수 있는 곳을 안내하는 기능 등 텍스트와 오디오 외에 그림, 사물, 손 동작 등을 이해하는 기능을 갖췄다.

또 제미나이 기능을 더한 새로운 스마트폰이나 태블릿 등 AI 디지털기기 신제품을 공개할 것이란 관측도 나온다.

오픈AI와 구글 외에도 테슬라는 3월, 애플은 4월 자체 거대언어모델(LLM)을 내놓으며 본격적으로 AI 경쟁에 합류했다. 메타는 최근 세번째 거대언어모델(LLM)을 오픈소스로 공개했다. 아마존은 오는 6월 매개변수가 무려 2조 개 규모의 세계 최대 규모의 LLM AI 모델 출시를 예고하고 있다.

상대적으로 AI 경쟁에서 뒤처졌다는 평가를 받은 애플은 오는 6월 개발자회의(WWDC)를 열고 새로운 생성형 AI 기술을 탑재한 음성인식 비서 '시리'를 공개할 것으로 알려졌다.

WWDC는 애플이 매해 전 세계 개발자를 초청해 최신 아이폰에 탑재될 신기능 등을 발표하는 행사다. 올해 행사에서 애플이 새 아이폰에 접목될 iOS 18 소프트웨어를 통해 애플의 다양한 인공지능 전략을 선보일 것이라는 관측이 나온다.

애플은 이미 올해 1월부터 시리 개발팀을 전면 교체, AI를 탑재한 차세대 시리 개발에 매달려 왔으며, 다양한 애플 전용 소프트웨어에 AI를 담는 시도를 하고 있다.
 
오픈AI 구글 애플 생성AI 기술 진화 속도 무섭다, 네이버 카카오 위기감 고조

▲ 네이버의 거대언어모델(LLM) 하이퍼클로바X 이미지.

거대 빅테크 기업들을 뒤쫒는 네이버와 카카오를 비롯해 통신3사 등 AI 기술을 개발하는 국내 IT기업들은 미국 빅테크의 기술력에 위기의식이 더 높아질 것으로 보인다.

네이버는 그동안 한국어와 한국에 특화한 데이터로 만든 거대언어모델(LLM) '하이퍼클로바X'를 들고 한국 AI 서비스 시장만큼은 사수하겠다는 의지를 내비쳐왔다.

하지만 미국 빅테크 기업들의 기술력이 한국어 AI 서비스에도 경쟁력을 충분히 갖출 것으로 보여 자칫 기술 경쟁에서 밀릴 수 있다는 우려가 나온다.

그동안 잠잠했던 카카오도 올해 초부터 차세대 LLM 개발에 드라이브를 걸고 연내 AI 기술을 공개할 계획이다. 하지만 한 해 수백 조 원을 투자해 기술을 개발하는 미국 거대 공룡 기업에 대항해 한 해 수천억 원 투자도 힘겨운 국내 IT기업들이 과연 AI 경쟁에서 살아남을 수 있을지는 미지수라는 게 IT 업계 전문가들 관측이다. 조충희 기자