BpForum
KoreaWho
BpForum
KoreaWho
기업과산업  인터넷·게임·콘텐츠

카카오브레인, 국내 최대 규모 이미지·텍스트 데이터셋 31일 공개

안정문 기자 question@businesspost.co.kr 2022-08-30 14:20:21
확대 축소
공유하기
페이스북 공유하기 트위터 공유하기 네이버 공유하기 카카오톡 공유하기 카카오스토리 공유하기 유튜브 공유하기 url 공유하기 인쇄하기

[비즈니스포스트] 카카오브레인이 초거대 인공지능(AI) 연구개발 저변을 확대하고자 국내 최대 규모의 이미지·텍스트 데이터셋을 공개한다.

카카오브레인은 약 7억4천만 개의 이미지·텍스트 묶음으로 이루어진 데이터셋 ‘Coyo(이하 코요)’를 31일 카카오브레인 공식 홈페이지를 통해 공개한다고 30일 밝혔다. 
 
카카오브레인, 국내 최대 규모 이미지·텍스트 데이터셋 31일 공개
▲ 카카오브레인이 국내 최대 규모의 이미지와 텍스트 데이터셋을 공개한다. 김일두 대표이사(사진)은 "이정표"라고 말했다. 

데이터셋은 초거대 AI 모델이 정교한 결과값을 구현하는 데 필요한 핵심 요소 중 하나다. 

높은 성능을 위해 많은 기업들이 수작업으로 이미지·텍스트 쌍을 맞추어 데이터셋을 수집하는 데 이때 많은 비용과 시간이 투입된다.

카카오브레인은 코요 개발 과정에서 독자 개발한 기술을 적용해 이미지·텍스트를 온라인에서 자동 수집함으로써 투입되는 비용과 시간을 줄이고 양질의 데이터를 선별해 높은 성능을 구현했다. 

카카오브레인은 글로벌 AI 기업에서 공개한 초거대 AI 모델 재현을 통해 교차 검증하고 데이터의 품질을 확인했다고 설명했다.

코요는 카카오브레인이 앞서 공개한 초거대 AI 이미지 생성 모델 ‘RQ-Transformer’와 AI 아티스트 ‘칼로(Karlo)’ 개발에 적용됐다. 

카카오브레인은 "멕시코의 대표 화가 프리다 칼로(Frida Kahlo)의 고향인 멕시코시티 '코요아칸(Coyoacán)'의 앞 글자를 따 이번 데이터셋을 코요로 지었다"며 "칼로가 코요를 기반으로 탄생하게 된 것처럼 코요를 통해 수많은 AI 모델이 개발됐으면 하는 카카오브레인의 포부가 담겨 있다"고 말했다.

카카오브레인은 코요를 세계 최대 수준으로 확대한다는 목표 아래 한국어를 비롯한 다양한 언어로 개발해 나간다는 계획을 세웠다.

2023년 상반기에는 코요 데이터셋을 활용한 초거대 AI 모델을 추가로 공개한다.

김일두 카카오브레인 대표는 “이번 데이터셋 공개는 초거대 AI 기술 개발에 박차를 가할 중요한 근간이자 이정표가 될 것이다”며 “앞으로도 카카오브레인은 다방면으로 기술 리더십을 선도하고 AI 커뮤니티와 협력하며 AI 생태계 발전에 이바지하겠다”고 말했다. 안정문 기자

인기기사

하이브 '국감'과 '소송'으로 고달픈 10월, 방시혁 기업 이미지 쇄신 무대책 장은파 기자
이수만 떠난 SM엔터테인먼트 새바람, 탁영준 하이브식 운영으로 안착한다 김민정 기자
구글, 10월15일부터 '유튜브 쇼츠' 최대 길이 3분으로 연장 이동현 기자
하이브, 한글날 맞아 국립박물관문화재단과 BTS 협업 상품 '달마중' 출시 장은파 기자
삼성전자 엑시노스2500, 내년 갤럭시S25FE와 갤럭시Z폴드7 탑재 가능성 김호현 기자
민주당 조국혁신당, 부산 금정구청장 보궐선거 단일화 합의 조충희 기자
석유공사 '연임' 김동섭 국감으로, 대왕고래 프로젝트 힘겨운 방어전 예상 이상호 기자
영화 ‘베테랑2’ 700만 관객 눈앞, OTT ‘흑백요리사’ 처음으로 1위 올라 윤인선 기자
엔씨소프트 반등 열쇠 '저니오브모나크' 굿 스타트, 방치형게임 쏟아져 흥행은 '글쎄' 이동현 기자
테슬라 ‘로보택시’에 자체 배터리 활용 전망, LG엔솔 파나소닉 수혜 불확실 이근호 기자
koreawho

댓글 (0)

  • - 200자까지 쓰실 수 있습니다. (현재 0 byte / 최대 400byte)
  • - 저작권 등 다른 사람의 권리를 침해하거나 명예를 훼손하는 댓글은 관련 법률에 의해 제재를 받을 수 있습니다.
  • - 타인에게 불쾌감을 주는 욕설 등 비하하는 단어가 내용에 포함되거나 인신공격성 글은 관리자의 판단에 의해 삭제 합니다.