네이버・카카오, 국내 빅테크 기업들이 한국어 기반 AI에 집중하는 이유는?
상태바
네이버・카카오, 국내 빅테크 기업들이 한국어 기반 AI에 집중하는 이유는?
  • 조아라 기자
  • 승인 2024.04.29 22:31
  • 댓글 0
이 기사를 공유합니다

산업계 전반으로 AI붐이 여전히 뜨거운 가운데 국내 빅테크 기업들은 ‘한국어’ 기반으로 한 AI 개발에 집중하고 있다. 영어 기반인 글로벌 빅테크 기업들의 AI와 비교했을 때 한국어 특화 AI는 성능과 비용 측면에서 강점이 있어 국내 AI의 차별화 요인이 될 것으로 전망된다.

29일 국내 빅테크 업계의 한 종사자는 “기본적으로 생성형 AI는 학습량을 어떻게 배합하는지에 따라 성능이 달라진다”라며 “우리가 흔히 아는 글로벌 기업의 모델은 영어 데이터가 압도적으로 많고 라틴어, 프랑스어 등 서구권 언어가 높은 비율을 차지한다”라고 설명했다.

그러면서, “(그렇게 되면)영어 데이터를 처리하는 성능에 비해서 한국어 성능이 덜한 측면이 있다”면서, “국내기업들의 AI 경우 데이터 학습 배합비율을 한국어・영어・코딩언어 이런 구성으로 한국어 비율을 높인 것”이라고 했다.

한국어 기반 AI는 사용하는 기업 입장에서도 한국어 AI는 비용적 측면을 절감할 수 있다.

AI의 과금은 언어의 가장 작은 단위라고 할 수 있는 ‘토큰’ 당 비용을 과금하는 방식으로 진행된다. 영어 기반의 AI는 많이 쓰이는 영어 표현 같은 문장에 적은 토큰을 부여하는 반면 한국어 학습 데이터는 충분치 않기 때문에 영어 대비 더 많은 토큰이 부여되는 식이다.

네이버의 경우 지난 25일 자사의 생성형AI인 하이퍼클로바X의 새로운 모델인 'HCX-DASH'를 새롭게 선보였다.

하이퍼클로바X는 대부분의 학습 데이터가 영어로 구성된 AI보다 더 적은 비용으로, 더 빠르게 한국어를 처리할 수 있어 이미 국내 시장에서 상대적으로 우수한 비용 효율성 및 사용성 측면에서 강점을 갖는다. HCX-DASH는 이러한 장점을 한층 강화한 모델이라는 것이 네이버의 설명이다.

한편, 카카오의 LLM(초거대언어모델) 코GPT 2.0버전을 지난해 안으로 공개하기로 했지만 완성도 등을 이유로 지난해 하반기로 밀렸고, 아직까지도 공개가 안된 상태다. 일각에서는 카카오 내에서 AI 개발을 담당하는 AI 전문 자회사 카카오브레인을 본사와 흡수합병하는 방안이 추진중이라는 주장도 제기된다.

조아라 기자  lycaon@greened.kr

▶ 기사제보 : pol@greened.kr(기사화될 경우 소정의 원고료를 드립니다)
▶ 녹색경제신문 '홈페이지' / '페이스북 친구추가'

댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.