환각’ 70% 감소 기술 적용, 태국과 동남아 시작 믿음의 해외 진출 확대
KT가 자체개발한 초거대 AI를 공식 출시하고 B2B영역에 집중하겠다고 밝혔다. 사실상 기업들이 AI 활용에 있어 B2B영역에 집중하는 것은 놀라운 일이 아니다. 사업의 수익성, 관리의 편리성에 있어서 B2C영역보다 B2B영역은 기업에게 더 매력적인 선택지이기 때문이다. 경쟁사인 SK텔레콤과 LG유플러스 역시 AI사업에 박차를 가하고 있는 가운데 KT는 어떻게 차별화 전략을 추구할지 귀추가 주목된다.
31일 KT는 서울 서초구 KT 연구개발센터에서 기자설명회를 열고, 초거대 AI ‘믿음(Mi:dm)’의 출시를 발표했다.
출시하는 모델은 총 4종으로, 경량 모델부터 초대형 모델에 이르기까지 기업의규모와 사용 목적에 맞게 완전 맞춤형(Full Fine-Tuning)으로 사용할 수 있도록 했다.
또한 AI 풀스택을 통해 KT클라우드와 함께 믿음의 기업전용 AI 클라우드팜(Mi:dm CloudFarm)을 패키지로 제공해, 별도 개발 및 학습 인프라가 없더라도 누구나 합리적인 비용으로 초거대 AI를 활용한 서비스를 개발할 수 있다는 것이 KT의 설명이다.
KT는 초거대 AI를 활용하고 학습하고자 하는 모든 기업에게 믿음의 파운데이션 모델을 개방한다. 이를 위해 ‘KT 믿음 스튜디오’라는 전용 포털을 오픈해 고객에게 편리한 개발 환경을 제공할 예정이다. 여기선 KT 믿음의 파운데이션 모델을 직접 선택, 학습, 서빙 할 수 있는 맞춤형 환경이 구성된다.
(*파운데이션 모델 : 방대한 데이터셋으로 학습한 초거대 AI 핵심 기반 모델. 복잡한 기술의 구현이나 시스템의 구축을 위해 기업에서 원하는 형태로 미세조정을 거쳐 다양한 AI 응용서비스를 만들 수 있다.)
비용, 기술적 측면으로 초거대AI를 직접 만들지 못하는 대다수 기업들의 경우, 기존에 공개된 파운데이션 모델을 튜닝해 활용하는 방법이 가능하다. 하지만 데이터 자주권(Sovereign AI) 차원에서 빅테크에 데이터가 종속될 수 있다는 보안 우려가 있고, 무엇보다 기존 상업용 파운데이션 모델은 풀 파인 튜닝(FFT)을 제공하지 못한다는 한계가 있었다.
KT는 이러한 기업고객들의 갈증을 해결하고자 이번에 국내 업계 최초로 조(兆)단위 데이터의 사전 학습을 완료한 자체 파운데이션 모델 믿음을 개방했다. 이를 통해 LLM(거대언어모델)의 B2B 사업화를 가속하고, 궁극적으로 기업들이 원하는 AI 사업 모델과 응용 서비스의 폭발적 확산을 이끌어낸다는 계획이다.
사용을 원하는 기업들은 초거대 AI 믿음 공식 웹사이트를 통해 신청을 하고 이후 전문 컨설팅을 통해 사용 협의를 진행할 수 있다.
이와 관련해 최준기 KT AI/BigData 사업본부장은 “기업 고객이 LLM(대형언어모델)을 손쉽게 사용할 수 있도록 많은 고민을 한 것이 믿음 스튜디오의 개발 배경”이라면서 “믿음 스튜디오는 첫 번째로 멀티 LLM을 손쉽게 사용할 수 있고, 사전 프리 트레이닝 된 모델도 사용할 수가 있고 그다음에 다양한 파트너사의 모델도 손쉽게 선택을 할 수 있다”라고 설명했다.
그러면서, “또 하나 강조하고 싶은 것은 합리적인 가격으로 서비스를 제공한다는 점”이라면서, “KT 클라우드 기반으로 다양한 인프라 기반으로 클릭만으로 이런 모델들을 학습하고 배포하고 또 운영할 수 있도록 환경을 제공하고사용한 만큼 과금을 할 수 있는 운영체계를 가지고 있다”라고 했다.
.KT에서 강조한 믿음의 또다른 특징은 AI의 환각답변을 줄인 ‘강력한 신뢰 패키지(Reliable Package)’를 제공한다는 점이다.
그간 생성형 AI가 산업현장에서 폭넓게 사용되는데 가장 큰 장애물로 여겨진 문제점은 바로 ‘AI의 환각 답변(이하, 할루시네이션)’이었다. KT는 이를 해결하기 위해 검색과 추론, 답변 모든 단계에서 신뢰성을 높일 세 가지 기술을 개발해 믿음에 적용했다.
p다큐먼트 AI(Document AI)는 도식화된 복잡한 문서도 모델이 정확히 이해할 수 있도록 변환하는 기술이다. p서치 AI(Search AI)는 목표 도메인과 문서에 최적화된 최신 정보를 찾아내는 딥러닝 기술이다. p팩트가드 AI(FactGuard AI)는 원문에 근거한 응답만 생성하도록 강화학습을 적용했다.
세가지 기술을 통해 생성형 AI의 가장 큰 문제점인 할루시네이션 현상을 일반 생성형 AI 서비스 대비 최대 70% 가까이 줄일 수 있다는 것이 KT의 설명이다.
배순민 KT AI2XL 연구소장은 이와 관련해 “KT연구소에서 AI모델을 계속 테스트하면서 어떤 데이터에 문제가 있는지 아니면 결과에 문제가 있는지 검증에 집중하는 여러 팀 있다”라고 설명하면서, “한국어 차원에서 테스트 케이스를 만들어나가고 타사 모델과도 계속 비교해 나가면서 보편적으로 안전한 답변을 할 수 있도록 노력 중”이라고 했다.
조아라 기자 lycaon@greened.kr