기사 메일전송
카카오, 국내 최고 성능 경량 멀티모달·국내 최초 MoE 모델 동시 오픈소스 공개
  • 김해인 기자
  • 등록 2025-07-24 16:29:36

기사수정
  • 카카오톡 운영 경험 기반 `독자 AI 파운데이션 모델 프로젝트` 박차
  • 이미지 이해 능률 탁월한 `Kanana-1.5-v-3b`…GPT-4o와 견줄 성능 과시
  • 비용 효율 혁신 `MoE 모델` 국내 첫 공개…AI 개발 트렌드 선도

카카오가 자체 개발한 AI 기술력을 다시 한번 입증하며 국내 AI 생태계에 새로운 활력을 불어넣고 있다. 지난 5월 언어모델 4종 공개에 이어 약 두 달 만에 국내 공개 모델 중 최고 성능을 자랑하는 경량 멀티모달 언어모델과 국내 최초로 MoE(Mixture of Experts) 모델을 오픈소스로 공개했다고 24일 밝혔다.

 

카카오(대표이사 정신아)는 24일 허깅페이스를 통해 이미지 정보 이해 및 지시 이행 능력을 갖춘 경량 멀티모달 언어모델 `Kanana-1.5-v-3b`와 MoE 언어모델 `Kanana-1.5-15.7b-a3b`를 공개했다.

카카오(대표이사 정신아)는 오늘 허깅페이스를 통해 이미지 정보 이해 및 지시 이행 능력을 갖춘 경량 멀티모달 언어모델 `Kanana-1.5-v-3b`와 MoE 언어모델 `Kanana-1.5-15.7b-a3b`를 공개했다. 이는 카카오가 독자적인 모델 설계 기반의 기술 경쟁력을 지속적으로 강화하고 있음을 보여주는 대목이다.

 

정부가 추진하는 `독자 AI 파운데이션 모델 프로젝트`에 참여하고 있는 카카오는 이러한 자체 모델 개발 역량과 카카오톡 등 대규모 서비스 운영 경험을 바탕으로 전 국민의 AI 접근성을 높이고 국가 AI 경쟁력 강화에 기여하겠다는 방침이다.

 

이미지와 텍스트를 동시에 처리하는 경량 멀티모달 언어모델 `Kanana-1.5-v-3b`는 지난 5월 공개된 Kanana 1.5 모델을 기반으로 한다. 이 모델은 개발의 처음부터 마지막 단계까지 카카오의 자체 기술로 구축하는 `프롬 스크래치(From Scratch)` 방식으로 개발되었다.

 

`Kanana-1.5-v-3b`는 이용자의 질문 의도를 정확히 이해하는 높은 지시 이행 성능과 뛰어난 한국어·영어 이미지 이해 능력을 자랑한다.

 

경량 모델임에도 이미지로 표현된 한국어와 영어 문서 이해 능력은 글로벌 멀티모달 언어모델인 GPT-4o와 견줄 만한 수준이며, 한국어 벤치마크에서는 유사 사이즈의 국내외 공개 모델 중 최고 점수를 기록했다.

 

카카오는 인간 선호 반영 학습(Human Preference Alignment Training)과 지식 증류(Knowledge Distillation) 기술을 통해 이 모델의 성능을 극대화했다고 설명했다.

 

이를 통해 `Kanana-1.5-v-3b`는 이미지 및 글자 인식, 동화 및 시 창작, 국내 문화유산 및 관광지 인식, 도표 이해, 수학 문제풀이 등 다양한 분야에서 유연하게 활용될 수 있다.

 

이와 함께 카카오는 국내 최초로 MoE(Mixture of Experts) 구조의 언어모델 `Kanana-1.5-15.7b-a3b`를 오픈소스로 공개했다. MoE 모델은 입력 데이터 처리 시 모든 파라미터가 연산에 참여하는 기존 `밀집(Dense)` 모델과 달리, 특정 작업에 최적화된 일부 전문가 모델만 활성화되어 컴퓨팅 자원 활용 효율성과 비용 절감에 강점을 가진다.

 

이러한 장점으로 MoE는 글로벌 AI 모델 개발의 새로운 트렌드로 자리 잡고 있다. `Kanana-1.5-15.7b-a3b`는 전체 15.7B 파라미터 중 추론 시 약 3B 파라미터만 활성화되며, `업사이클링(Upcycling)` 방식을 적용해 효율적으로 개발되었다.

 

활성화되는 파라미터가 3B에 불과함에도 성능은 `Kanana-1.5-8B`와 동등하거나 그 이상을 기록해, 고성능 AI 인프라를 저비용으로 구축하고자 하는 기업이나 연구 개발자들에게 큰 도움이 될 것으로 기대된다.

 

카카오는 이번 오픈소스 공개를 통해 AI 모델 생태계에 새로운 기준을 제시하고, 더 많은 연구자와 개발자가 효율적이고 강력한 AI 기술을 자유롭게 활용할 수 있는 기반을 마련해 나갈 계획이다.

 

김병학 카나나 성과리더는 "이번 오픈소스 공개는 비용 효율성과 성능이라는 유의미한 기술 개발의 성과를 거둔 것으로, 단순한 모델 아키텍처의 진보를 넘어 서비스 적용과 기술 자립이라는 두 가지 측면의 목표에 부합하는 결과물"이라고 밝혔다.

 

카카오는 자체 기술 기반의 모델을 지속적으로 고도화하고, 글로벌 플래그십 수준의 초거대 모델 개발에 도전하며 국내 AI 생태계의 자립성과 기술 경쟁력 강화에 기여할 방침이다.

 

0
  • 목록 바로가기
  • 인쇄


서초구
국민신문고
HOT ISSUE더보기
많이 본 뉴스더보기
  1. 안산시, 경제사절단 꾸려 로봇산업 국제교류·투자유치 나서 안산시(시장 이민근)는 지난 2일 이민근 시장을 단장으로 한 `안산시 로봇산업 육성 경제사절단`을 구성해 4박 5일 일정으로 일본 도쿄 출장길에 올랐다고 3일 밝혔다.이번 방문은 지난 9월 경기경제자유구역으로 지정된 ASV 지구를 해외에 알리고, 일본을 비롯한 글로벌 로봇산업 관련 기업의 투자유치를 모색하기 위해 추진됐다.경제사절단..
  2. LG U+, BC카드 정보 활용해 익시오 고도화한다 LG유플러스가 BC카드가 보유한 데이터를 활용해 AI 통화앱 `익시오(ixi-O)` 서비스 고도화를 추진한다.카드사가 보유한 결제 데이터를 기반으로 익시오 AI 검색 기능의 정확도와 품질을 높이는 것이 목표다.양사는 지난 3일 서울 종로구 BC카드 본사에서 `BC카드 가맹점 데이터 연계 LG U+ 익시오 서비스 제휴 협약`을 체결했다.이날 협약식에는 최..
  3. 부천시, 이동 데이터 분석으로 ‘30분대 생활권’ 실태 확인 부천시가 유동인구 데이터를 분석해 시민들의 생활이동 전반이 평균 30분대에서 이뤄진다는 사실을 확인했다.부천시는 4일 SK텔레콤의 기지국 신호 기반 유동인구 데이터를 활용해 지난 4월 한 달간 시민 이동 패턴을 분석했다고 밝혔다. 분석 결과 부천에서 출근·쇼핑·의료·여행 등 주요 생활활동이 평균 30분대 이동으로 가...
  4. 현대차그룹, 월드 하이드로젠 엑스포 2025 참가 현대차그룹이 ‘월드 하이드로젠 엑스포 2025(World Hydrogen Expo 2025, 이하 WHE 2025)’에 참가해 수소 기술을 소개하고 파트너십을 확대하며 글로벌 수소 리더로서의 입지를 강화한다.  WHE 2025는 2020년부터 개최해 온 국내 대표 수소 산업 전시회 ‘H2 MEET’와 지난해 수소의 날(11월 2일) 기간 중 열린 국내 최대 규모의 수소 국제 콘퍼런스를 통...
  5. `KTR 시흥 바이오메디컬 연구소` 4일 첫 삽…AI·바이오 융합 클러스터 조성 박차 시흥시(시장 임병택)는 오는 12월 4일 오후 3시, 경기경제자유구역 시흥 배곧지구 연구용지 1-2(배곧동 270)에서 한국화학융합시험연구원(이하, KTR)이 주최하는 `KTR 시흥 바이오메디컬 연구소 기공식`에 참석한다.KTR은 총사업비 1,250억 원을 투입해 국가공인 바이오 분야 인증시설과 유전자치료제 연구 플랫폼을 갖춘 `KTR 시흥 바이오메디컬 연..
  6. 하나금융, 두나무와 블록체인 기술 기반 글로벌 금융서비스로 새로운 가치창출 나서 하나금융그룹(회장 함영주)은 지난 3일 오후 하나금융그룹 명동사옥에서 두나무(대표이사 오경석)와 블록체인 기술을 활용한 금융서비스 공동 개발을 위한 업무협약을 체결했다고 밝혔다.이날 협약식은 양사의 주요 경영진이 한자리에 모여 상호 간 신뢰를 재확인하고, ▲블록체인 기반 해외송금 프로세스 구축 ▲외국환 업무 전반의 신기.
  7. 남동구, 마을 세무사 `무료 세무 상담의 날` 큰 호응 인천시 남동구는 지난달 3회에 걸쳐 진행된 하반기 마을 세무사 `무료 세무 상담의 날`이 구민들로부터 큰 호응을 얻었다고 4일 밝혔다.무료 세무 상담은 구민들이 세금 문제를 쉽게 해결할 수 있도록 지원하기 위해 마련됐으며, 영세사업자와 취약계층을 중심으로 운영됐다.상담을 통해 소득세, 상속·증여세 등 실생활과 밀접한 세목을...
모바일 버전 바로가기