기사 메일전송
카카오, 생성형 AI 안전성 위한 `Kanana Safeguard` 공개…국내 최초 오픈소스 배포
  • 김영찬 기자
  • 등록 2025-05-28 12:10:35

기사수정
  • 한국어 특화된 AI 가드레일 모델 3종 허깅페이스 통해 공개
  • 유해 콘텐츠·법적 위험·악의적 프롬프트 탐지 기능 포함
  • Apache 2.0 라이선스로 상업적 활용 가능…AI 생태계 기여 강조

카카오는 27일, 생성형 AI의 안전성과 신뢰성을 검증할 수 있는 AI 가드레일 모델 ‘Kanana Safeguard’를 개발하고 국내 기업 최초로 오픈소스 형태로 공개했다고 밝혔다.

 

카카오는 27일, 생성형 AI의 안전성과 신뢰성을 검증할 수 있는 AI 가드레일 모델 `Kanana Safeguard`를 개발하고 국내 기업 최초로 오픈소스 형태로 공개했다고 밝혔다.

이번 공개는 생성형 AI 기술이 빠르게 확산되며 사회적 우려가 커지는 가운데, 안전하고 책임 있는 AI 생태계를 조성하기 위한 선제적 대응의 일환이다.

 

‘Kanana Safeguard’는 카카오가 자체 개발한 언어모델 ‘Kanana’를 기반으로 한국어 및 한국 문화에 최적화된 성능을 갖춘 것이 특징이다. 자체 구축한 한국어 데이터셋을 활용했으며, F1 스코어 평가 결과 글로벌 모델 대비 우수한 성과를 보인 것으로 알려졌다.

 

공개된 모델은 총 3종이다. 기본형인 ‘Kanana Safeguard’는 AI 서비스 내에서 증오, 괴롭힘, 성적 콘텐츠 등 유해 발화를 탐지하는 역할을 하며, ‘Kanana Safeguard-Siren’은 개인정보, 저작권 등 법적 민감 정보를 식별한다. 마지막으로 ‘Kanana Safeguard-Prompt’는 AI를 악용하려는 시도나 위험한 프롬프트를 감지하도록 설계됐다.

 

이 모델들은 모두 세계 최대의 오픈소스 AI 플랫폼인 허깅페이스(Hugging Face)를 통해 다운로드 가능하며, 상업적 활용과 수정·재배포가 자유로운 아파치 2.0(Apache 2.0) 라이선스를 적용받는다.

 

카카오 김경훈 AI Safety 리더는 “기술 발전과 함께 AI의 윤리와 안전에 대한 논의가 더욱 중요해지고 있다”며 “Kanana Safeguard의 오픈소스 배포를 통해 책임감 있는 AI 개발과 활용 문화가 확산되길 기대한다”고 밝혔다.

 

카카오는 향후 지속적인 업데이트를 통해 모델의 고도화를 추진하고, 국내외 AI 기술 안전성 강화에 적극 기여할 방침이다.

 

0
  • 목록 바로가기
  • 인쇄


서초구
국민신문고
HOT ISSUE더보기
많이 본 뉴스더보기
  1. 네이버웹툰, 숏폼 애니메이션 ‘컷츠’ 공개…9월 1일 정식 출시 네이버웹툰이 숏폼 애니메이션 서비스 ‘컷츠(Cuts)’를 공개하며 웹툰 기반 콘텐츠 생태계 확장에 나섰다.네이버웹툰은 25일 “오늘부터 앱(App)을 통해 컷츠를 점진적으로 배포하고, 오는 9월 1일 정식 출시 이후 누구나 애니메이션을 업로드하고 감상할 수 있게 된다”고 밝혔다. 컷츠는 2분 이내의 짧은 애니메이션을 제작·...
  2. SKT ‘스페셜T’ 참여 고객 20만 명 돌파…장기 고객 혜택 업그레이드 SK텔레콤의 장기 고객 혜택 프로그램 ‘스페셜T’가 누적 참여 고객 20만 명을 돌파했다. SKT는 이를 기념해 장기 고객 대상 맞춤 혜택을 확대하고 신규 프로그램을 선보인다.SKT(대표이사 사장 유영상)는 25일 “지난해 1월 론칭한 스페셜T가 고객 호평 속에 1년 7개월 만에 참여자 20만 명을 넘어섰다”며 “조용필 콘서트 초청, ..
  3. 여행·브이로그 필수품 ‘액션카메라’…제품별 성능 차이 뚜렷 여행과 브이로그 촬영 등에서 활용되는 ‘액션카메라’의 주요 제품 간 성능 차이가 크다는 시험평가 결과가 나왔다. 한국소비자원(원장 윤수현)은 25일 액션카메라 6개 브랜드 제품을 대상으로 화질, 배터리 성능, 방수, 내환경 성능 등 품질과 안전성을 비교한 결과를 발표했다. 이번 비교정보는 ‘소비자24’ 내 ‘비교공감&...
  4. 삼성전자·존스홉킨스대, ‘차세대 펠티어 냉각 기술’로 R&D 100 어워드 수상 삼성전자와 존스홉킨스대학교 응용물리학연구소가 공동 연구한 ‘차세대 펠티어 냉각 기술’이 미국 R&D 월드 매거진이 주관하는 ‘2025 R&D 100 어워드’에서 100대 혁신 기술로 선정됐다.1963년 제정된 R&D 100 어워드는 매년 과학기술 발전에 기여한 가장 혁신적인 기술을 선정하는 세계적 권위의 상으로, ‘산학 혁신의 ...
  5. 운전석 없는 자율주행셔틀, 9월 말 청계천서 첫 운행 서울시가 국내 최초로 운전석과 운전대가 없는 자율주행셔틀을 9월 말부터 청계천에서 운행한다고 밝혔다. 이번 시범 운행은 청계광장부터 광장시장을 지나 다시 청계광장으로 이어지는 4.8㎞ 구간에서 이뤄지며, 시민들은 무료로 체험할 수 있다.운행에 투입되는 차량은 오토노머스에이투지가 순수 국내 기술로 개발한 11인승 소형버스로, ...
  6. KT, 국내 최초 AI-RAN 상용 검증…네트워크 혁신 가속 KT(대표이사 김영섭)가 상용 5G 네트워크에서 AI-RAN(Artificial Intelligence Radio Access Network, 인공지능 기반 무선접속망) 기술 검증을 시작했다고 26일 밝혔다.AI-RAN은 기지국과 네트워크 서버의 사이에 오가는 트래픽 데이터를 실시간으로 분석해 최적의 네트워크 환경을 제공하는 차세대 통신망 기술이다.AI-RAN 기술이 적용된 기지국은 전용 AI 엔진..
  7. 서울시, 하수도·쓰레기 관리 강화… 도심 쥐·야생너구리 피해 예방 나선다 서울시가 최근 기후변화로 인한 도심 내 쥐 출몰 사례 증가와 야생 너구리 발견에 대응해 하수도 정비, 음식물쓰레기 관리 강화, 도심 녹지 확충 등 종합 대책을 추진한다고 26일 밝혔다. 시는 감염병 매개 가능성을 차단하고 시민 불안을 줄이기 위해 정기 방역과 홍보 활동도 강화한다는 방침이다.서울시는 집중호우에 따른 하수관 침수, 재...
모바일 버전 바로가기