LG CNS는 AI의 자연어 이해를 위한 한국어 표준데이터 10만여개를 제작해 국내 AI 업계에 무료로 개방한다고 밝혔다.

언어 AI 개발을 위해서는 학생들이 공부하는 교과서와 유사한 개념인 AI 학습용 표준데이터가 필요하다.

해외는 미국 스탠포드대학, 마이크로소프트 등이 제작한 영문 표준데이터가 존재해 AI 개발에 활용되고 있으나 국내는 한국어 표준데이터가 없어 영문을 번역하거나 자체적으로 데이터를 마련해야 했다.

LG CNS는 지난해 12월 위키백과 정보를 기반으로 AI 학습용 한국어 표준데이터 7만개가 탑재된
‘코쿼드 1.0’을 제작해 AI 업계에 공개한 바 있다.

LG CNS는 5일 강서구 마곡 LG사이언스파크에 국내 AI 전문가 300여명을 초청해 AI 커뮤니티 행사 ‘AI Tech Talk(테크톡) for NLU*’을 열어 ‘코쿼드 2.0’ 출시를 발표했다.

‘코쿼드 2.0’은 ‘코쿼드 1.0’ 대비 한국어 표준데이터를 7만개에서 10만개로 확대하고, 단답형에서
장문의 답변이 가능한 AI를 개발할 수 있도록 데이터를 강화한 버전이다.

‘AI Tech Talk(테크톡) for NLU’ 행사에는 한국전자통신연구원(ETRI), 서울대, 카이스트 등에서 연구진 및 교수진이 연사로 참석해 언어 AI 연구 성과 및 최신 기술 트렌드를 공유했다.

LG CNS CTO(최고기술책임자) 현신균 부사장은 “응용분야가 무궁무진한 AI 언어 개발 분야에서 내부적으로 쌓은 데이터를 AI 업계 전체에 개방해 국내 AI 연구자들 간 상생을 위한 AI 개방형 생태계 조성에 기여코자 한다”고 밝혔다.

김광회 기자 elian118@nextdaily.co.kr

저작권자 © 넥스트데일리 무단전재 및 재배포 금지