국립국어원, 인공지능 학습용 한국어 자료 공개

국립국어원, 인공지능 학습용 한국어 자료 공개

이경우 기자
입력 2022-04-03 20:28
수정 2022-04-03 20:47
  • 기사 읽어주기
    다시듣기
  • 글씨 크기 조절
  • 댓글
    0
신문, 국회 회의록, 온라인 대화 등 11종

국립국어원은 인공지능(AI) 학습용 한국어 자료 11종(신규 8종, 정비 3종)을 지난 1일 공개했다.

이번에 공개된 자료는 35개 매체의 2021년 신문 기사, 2003년부터 2020년까지 만들어진 국회 소위원회 회의록, 온라인상 대화 등이다. 한국어의 특성을 반영해 속성 기반으로 감성을 분석한 말뭉치, 일반인이 문장에서 추측할 수 있는 가설을 확신하는 정도를 표시한 추론 확신성 말뭉치도 있다.

이 밖에 개체명 분석 말뭉치에 위키피디아의 지식 정보를 연결한 개체 연결 자료, 인공지능이 인터넷상의 우리말 자료를 쉽게 분석할 수 있도록 교정한 맞춤법 교정 말뭉치도 공개됐다. 온라인 약정서를 작성해 승인받으면 누구나 이용할 수 있다.

<말뭉치 신청 절차>


Copyright ⓒ 서울신문 All rights reserved. 무단 전재-재배포, AI 학습 및 활용 금지
close button
많이 본 뉴스
1 / 3
챗GPT의 성(性)적인 대화 허용...여러분의 생각은 어떤가요?
글로벌 AI 서비스 업체들이 성적인 대화, 성애물 등 ‘19금(禁)’ 콘텐츠를 본격 허용하면서 미성년자 접근 제한, 자살·혐오 방지 등 AI 윤리·규제 논란이 한층 가열되고 있다. 챗GPT 개발사인 오픈AI도 ‘GPT-4o’의 새 버전 출시 계획을 알리며 성인 이용자에게 허용되는 콘텐츠 범위를 확대하겠다고 밝혔다. 19금 대화가 가능해지는 챗GPT에 대한 여러분은 생각은 어떤가요?
1. 찬성한다.
2. 반대한다.
광고삭제
광고삭제
위로