블로그 바로가기

서비스

수년간의 번역 경력과 노하우를 보유한 글나무의 서비스를 만나보세요.

AI 데이터 구축

번역회사의 한계를 뛰어넘어 인공지능 데이터 산업의 발전에 기여합니다!

개인정보처리방침

닫기

이메일무단수집거부

닫기

언어를 또 다른 언어로 옮기는 단순 번역을 넘어,
AI 모델 개발, 인공지능 학습데이터 구축의 전문 기업으로서 글나무가 미래 산업에 앞장서겠습니다.

'디지털 뉴딜' 의 대표 사업인 AI 서비스 개발에서 빅데이터 구축의 필요성이 대두되며 '말뭉치 사업'이 주목받고 있습니다. AI 모델의 성능은 데이터의 품질과 직결되기 때문에 학습데이터의 중요성을 이해하며 대규모·고품질의 데이터를 구축 및 관리하고, 나아가 새로운 비즈니스 가치를 창출해 나갈 수 있는 전문가가 필요합니다.
글나무는 창립과 동시에 한국지능정보사회진흥원의 말뭉치 사업에 매년 참여하며 전문 PM, 분야별 전문 번역사, 수백 명의 크라우드워커를 양성하였고, 효율적으로 품질을 검증할 수 있는 방법을 끊임없이 연구하여 번역 검수기를 개발해 냈습니다.

* 말뭉치(Corpus)란? 언어 연구를 위해 컴퓨터가 텍스트를 가공, 처리, 분석할 수 있는 형태로 모아놓은 말모듬

AI 데이터 구축 프로세스

01설계

  1. ·데이터 구축 및 활용 목적 정의
  2. ·공정별 가이드라인 및 저작도구 개발
  3. ·AI 모델 개발 계획

02수집

  1. ·원시데이터 수집 기준 수립 및 획득
  2. ·획득한 원시데이터의 적합성 검사

03정제

  1. ·원시데이터 정제 기준 수립
  2. ·문장유사도 검사, 개인정보비식별화,
    불필요한 접속사 및 단어 정제 등

04가공

  1. ·정제데이터의 언어별 번역 및 감수
  2. ·도메인별, 언어별 TB 구축

05검수

  1. ·데이터 품질 검수 기준 수립 및 평가

데이터 구축 실적