기사 메일전송
나라지식정보 ‘2025년 AI 학습용 데이터 구축 및 고도화 성과보고회’ 우수사례 발표
  • 이창준 기자
  • 등록 2025-12-22 19:07:35
기사수정
  • NIA 주최 성과보고회에서 자사 데이터 업사이클링(모빌리티) 사업 성과 공유
  • 기구축 자율주행 데이터 재활용해 차세대 자율주행·모빌리티 AI 개발 기반 마련

`2025년 AI 학습용 데이터 구축 및 고도화 성과 보고회`에서 우수사례 발표 중인 나라지식정보 박영훈 부장

과학기술정보통신부가 주최하고 한국지능정보사회진흥원(NIA)이 주관한 ‘2025년 AI 학습용 데이터 구축 및 고도화 성과보고회’가 12월 18일 서울 코엑스에서 열렸다. 나라지식정보(대표 손영호)는 이 데이터 주간 행사에서 데이터 구축 과제 우수사례 발표를 통해 ‘데이터 업사이클링’ 모빌리티 분야 사업 추진 내용과 주요 성과를 공유했다.

 

나라지식정보 컨소시엄이 구축한 업사이클링 모빌리티 데이터는 기존 자율주행 원천 데이터셋을 재가공해 최신 AI 연구 흐름에 맞게 고품질화한 것이다. 수집된 대규모 주행 영상 데이터에 텍스트-이미지 관계 구축, 질의응답(QA) 데이터 구축, 데이터 다운사이징 등의 가공 작업을 거쳐 멀티모달 AI 학습용 데이터로 재가공했다. 이후 다단계 품질 검증을 통해 데이터 정확성과 유용성을 확보하고, AI 모델 학습 테스트를 통해 성능 향상을 입증했다. 이렇게 완성된 모빌리티 데이터셋은 AI 허브를 통해 공개돼 자율주행분야 연구자와 산업계에 활용될 예정이다.

 

업사이클링된 데이터의 활용 의의는 매우 크다. 먼저 시각정보와 판단논리가 결합된 이번 데이터셋은 기존의 규칙 기반(Rule-based) 알고리즘이 아닌 거대 언어 모델(LLM)과 멀티모달(Multimodal) 기술이 결합된 엔드투엔드 자율주행 AI 모델 개발에 활용될 수 있다. 또한 교통 법규와 도로 상황 Q&A 등 모빌리티 특화 지식이 포함돼 있어 이른바 ‘모빌리티AI’ 개발의 토대가 될 것으로 기대된다. 아울러 다양한 주행 시나리오별 질의응답 데이터와 경량화된 영상 데이터는 가상 환경에서의 자율주행 알고리즘 검증에 쓰이며, 실제 도로에서는 시험하기 어려운 위험상황도 집중 테스트함으로써 자율주행차 상용화 시기를 앞당기는 데 기여할 전망이다.

 

손영호 나라지식정보 대표는 “앞으로도 업사이클링 사업 참여 등을 통해 AI 기술 혁신으로 다양한 산업 발전에 기여하겠다”고 소감을 밝혔다. 이어 “축적된 경험과 자체 AI 기술력을 바탕으로 데이터전처리솔루션 개발을 통해 디지털 지식정보화 사업을 꾸준히 확대해 나갈 것”이라고 향후 계획을 전했다.

 

한편 나라지식정보는 2008년 설립된 이래 한국의 언어·역사·문화 데이터를 중심으로 국립국어원, 국가기록원, NIA 등 180여 기관에 약 600건의 공공 데이터·AI 사업을 수행해 온 지식정보화 전문 기업이다. 자체 개발한 고문헌, 비정형 모두 정확성과 신뢰도 높은 AI OCR 엔진과 XAI로서의 RAG NA-LLM, AI Agent 등의 기술력을 보유함으로써 수작업이 필요한 아날로그 기록물을 AI로 디지털 전환해 지식 콘텐츠로 활용하는 디지털 혁신 서비스를 다수 제공하고 있다. 이번 모빌리티 데이터 업사이클링 사업 외에도 다양한 산업 분야에서 AI 데이터 구축 및 활용 사업을 전개하며 공공과 민간의 AI 경쟁력 강화에 이바지하고 있다.

 

0
사이드 기본배너01-유니세프
사이드 기본배너02-국민신문고
모바일 버전 바로가기