본문 바로가기
  • 유해게시물신고
데이터 확보 경쟁 치열…AI용 고품질 데이터 필요해
김원정 기자|sanup20@kidd.co.kr
페이스북 트위터 카카오스토리 네이버블로그 프린트 PDF 다운로드

데이터 확보 경쟁 치열…AI용 고품질 데이터 필요해

메타데이터 표준인 DCAT 표준의 이해와 적용 중요해

기사입력 2021-06-06 14:11:14
페이스북 트위터 카카오스토리 네이버블로그 프린트 PDF 다운로드
데이터 확보 경쟁 치열…AI용 고품질 데이터 필요해

[산업일보]
인공지능(AI)의 적용이 확대되면서 데이터 유통을 촉진하는 메타데이터 표준인 DCAT(Digital Catalogue Vocabulary) 표준의 이해와 적용이 매우 중요하며, AI의 성능을 높이기 위한 고품질 데이터 확보를 위한 노력이 필요하다는 주장이 제기됐다.

한국지능정보사회진흥원(NIA)의 '데이터 유통 및 데이터 품질 기술동향' 보고서는 세계적으로 데이터 확보를 위한 경쟁이 치열해지면서 데이터 유통을 촉진하는 메타데이터 표준인 DCAT 표준의 이해와 적용은 매우 중요하다고 강조했다.

또한 AI는 학습에 사용되는 데이터의 품질에 따라, 예측 성능에 큰 차이가 있기 때문에 데이터의 품질을 높이기 위한 노력이 필수적이라고 덧붙였다.

더불어, AI는 학습 데이터에 내재된 편향성에 의해 편향된 예측 결과를 내놓을 수 있다는 것이 여러 사례로 증명됐다고 지적하며, AI에만 특화된 데이터 품질이 필요할 수 있다고 지적했다.

보고서는 AI의 활성화를 위해서는 데이터 유통과 데이터품질 표준을 적용해야 한다고 지적하며, 우리나라의 경우 NIA가 추진하는 통합데이터 지도 사이트가 DCAT 2.0을 기반으로 구축됐지만 EU 데이터 포털과 같이 데이터 품질과 관련된 내용을 DQV(Data Quality Vocabulary) 표준에 맞춰서 보완이 필요하다고 분석했다.

데이터 유통을 촉진하는 메타데이터 표준인 DCAT는 W3C가 데이터 카탈로그의 실현을 위해 ’14년에 제시한 후 ’20년에 DCAT 2.0 버전으로 개정했다.

이 보고서의 저자인 안양대학교 정의현 교수는 올해 5월 기준으로 DCAT 3.0 개정 작업의 WD(Working Draft)가 진행 중으로, 여기에는 판올림 기능이 추가됐는데, 데이터 포털의 지속 가능성에 도움이 될 수 있으므로 지원 여부가 고려돼야 할 것이라고 밝혔다.

제조기업 강국이 되는 그날까지, 공장자동화 스마트팩토리에 대한 뉴스를 기획·심층 보도하겠습니다.


0 / 1000
주제와 무관한 악의적인 댓글은 삭제될 수 있습니다.
0 / 1000




제품등록 무료 제품 거래 비용 없음!



산업전시회 일정




다아라 기계장터 제품등록 무료