본문 바로가기

데이터 확보 경쟁 치열…AI용 고품질 데이터 필요해

메타데이터 표준인 DCAT 표준의 이해와 적용 중요해

데이터 확보 경쟁 치열…AI용 고품질 데이터 필요해

[산업일보]
인공지능(AI)의 적용이 확대되면서 데이터 유통을 촉진하는 메타데이터 표준인 DCAT(Digital Catalogue Vocabulary) 표준의 이해와 적용이 매우 중요하며, AI의 성능을 높이기 위한 고품질 데이터 확보를 위한 노력이 필요하다는 주장이 제기됐다.

한국지능정보사회진흥원(NIA)의 '데이터 유통 및 데이터 품질 기술동향' 보고서는 세계적으로 데이터 확보를 위한 경쟁이 치열해지면서 데이터 유통을 촉진하는 메타데이터 표준인 DCAT 표준의 이해와 적용은 매우 중요하다고 강조했다.

또한 AI는 학습에 사용되는 데이터의 품질에 따라, 예측 성능에 큰 차이가 있기 때문에 데이터의 품질을 높이기 위한 노력이 필수적이라고 덧붙였다.

더불어, AI는 학습 데이터에 내재된 편향성에 의해 편향된 예측 결과를 내놓을 수 있다는 것이 여러 사례로 증명됐다고 지적하며, AI에만 특화된 데이터 품질이 필요할 수 있다고 지적했다.

보고서는 AI의 활성화를 위해서는 데이터 유통과 데이터품질 표준을 적용해야 한다고 지적하며, 우리나라의 경우 NIA가 추진하는 통합데이터 지도 사이트가 DCAT 2.0을 기반으로 구축됐지만 EU 데이터 포털과 같이 데이터 품질과 관련된 내용을 DQV(Data Quality Vocabulary) 표준에 맞춰서 보완이 필요하다고 분석했다.

데이터 유통을 촉진하는 메타데이터 표준인 DCAT는 W3C가 데이터 카탈로그의 실현을 위해 ’14년에 제시한 후 ’20년에 DCAT 2.0 버전으로 개정했다.

이 보고서의 저자인 안양대학교 정의현 교수는 올해 5월 기준으로 DCAT 3.0 개정 작업의 WD(Working Draft)가 진행 중으로, 여기에는 판올림 기능이 추가됐는데, 데이터 포털의 지속 가능성에 도움이 될 수 있으므로 지원 여부가 고려돼야 할 것이라고 밝혔다.
김원정 기자 sanup20@kidd.co.kr

제조기업 강국이 되는 그날까지, 공장자동화 스마트팩토리에 대한 뉴스를 기획·심층 보도하겠습니다.

이 기자의 다른기사 보기 >
ad광고추천제품

0 / 1000

추천제품

1/9

가상화폐 시세

loader
Bitcoin logo icon

비트코인

%
Ethereum logo icon

이더리움

%
Ripple logo icon

리플

%
Provided by Bithumb logo icon