본문 바로가기

‘빅데이터’와 ‘머신러닝’과의 호흡, 미래 예측 정확성 높여

예측 신뢰도 떨어트리는 ‘데이터 편향성’ 경계해야

‘빅데이터’와 ‘머신러닝’과의 호흡, 미래 예측 정확성 높여

[산업일보]
‘미래 예측’은 실수를 줄이며 철저한 준비를 가능케 한다는 점에서 전 산업 분야에 걸쳐 불가결한 부분으로 여겨진다. 빅데이터 시대가 도래함에 따라 데이터를 활용해 유용한 정보를 추출하는 새로운 예측법이 대두했다.

빅데이터 예측법은 인과관계에 기반한 ‘이론적 모델링’과 달리 상관관계를 바탕으로 결론을 도출해내는 ‘축약형 접근법’에 해당하는데, 기존 축약형 모델은 빅데이터를 다룰 수 있는 틀을 제공하지 못해 모델 설계자의 직관에 의한 설명 변수를 통해 예측이 이뤄진다는 단점이 있었다.

하지만 최근 ‘머신러닝’ 기술이 빅데이터 시대에 축약형 접근법을 가능케 하는 기술로 떠오르며 ‘빅데이터 축약형 접근법’을 통한 예측의 정확성과 신뢰도를 높이는 데 기여하고 있다.

포스코경영연구원의 보고서 ‘빅데이터 시대의 예측 도구, Machine Learning의 올바른 활용법’에 따르면 ‘머신러닝’은 예측 문제 환경에 대한 사전적인 지식 없이, 주어진 알고리즘만을 통해 데이터에 담긴 정보를 추출해내는 귀납적 방식으로, 다양한 구조의 데이터를 분석할 수 있다는 특징을 지녔다.

동향분석센터의 이성경 책임연구원은 “데이터가 실시간으로 기록되는 빅데이터 시대에 산업체에서의 머신러닝 기법을 활용한 예측의 활용방안은 무궁무진하다”라며 “최근 머신러닝에 대한 산업공학·물리학·통계학을 넘나드는 학계의 논의가 활발하지만, 실제 활용은 산업 현장의 주도로 이뤄지고 있다”라고 말했다.

이성경 책임연구원은 산업 현장에 적용되는 빅데이터 예측의 일례로 ▲구글 검색 데이터를 기반으로 한 소비자의 구매 패턴·기호 분석 ▲복지 향상과 효과적인 인사 인센티브 정책 고안 등의 스마트한 기업 경영을 위한 빅데이터 분석 ▲상품·원료가격 및 주요 경제예측을 위한 제조업계의 빅데이터 분석 등을 소개했다.

한편 이 책임연구원은 맥락에 대한 이해가 뒷받침되지 않은 기계적 학습의 폐해에 대해 경계하며 모델러에게 요구되는 자질로 ‘맥락에 맞는 데이터 활용 능력’을 제시했다.

이 연구원은 “아마존은 기존 직원들의 이력서에 담긴 정보를 머신러닝 기법으로 학습해 인사 채용에 활용했지만, 엔지니어에 남성 비중이 높다는 기존 데이터의 편향으로 인해 성차별적인 결과를 도출한다는 점을 발견하고 이를 폐지했다”라며 “빅데이터를 활용한 예측의 공정성과 정확성을 강화하기 위해서는 시시각각 변하는 사회의 상황과 각 산업의 특수성을 고려해 미세 조정을 할 수 있는 능력이 필요하다”라고 덧붙였다.

최수린 기자 sr.choi@kidd.co.kr

0 / 1000

주소 : 08217 서울시 구로구 경인로 53길 15, 업무A동 7층 | TEL : 1588-0914 | 신문사업.인터넷신문사업 등록번호 : 서울, 아00317 | 등록일자 2007년 1월29일

발행인 · 편집인 : 김영환 | 사업자번호 : 113-81-39299 | 통신판매 : 서울 구로-1499

로고

로고

대통령표창

산업일보의 사전동의 없이 뉴스 및 컨텐츠를 무단 사용할 경우 저작권법과 관련 법에 의거하여 제재를 받을 수 있습니다. COPYRIGHT© SINCE 1991 DAARA ALL RIGHT RESERVED

대통령표창

산업일보의 사전동의 없이 뉴스 및 컨텐츠를 무단 사용할 경우
저작권법과 관련 법에 의거하여 제재를 받을 수 있습니다.

COPYRIGHT© SINCE 1991 DAARA ALL RIGHT RESERVED