본문 바로가기
  • 유해게시물신고
한국딥러닝, VLM 기반 ‘딥 에이전트’ 공개… 제조·금융 비정형 문서 처리 정조준
임지원 기자|jnews@kidd.co.kr
페이스북 트위터 카카오스토리 네이버블로그 프린트 PDF 다운로드

한국딥러닝, VLM 기반 ‘딥 에이전트’ 공개… 제조·금융 비정형 문서 처리 정조준

도면 기호·화살표 인과관계 분석… 제조 공정 검수 자동화

기사입력 2026-06-20 12:02:33
페이스북 트위터 카카오스토리 네이버블로그 프린트 PDF 다운로드
한국딥러닝, VLM 기반 ‘딥 에이전트’ 공개… 제조·금융 비정형 문서 처리 정조준

[산업일보]
문서 인공지능(AI) 솔루션 전문 기업 한국딥러닝이 ‘넥스트라이즈 2026 서울(NextRise 2026, Seoul)’에 참가해 자체 비전-언어 모델(VLM)을 적용한 AI 에이전트 ‘딥 에이전트(DEEP AGENT)’를 소개했다. 행사는 코엑스에서 18일부터 19일까지 진행됐다.

딥 에이전트는 지능형 인식 엔진 ‘딥 OCR’과 문서 구조를 분석하는 ‘딥 파서(Deep Parser)’로 이뤄졌다. 지난 4월 글로벌 멀티모달 벤치마크 ‘OCRBench v2’에서 구글 ‘제미나이(Gemini)’ 등을 제치고 1위를 기록한 원천 기술을 바탕으로 한다.

한국딥러닝 관계자는 “AI가 단순히 문자를 텍스트로 추출하는 단계를 지나, 문서 내 구조를 이해하고 각 데이터 간의 연관성까지 파악하는 파싱 역량을 객관적으로 입증한 결과”라고 설명했다.

이 기술은 제조 산업 현장의 자동화 수요를 겨냥했다. 손영규 기술사업팀장은 “기존 광학문자인식(OCR) 기술은 도면 내 화살표가 가리키는 대상이나 부품 상징 기호 간의 연관성을 구조적으로 인지하지 못했다”며 “딥 에이전트는 VLM을 기반으로 상황에 맞는 부품 기호를 이해하고, 화살표의 흐름 등 연결 구조를 개별 데이터로 쪼개어 파악한다”고 말했다.

이를 통해 자재명세서(BOM)나 작업 지시서 등 복잡한 비정형 문서도 별도의 데이터 라벨링이나 사전 학습 없이 처리할 수 있다. 전사적자원관리(ERP) 시스템과 연동해 설계상의 매핑 오류나 적합성 여부까지 스스로 판단하는 검수 기능도 지원한다.

손 팀장에 따르면, 과거에는 AI가 문서 내 화살표 등 기호의 흐름을 단편적인 이미지로만 인식해 전체적인 플로우를 파악하기 어려웠다. 현재는 자체 비전-언어 모델을 바탕으로 아이템 간의 인과관계를 판단하고 데이터를 추출하는 단계로 발전했다.

회사는 금융 분야 적용 사례도 함께 제시했다. 대출심사 서류나 여신·심사 문서에서 금액, 날짜 등 주요 수치 정보가 다른 값으로 읽히는 환각(할루시네이션) 현상을 차단해 정교한 데이터 추출을 돕는다. 회사는 별도의 사전 학습이나 구축 과정 없이 평균 2주 내 현장 도입이 가능하다고 덧붙였다.

한편, 한국딥러닝은 2019년부터 2023년까지 5년간 누적 총 매출액 약 100억 원을 달성했으며, 이 같은 기술력을 인정받아 지난해 하반기 120억 원 규모의 시리즈 A 투자를 유치했다.



0 / 1000
주제와 무관한 악의적인 댓글은 삭제될 수 있습니다.
0 / 1000




제품등록 무료 제품 거래 비용 없음!



산업전시회 일정




다아라 기계장터 제품등록 무료