채온11.png

채온22.png

개요

본 프로젝트는 기업의 복잡한 업무 규정 및 프로세스 문서를 효율적으로 탐색하기 위한 멀티모달 RAG(Retrieval-Augmented Generation) 기반의 AI 챗봇 구축을 목표로 합니다. 단순 텍스트 검색의 한계를 넘어, 실제 비즈니스 문서에 빈번하게 등장하는 표, 그래프, 이미지 등 비정형 데이터를 정확하게 해석하고 응답에 반영하는 데 초점을 맞췄습니다.

문서 내 정교한 데이터 추출을 위해 Vision 기술을 활용한 Markdown 변환 및 이미지 캡셔닝 파이프라인을 설계했습니다. 특히 검색의 정밀도를 높이기 위해 원본 맥락을 유지하는 부모(Parent) 문서와 검색 효율에 최적화된 자식(Child) 토큰을 분리(청킹 구조)하여 저장하는 하이브리드 인덱싱 방식을 로컬 ChromaDB 구현했습니다.

또한, LlamaIndex 를 도입하여 단순한 일회성 답변이 아닌, 질문의 의도를 분석하고 결과의 적절성을 스스로 검증하는 에이전틱 워크플로우를 구성함으로써 기업용 서비스에 필요한 답변의 신뢰성을 확보했습니다.

기술 스택

고도화핵심