Customer Value

RAG 기술이 바꾸는
AI 응답의 기준

외부 데이터와 내부 지식을 연계해 신뢰도 높은 정보를 제공하며
정보 탐색과 검증을 자동화해 정확성을 높이고 지식 검색부터 문서 작성까지
업무 전반의 효율을 향상합니다.

  • 정확하고 신뢰할 수 있는 정보 제공

    외부와 내부 정보를 실시간으로 참조해, 최신성과 신뢰
    성을 갖춘 답변을 제공합니다.

    이를 통해 언제 어디서나 정확한 정보 제공이 가능해집니다.

  • 업무 생산성 및 퀄리티 향상

    KT의 RAG 기술은 정보 탐색과 검증을 자동화해 정확
    도를 높이고, 내부지식 검색,
    보고서 작성까지 다양한 업무의 효율과 만족도를 향상시킵니다.

Solution

K RAG 솔루션 구성

폭넓은 데이터 전처리 기능과 고성능 검색 기술을
통해, 다양한 정보를 더 빠르고 정확하게
활용할 수 있습니다.

DocuSee
IntelliSearch
LLM
Document pdf, doc, xls, ppt Document
Vector Store/DB Vector Store/DB
Context
Context

Query +
Search Results

Prompt

Prompt
Template

Fine-tuned sLLM Fine-tuned sLLM
Answer Answer
Question Question

Embedding flow-arrow

Pretrained sLLM Pretrained sLLM

Training flow-arrow

Chunking

flow-arrow

Embedding

Retrieve

flow-arrow

Passage
Rank & Filter

Augment

flow-arrow

Generate

flow-arrow

* DocuSee : 다양한 형태의 문서를 구조분석하는 전처리 엔진
* IntelliSearch : 지능형 검색 엔진

Technology 01

DocuSee

텍스트, 표, 이미지 등 문서 요소를 자동 인식해
AI가 이해하기 쉬운 구조로 정리하는
분석 솔루션입니다. 문단 순서, 표 구조, 문서 유형까지
정밀하게 처리해 RAG 성능을 높입니다.

DocuSee 특징

  • 최적화된 전처리 엔진

    • 문서를 구조분석하여 AI가 이해하기 쉬운
      형태로 전처리하는 엔진
  • 다양한 타입의 문서 양식 지원

    • HWP/PDF/Word/Excel/PPT/txt/JPG
      등 문서 타입 대부분 지원
  • 문서 내 요소 추출 기능

    • 복잡한 표 구조인식, 문단 레이아웃 형태
      추출
  • 문서 처리 특화 기능

    • 단락 간 포함관계 이해, 문서 유형 자동분류,
      키워드 추출

주요 기능

  • icon send

    OCR

    • 문서 내에 있는 텍스트를 추출하여 디지털
      텍스트로 변환하는 기술
    • 인쇄본/디자인 서체에 강인한 문자 인식
      모델
  • icon database

    Table Detection / Recognition

    • 문서 내에 있는 표에 대해 구조를 분석하고
      이를 데이터 형태로 변환하는 기술
    • 복잡한 형태의 표 구조 인식, 타사 대비 높은 정확도
  • icon tool

    Layout Analysis

    • 문서 내에서 텍스트 / 제목 / 표 / 그림 등
      다양한 요소들을 구분하고, 페이지 내의
      단락 및 문장의 구조를 분석하는 기술
  • icon chart

    Chart

    • 문서 이미지 내 차트 이미지를 인식하고 이를
      표 형태로 변환하는 기술
    • Bar / Line / Pie / 멀티 스택형 차트 데이터
  • icon tool

    Diagram Recognition

    • 수식/순서도 다이어그램 인식 기술
  • icon chart

    D-Parser

    • 문서 파일 확장자 별로 CPU 전용 고속 추출 분기 처리
Technology 02

IntelliSearch

내외부 데이터 검색결과를 바탕으로 답변을
제공하기 위한
Modular+Agentic RAG를
지원하는 지능형 검색엔진 입니다.

IntelliSearch 특징

  • KT Embedding / Reranker 모델

    • 한국어 검색 특화된 자체 학습 모델 보유
    • 고객 데이터에 최적화된 Fine-Tuning 제공
    • 지원언어 : 한국어, 영어
  • Modular RAG

    • 모듈화된 구성을 통한 시스템 유연성과 확장성 향상
    • Metadata Enrichment를 통한 검색 성능 향상
    • 키워드 검색과 벡터 검색을 통합한 하이브리드 검색
    • Query Reasoning(Multi-Query, Decomposition)을 통한 Dynamic Search
    • Knowledge Groundness Check를 통한 정확한 답변
  • Agentic RAG 공개 예정

    • 검색 → 분석 → 외부 도구 실행 → 재질문 등의 복잡한 문제 해결 과정을 Agent를 통해 제공
    • 지능적이고 자율적인 정보 검색 및 처리가 가능하여 심층적인 답변 제공
  • 고객 맞춤 기능

    • 고객 데이터 기반 색인/검색 구성 지원
    • 신뢰할 수 있는 출처표시와 추천 질문 제공
    • 상황별 RAG파이프라인 구성
      (10가지 이상의 옵션 제공)

RAG 특화 모델 3종

  • Embedding Model

    • What is

      단어, 문장, 문서 등을 벡터 형태로 변환

      한/영 검색에 특화된 KT 자체 개발 임베딩 모델

    • Advantages

      한/영에 최적화된 언어 처리 기술

      글로벌 수준의 성능을 갖춘 KT 독자 모델

  • Reranker Model

    • What is

      검색된 문서들과 질문 간 유사도를 산정하여 우선순위 재정렬

      한/영 검색에 특화된 KT 자체 개발 Reranking
      모델

    • Advantages

      한/영에 최적화된 언어 처리 기술

      글로벌 수준의 성능을 갖춘 KT 독자 모델

  • Instruction Model

    • What is

      문서에 부가 정보를 더하고, 검색 방식 최적화와 응답 정합성 검증까지 지원하는 AI 모델

      Modular & Agentic RAG를 위한 특화된 Instruction 모델

    • Advantages

      RAG 성능 향상을 위한 Data Enrichment, Query Reasoning, Verification 기능 제공

      GPT-4o와 같은 대형 LLM 모델과 유사 또는 좋은 성능을 내는 RAG Task 기능 제공