RAG란 | Notion

RAG는 생성형 AI를 제대로 활용하기 위해 반드시 이해해야 할 핵심 개념

🔍 RAG란?

RAG (Retrieval-Augmented Generation)

→ "검색 + 생성"을 결합한 AI 아키텍처입니다.

내 문서, 데이터, 지식을 기반으로 GPT가 정확한 답변을 하게 만드는 방식이에요.

GPT 같은 LLM은 사전 학습된 지식만 가지고 답변합니다.

즉…

❌ 내 회사 매뉴얼 / 정책 / 고객 DB에 대한 지식은 없음

그래서 "내 데이터를 검색해서 답변에 반영"하게 만든 게 RAG입니다.

사용자 질문 입력
검색 단계 (Retrieval)

→ 질문을 기준으로 벡터 DB에서 관련 문서 검색 (예: Pinecone, Weaviate, FAISS)
생성 단계 (Generation)

→ 검색한 문서들을 **GPT 입력(prompt)**에 넣고,

GPT가 문맥에 맞는 답을 생성함

결과: GPT가 엉뚱한 추측 없이, 정확한 문서 기반으로 답변

단계	도구/기술
📄 문서 업로드	PDF, DOCX, TXT 등
🧹 전처리	LangChain 문서 로더
🧠 임베딩	OpenAI Embedding, HuggingFace, Cohere
🧊 벡터 저장소	Pinecone, Weaviate, FAISS
💬 질문 → 답변	OpenAI GPT, LangChain.js
🌐 UI	Next.js, React, Chat UI 등