RAG는 생성형 AI를 제대로 활용하기 위해 반드시 이해해야 할 핵심 개념
RAG (Retrieval-Augmented Generation)
→ "검색 + 생성"을 결합한 AI 아키텍처입니다.
내 문서, 데이터, 지식을 기반으로 GPT가 정확한 답변을 하게 만드는 방식이에요.
GPT 같은 LLM은 사전 학습된 지식만 가지고 답변합니다.
즉…
❌ 내 회사 매뉴얼 / 정책 / 고객 DB에 대한 지식은 없음
그래서 "내 데이터를 검색해서 답변에 반영"하게 만든 게 RAG입니다.
사용자 질문 입력
검색 단계 (Retrieval)
→ 질문을 기준으로 벡터 DB에서 관련 문서 검색 (예: Pinecone, Weaviate, FAISS)
생성 단계 (Generation)
→ 검색한 문서들을 **GPT 입력(prompt)**에 넣고,
GPT가 문맥에 맞는 답을 생성함
결과: GPT가 엉뚱한 추측 없이, 정확한 문서 기반으로 답변
단계 | 도구/기술 |
---|---|
📄 문서 업로드 | PDF, DOCX, TXT 등 |
🧹 전처리 | LangChain 문서 로더 |
🧠 임베딩 | OpenAI Embedding, HuggingFace, Cohere |
🧊 벡터 저장소 | Pinecone, Weaviate, FAISS |
💬 질문 → 답변 | OpenAI GPT, LangChain.js |
🌐 UI | Next.js, React, Chat UI 등 |