RAG 컨텍스트 윈도우 아키텍처 선택 트레이드오프 RAG vs. 긴 컨텍스트 윈도우"그냥 다 넣으면 안 되나?" Claude는 200K 토큰, Gemini는 1M 토큰. 모델들의 컨텍스트 창이 폭발적으로 커졌습니다. 그렇다면 RAG는 이제 구시대 기술일까요? 비용·정확도·지연 시간·유지 보수 네 가지 축으로 냉정하게 따져봅니다. 2025 · 06 · 08 읽는 시간 약 14분 난이도 중급 왜 이 질문이 지금 중요한가 2023년까지만 해도 LLM의 컨텍스트 창은 4K~8K 토큰이 전부였습니다. 긴 문서를 처리하려면 RAG(Retrieval-Augmented Generation)가 사실상 유일한 선택지였죠. 그런데 ..