chunking
-
RAG 청킹 전략 완전 정복 — 콘텐츠별 최적 크기와 방법IT 2026. 3. 24. 22:00
왜 청킹이 RAG의 성패를 가르는가지난 글에서 벡터 DB에 넣기 전 전처리가 중요하다고 했는데요, 전처리 다음 단계가 바로 청킹(chunking)입니다. 문서를 어떤 크기로, 어떤 기준으로 자르느냐에 따라 검색 품질이 완전히 달라집니다.같은 임베딩 모델, 같은 벡터 DB를 써도 청킹 전략만 바꾸면 검색 정확도가 54%에서 69%까지 차이가 납니다 (FloTorch 2026 벤치마크). 청킹은 RAG 파이프라인에서 가장 투자 대비 효과가 큰 구간이에요.청킹 전략 6가지 — 각각 언제 쓸까청킹 전략은 크게 6가지로 나눌 수 있어요. 중요한 건 "어떤 전략이 최고인가"가 아니라 "내 콘텐츠에 맞는 전략이 뭔가"입니다.1. Fixed-Size Chunking (고정 크기 분할)가장 단순한 방법입니다. 정해진 토..