reasoning_parser
-
vLLM reasoning_parser — <think> 블록을 정규식 말고 구조로 받는 법IT 2026. 5. 6. 22:30
블록을 정규식 말고 구조로 받는 법" />들어가며 — 정규식 5개로 버티던 코드Qwen3.6은 응답 중에 자기 생각을 ... 태그로 감싸 출력한다. 이 안에는 모델이 답을 만들기 전에 한 추론 과정이 들어 있고, 사용자에게 보여줄 본문은 그 다음에 나온다.문제는 이 thinking 블록이 본문에 섞여 그대로 도착한다는 것이다. RAG 인덱싱 코드, 평가 코드, 채팅 본문 출력 — 모두 이 블록을 본문에서 깎아내야 한다. 그래서 정규식 안전망 코드가 약 40줄 붙어 있었다.# 닫히지 않은 처리# 비ASCII garbage 잔해 제거# 중첩 태그 방어# 부분 출력 케이스 분기# ... 5개 정도의 정규식 ...vLLM에 옵션 한 줄을 더하면 이 코드가 통째로 사라진다.--reasoning-parser qw..