느긋한 호흡

한 아저씨의 술과 음악, 사진, 캠핑, 여행, 그리고 소소한 개발 이야기를 기록하는 곳

llama.cpp로 gpt-oss 띄웠을때 reasoning_effort 옵션을 코드로 바꿀 수 없는 버그

작성일: 2025-09-09

https://github.com/ggml-org/llama.cpp/issues/15130

llama-server를 실행할때 default reasoning_effort 값을 바꾸거나

--chat-template-kwargs '{"reasoning_effort": "high"}' 이걸 http request body에 넣는 해결책이 있는데 우아하지 않음

표준 인터페이스를 안따른다는 말인데.......

글 수정 목록 복사됨!

댓글 (0)

아직 댓글이 없습니다.