LLM 추론 비용 절감의 핵심: 벡터 회전을 통한 KV-캐시 양자화 혁신 | StartupSchool