Hacker News 뉴스
Y Combinator의 Hacker News에서 화제가 된 기술 토론과 링크를 큐레이션합니다.
총 2,850건
- 1101
Show HN: 제가 만든 오픈소스 에이전트, Gemini-3-flash-preview에서 TerminalBench 1위 달성
오픈소스 AI 코딩 에이전트 'Dirac'이 Gemini-3-flash-preview 모델을 사용하여 TerminalBench-2 리더보드에서 1위를 달성했습니다. Dirac은 정교한 컨텍스트 관리와 AST(추상 구문 트리) 조작 기술을 통해 기존 에이전트 대비 API 비용을 약 64.8% 절감하면서도 더 높은 정확도를 구현했습니다.
Show HN: OSS Agent I built topped the TerminalBench on Gemini-3-flash-preview↗github.com


















