AI 에이전트 뉴스
Claude, Cursor, OpenClaw, ChatGPT Agent 등 자율적으로 작업을 수행하는 AI 에이전트 동향과 활용 사례.
총 1,842건
- 324
GitHub Security Lab의 Taskflow Agent: LLM 및 YAML 선언적 방식으로 80개 이상의 실제 취약점 발견한 MCP 프레임워크
GitHub Security Lab이 LLM과 YAML 기반의 선언적 방식을 통해 보안 취약점을 탐지하는 오픈소스 프레임워크 'Taskflow Agent'를 공개했습니다. 이 프레임워크는 복잡한 보안 조사를 작은 단위의 검증 가능한 작업(taskflow)으로 분해하여, 이미 80개 이상의 보안 이슈와 30여 개의 실제 취약점을 발견하는 성과를 거두었습니다.
Taskflow Agent de GitHub Security Lab: el framework MCP que descubrió 80+ vulnerabilidades reales con LLMs y YAML declarativo↗dev.to
- 329
키위찬, 완전 로컬화: 2,362 액션, 35B 파라미터 브레인, 그리고 대규모 Birch Plank 반란
마인크래프트 자율 에이전트 'Kiwi-chan'이 클라우드 API 의존성을 완전히 제거하고 Qwen 35B 모델을 활용한 로컬 추론 시스템으로 전환에 성공했습니다. 44%의 성공률을 단순한 실패가 아닌 학습을 위한 '교정 곡선'으로 정의하며, 로컬 환경에서의 자율적 추론과 에러 복구 메커니즘의 진보를 보여줍니다.
Kiwi-chan Goes Fully Local: 2,362 Actions, One 35B Parameter Brain, and the Great Birch Plank Rebellion↗dev.to
- 331
에이전트 판단 검증: 고품질 AI 에이전트와 저품질 AI 에이전트 간의 8배 ROI 격차
AI 에이전트의 성능을 단순 작업 완료율이 아닌 '판단력(Judgment)' 관점에서 평가해야 하며, 높은 판단력을 가진 에이전트가 낮은 에이전트보다 최대 8배의 ROI 차이를 만든다는 연구 결과입니다. 에이전트의 비즈니스 가치는 단순 실행력이 아닌 의사결정의 정확도에 달려 있음을 강조합니다.
Agent Judgment Validation: The 8x ROI Gap Between High and Low Judgment AI Agents↗dev.to
















