프롬프트 엔지니어링 뉴스
LLM 프롬프트 설계, 시스템 프롬프트, 컨텍스트 엔지니어링, 프롬프트 인젝션 방어 등에 관한 글.
총 508건
- 221
Show HN: 제가 만든 오픈소스 에이전트, Gemini-3-flash-preview에서 TerminalBench 1위 달성
오픈소스 AI 코딩 에이전트 'Dirac'이 Gemini-3-flash-preview 모델을 사용하여 TerminalBench-2 리더보드에서 1위를 달성했습니다. Dirac은 정교한 컨텍스트 관리와 AST(추상 구문 트리) 조작 기술을 통해 기존 에이전트 대비 API 비용을 약 64.8% 절감하면서도 더 높은 정확도를 구현했습니다.
Show HN: OSS Agent I built topped the TerminalBench on Gemini-3-flash-preview↗github.com
- 226
EU, Google에 Android의 AI 개방 요구; Google은 "부당한 개입"이라고 반박
EU 집행위원회가 구글 안드로이드 OS 내 Gemini AI의 독점적 지위를 조사하며, 제3자 AI 서비스에도 시스템 수준의 기능을 개방할 것을 요구하고 있습니다. 이는 디지털 시장법(DMA)에 근거한 조치로, 구글의 시스템 권한(화면 컨텍스트, 앱 제어 등)을 타사 AI에게도 허용하도록 강제할 가능성이 높습니다.
EU tells Google to open up AI on Android; Google says that's "unwarranted intervention"↗arstechnica.com
- 229
MCP 보안 모범 사례: 클로드 코드 설정 보안 강화하기 전에 발생할 수 있는 피해를 막는 방법
LLM과 외부 시스템을 연결하는 MCP(Model Context Protocol) 사용 시 발생할 수 있는 보안 위협을 방지하기 위한 4단계 보안 프레임워크를 제시합니다. 권한 최소화, 감사 로그, 속도 제한, 확인 절차를 통해 AI 에이전트의 오작동이나 프롬프트 인젝션으로 인한 데이터 파괴를 막는 실무적인 가이드를 제공합니다.
MCP Security Best Practices: How I Locked Down My Claude Code Setup Before It Cost Me↗dev.to - 230
Show HN: AgentSwarms – 에이전트 AI 학습을 위한 무료 실습 환경, 설치 불필요
AgentSwarms는 별도의 설치나 복잡한 설정 없이 에이전틱 AI(Agentic AI)를 직접 구축하고 학습할 수 있는 무료 인터랙티브 플랫폼입니다. 프롬프트 엔지니어링부터 RAG, 멀티 에이전트 스웜(Swarm), 관측성(Observability)에 이르기까지 에이전트 개발의 전 과정을 실습할 수 있는 40개 이상의 레슨과 30개 이상의 실행 가능한 에이전트를 제공합니다.
Show HN: AgentSwarms – free hands-on playground to learn agentic AI, no setup↗agentswarms.fyi
- 231
EvanFlow – Claude Code를 위한 TDD 기반 피드백 루프
EvanFlow는 Claude Code를 위한 TDD(테스트 주도 개발) 기반의 반복적 피드백 루프 플러그인입니다. AI 에이전트의 자율적 코딩 과정에서 발생할 수 있는 환각(Hallucination)과 컨텍스트 드리프트 문제를 방지하기 위해, 개발자가 중간중간 설계와 계획을 승인하는 '지휘자(Conductor)' 역할을 수행하도록 설계되었습니다.
EvanFlow – A TDD driven feedback loop for Claude Code↗github.com
- 233
Claude 버전 업데이트에도 살아남는 JSON 모드 프롬프트 패턴
LLM 모델 업데이트 시 기존의 'JSON으로만 응답해줘' 식의 프롬프트 방식은 모델의 답변 스타일 변화로 인해 정규표현식 파싱 오류 및 서비스 장애를 유발할 수 있습니다. 이를 해결하기 위해 프롬프트에 의존하는 대신, Anthropic의 Structured Outputs나 Tool Use와 같이 API 레벨에서 스키마를 강제하는 구조적 패턴을 도입해야 합니다.
The JSON-Mode Prompt Pattern That Survives Claude Version Bumps↗dev.to
- 235
미세 조정된 모델, 프롬프트 기반이 아니다: 오펜시브 보안에서 LLM 래퍼를 능가하는 이유
단순히 LLM API를 활용하는 '프롬프트 기반 래퍼' 방식은 보안 분야에서 환각, 프롬프트의 취약성, 학습 루프 부재라는 치명적 한계를 가집니다. 반면, 전문적인 공격 데이터를 통해 모델 가중치에 패턴을 내재화하고 지속적인 학습 루프를 구축한 '미세 조정(Fine-tuned) 모델'이 보안 성능의 핵심 경쟁력이 될 것입니다.
Trained, Not Prompted: Why Fine-Tuned Models Beat LLM Wrappers for Offensive Security↗dev.to
- 239
Show HN: LLM-wiki – 카파시의 위키, 클로드/코덱스를 위한 QMD 검색 기능, 단 한 번의 명령어로
llm-wiki는 Claude Code 및 Codex와 같은 AI 코딩 에이전트가 프로젝트의 지식 베이스(Wiki)를 스스로 구축, 관리, 검색할 수 있도록 돕는 자동화 도구입니다. 에이전트가 프로젝트의 아키텍처, 결정 사항, 의존성 등을 문서화하고 이를 바탕으로 코딩 계획을 세울 수 있게 하여 AI의 컨텍스트 이해도를 극대화합니다.
Show HN: LLM-wiki – One command Karpathy's wiki with QMD search for Claude/Codex↗github.com











