AI 모델 (LLM·GPT·Claude·Gemini)
GPT, Claude, Gemini, Llama 등 AI 모델(LLM) 출시·벤치마크·API 변경사항을 모읍니다.
AI 모델 관련 글 — 11 페이지
- 2
프롬프트 압축 벤치마커: 측정 가능한 품질 추적을 통해 LLM 입력 비용 35–63% 절감
프롬프트 압축 벤치마커(PCB)는 LLM 입력 토큰 비용을 35~63%까지 절감할 수 있도록 최적의 압축 알고리즘을 찾아주는 도구입니다. 사용자의 실제 데이터를 바탕으로 압축 시 발생하는 품질 저하와 예상되는 비용 절감액을 정밀하게 측정하며, 검증된 알고리즘을 기존 클라이언트에 즉시 적용할 수 있는 미들웨어를 제공합니다.
Prompt Compression Benchmarker: Cut LLM Input Costs by 35–63% With Measurable Quality Tracking↗dev.to
- 6
Gemini 파일 생성 가이드: AI로 PDF, Word 문서 및 Excel 파일 만들기 (2026)
구글 제미나이가 텍스트 답변을 넘어 PDF, Word, Excel 등 포맷팅된 파일을 직접 생성하고 다운로드할 수 있는 기능을 출시했습니다. 이는 AI가 단순한 초안 작성을 넘어, 별도의 편집 과정 없이 즉시 업무용 최종 결과물을 만들어내는 '생산 도구'로 진화했음을 의미합니다.
Gemini File Generation Guide: How to Create PDFs, Word Docs & Excel Files with AI (2026)↗dev.to
- 8
웹 스크래핑을 위해 15개의 LLM을 테스트한 후 휴리스틱을 구축했습니다.
웹 스크래핑 시 방대한 HTML(DOM) 데이터를 LLM에 직접 입력할 때 발생하는 높은 비용과 지연 시간 문제를 해결하기 위해, 휴리스틱(Heuristic) 알고리즘과 LLM을 결합한 하이브리드 아키텍처를 제안합니다. 데이터 전처리를 통해 입력 크기를 99% 이상 줄임으로써, 모델의 비용 효율성과 응답 속도를 극대화한 사례를 다룹니다.
I Tested 15 LLMs for Web Scraping and Built Heuristics Instead↗dev.to
- 9
좀비 퇴치: 왜 2012 의존성이 2026 AI의 성능 저하를 일으키는가
AI 에이전트와 실시간 LLM 스트리밍이 핵심인 UI 환경에서, jQuery와 같은 오래된 레거시 의존성은 단순한 파일 크기 문제를 넘어 '스크립트 평가 시간' 지연을 초래하여 사용자 경험을 저해합니다. 따라서 현대적인 AI UI를 구축하기 위해서는 불필요한 의존성을 제거하고 브라우저 네이티브 API를 활용하는 '의존성 정화(Dependency Purge)' 전략이 필수적입니다.
Kill the Zombies: Why 2012 Dependencies are Making Your 2026 AI Feel Laggy↗dev.to
- 10
AI 도구 데이터셋 2024(CSV & PDF, 11,000개 이상): CompanyName, 짧은/전체 설명, 작업, 가격, WebURL
11,000개 이상의 글로벌 AI 도구 정보를 체계적으로 정리한 '2024 AI 도구 데이터셋'이 공개되었습니다. 이 데이터셋은 각 도구의 기능, 작업 유형, 가격 모델 및 웹 URL을 포함하고 있어 AI 생태계 분석과 시장 조사에 최적화되어 있습니다.
AI Tools Dataset 2024(in CSV & PDF, over 11,000 tools):CompanyName, Short/Full Description, Tasks, Pricing, WebURL↗indiehackers.com
- 12
Google Home의 Gemini AI, 더 복잡한 요청도 처리 가능
구글 홈의 Gemini AI가 3.1 버전으로 업그레이드되어, 단일 음성 명령으로 여러 작업을 동시에 처리하고 복잡한 멀티스텝 요청을 수행할 수 있게 되었습니다. 또한 웹 기반 관리 기능인 'Ask Home on Web'과 알림창 내 즉각 제어가 가능한 '퀵 액션' 기능이 추가되어 스마트 홈 제어의 편의성이 대폭 강화되었습니다.
Google Home’s Gemini AI can handle more complicated requests↗theverge.com
- 14
GLM-5V-Turbo: 멀티모달 에이전트를 위한 네이티브 기반 모델으로의 진전
GLM-5V-Turbo는 멀티모달 인지 능력을 단순한 보조 인터페이스가 아닌 추론, 계획, 도구 사용의 핵심 엔진으로 통합한 차세대 네이티브 멀ument 기반 모델입니다. 이미지, 비디오, 웹페이지, GUI 등 다양한 시각적 컨텍스트를 직접 이해하고 실행할 수 있는 '멀티모달 에이전트' 구현을 위한 기술적 진보를 보여줍니다.
GLM-5V-Turbo: Toward a Native Foundation Model for Multimodal Agents↗arxiv.org
- 15
제마 4 가속화: 멀티 토큰 예측 드래프터를 활용한 더 빠른 추론
구글이 Gemma 4 모델의 추론 속도를 최대 3배까지 높일 수 있는 '멀티 토큰 예측(MTP) 드래프터'를 공개했습니다. 스펙큘레이티브 디코딩(Speculative Decoding) 기술을 활용해 모델의 추론 품질 저하 없이 지연 시간(Latency)을 획기적으로 단능화하여, 에지 디바이스부터 클라우드까지 더 빠르고 효율적인 AI 서비스 구현을 가능하게 합니다.
Accelerating Gemma 4: faster inference with multi-token prediction drafters↗blog.google
- 20
LLM API 런타임 규정 준수 프록시 (EU AI Act)
202나 2026년 8월 시행될 EU AI Act 및 캘리포니아 SB 942 규제에 대응하기 위해, LLM API 요청을 실시간으로 모니터링하고 보안 위협을 차단하는 Go 기반 리버스 프록시 솔루션 'AIR Blackbox'를 소개합니다. 이 도구는 프롬프트 인젝션 탐지, 개인정보(PII) 유출 방지, 위변조 불가능한 감사 로그 생성을 통해 AI 에이전트의 규제 준수를 자동화합니다.
Runtime Compliance Proxy for LLM APIs (EU AI Act)↗dev.to
- 23
출판사들이 Meta를 상대로 AI의 '단어 그대로' 복제 혐의로 소송 제기
메타(Meta)가 Llama AI 모델을 학습시키는 과정에서 LibGen, Sci-Hub 등 불법 복제 사이트의 저작물을 무단으로 사용했다는 혐의로 대형 출판사들로부터 집단 소송을 당했습니다. 이번 소송은 단순히 AI 학습의 '공정 이용(Fair Use)' 여부를 넘어, '불법 데이터셋 사용'이라는 구체적인 저작권 침해를 다루고 있어 AI 업계의 큰 파장이 예상됩니다.
Book publishers sue Meta over AI’s ‘word-for-word’ copying↗theverge.com













