AI 모델 (LLM·GPT·Claude·Gemini)
GPT, Claude, Gemini, Llama 등 AI 모델(LLM) 출시·벤치마크·API 변경사항을 모읍니다.
AI 모델 관련 글 — 2 페이지
- 1
클로드가 구글 광고 데이터를 실시간으로 가져오도록 돕는 도구를 만들었습니다. 내보내기 불필요
Smacient은 클로드(Claude)가 구글 광고(Google Ads) 데이터에 직접 연결되어 실시간으로 데이터를 가져올 수 있게 돕는 MCP(Model Context Protocol) 커넥터입니다. 기존의 번거로운 데이터 내보내기 및 업로드 과정 없이, 대화창 내에서 즉시 광고 성과 분석, 검색어 리포트 생성, 맞춤형 쿼리 실행이 가능합니다.
We built a tool that lets Claude pull your Google Ads data live, no exports needed↗indiehackers.com
- 4
딥시크(DeepSeek)와 퀀(Qwen)를 각 프로바이더별 API 키를 개별적으로 관리하지 않고 프로덕션 환경에서 사용하는 최선의 방법은 무엇인가
DeepSeek, Qwen, OpenAI 등 다양한 LLM을 프로덕션 환경에서 사용할 때 발생하는 API 키 관리의 복잡성과 통합 관리의 어려움을 해결하는 방법을 다룹니다. 기존의 API 애그리게이터나 자체 구축(DIY) 라우팅 방식의 한계인 높은 지연 시간과 운영 리스크를 극복하기 위해, 인프라 레벨에서 컴퓨팅 라우팅을 수행하는 'Yotta Labs AI Gateway' 도입 사례를 제시합니다.
What's the best way to access DeepSeek and Qwen in production without managing separate API keys for each provider↗dev.to
- 8
LLM에 원시 HTML를 계속 공급하지 마세요 (Agentic Token Tax 해결)
AI 에이전트가 웹 데이터를 처리할 때 발생하는 막대한 토큰 비용(Token Tax)과 봇 탐지 문제를 해결하기 위해, HTML을 구조화된 JSON으로 변환하여 비용을 7과 90% 절감하는 'Web Speed' 기술을 소개합니다. 이 기술은 단순 스크래핑을 넘어 SPA(Single Page Application) 대응과 보안 우회 기능을 갖춘 결정론적 프로토콜을 지향합니다.
Stop feeding raw HTML to your LLMs (Solving the Agentic Token Tax)↗dev.to
- 11
Show HN: Needle: 26M 모델로 Gemini Tool Calling을 증류했습니다.
Needle는 Gemini 3.1을 증류(Distillation)하여 만든 26M 파라미터 규모의 초경량 모델로, 특정 기능(Tool Calling) 수행에 최적화되어 있습니다. 모바일, 워치, 스마트 글래스 등 온디바이스(On-device) 환경에서 압도적인 추론 속도와 효율성을 제공하며, 특정 태스크에서는 훨씬 큰 모델들보다 뛰어난 성능을 보여줍니다.
Show HN: Needle: We Distilled Gemini Tool Calling into a 26M Model↗github.com
- 14
Google의 'Create My Widget' 기능, AI와 API를 활용해 나만의 위젯을 만들 수 있게 될 거예요
구글이 사용자가 자연어로 자신만의 커스텀 위젯을 생성할 수 있는 안드로이드의 'Create My Widget' 기능을 발표했습니다. Gemini AI를 통해 웹 정보와 구글 앱(Gmail, 캘린더 등)의 데이터를 통합한 개인화된 대시보드를 구축할 수 있으며, 이번 여름 삼성 갤럭시와 구글 픽셀 기기에 우선 출시될 예정입니다.
Google’s ‘Create My Widget’ feature will let you vibe-code your own widgets↗techcrunch.com
- 16
Gemini의 최신 업데이트, 휴대폰 제어에 집중
구글이 프리미엄 안드로이드 기기를 위한 'Gemini Intelligence'를 발표하며, AI가 사용자를 대신해 앱을 조작하고 작업을 수행하는 '에이전트 AI' 시대를 본격화합니다. 이번 업데이트는 멀티모달 입력을 통한 작업 자동화, 자연어로 위젯을 생성하는 'Generative UI', 그리고 개인화된 자동 완성 기능 등을 핵심으로 합니다.
Gemini’s latest updates are all about controlling your phone↗theverge.com
- 20
아ంటీ 테스트: 몰약알람어를 사용하는 환자들이 모국어로 Health AI에게 질문할 때 무엇을 보게 되는가
대부분의 헬스케어 AI가 영어 중심의 번역 레이어에 의존하여 발생하는 정보 왜곡 문제를 지적하며, 인도 22개 언어에 대해 '네이티브 다국어 추론'을 구현한 GoDavaii의 사례를 소개합니다. 단순 번역을 넘어 사용자의 모국어 문맥과 언어 구조를 직접 이해하는 기술적 차별화가 글로벌 시장 공략의 핵심임을 강조합니다.
The Aunty Test - what Malayalam-speaking patients see when they ask Health AI in their own language↗dev.to
- 22
온톨로지, 보안, 자가 진화 기능을 갖춘 로컬 그래프-RAG 엔진 구축: 미니 Palantir (알파)
PROJECT JAMES는 보안과 온톨로지를 결합한 로컬 실행형 Graph-RAG 엔진으로, 데이터 유출 걱정 없이 개인이나 기업이 로컬 환경에서 강력한 지식 엔진을 구축할 수 있게 설계되었습니다. Ollama를 활용한 100% 로컬 구동, 3단계 보안 모델(RBAC, ABAC, 명령 격리), 그리고 자가 진화 기능을 통해 '미니 팔란티어(Mini Palantir)'를 지향합니다.
Building a Mini Palantir: A Local Graph-RAG Engine with Ontology, Security, and Self-Evolution (Alpha)↗dev.to















