AI 모델 (LLM·GPT·Claude·Gemini)
GPT, Claude, Gemini, Llama 등 AI 모델(LLM) 출시·벤치마크·API 변경사항을 모읍니다.
AI 모델 관련 글 — 31 페이지
- 1
Open WebUI vs. ChatGPT: 2026년, 당신에게 맞는 선택은?
이 기사는 클라우드 기반의 ChatGPT와 자가 호스팅 방식인 Open WebUI를 다각도로 비교하며, 사용자의 기술적 역량, 보안 요구사항, 예산에 따른 최적의 선택지를 제시합니다. 특히 단순한 모델 사용을 넘어, 다양한 모델을 통합 관리하고 데이터 프라이버시를 확보할 수 있는 'AI 콕핏(Cockpit)'으로서의 Open WebUI의 가치를 조명합니다.
Open WebUI vs. ChatGPT: Which One Is Right for You in 2026?↗dev.to
- 2
Anthropic, 빠른 시각 자료 제작을 위한 신제품 Claude Design 출시
Anthropic이 비디자이너도 텍스트 프롬프트만으로 프로토타입, 슬라이드, 원페이저 등 시각 자료를 빠르게 제작할 수 있는 실험적 제품 'Claude Design'을 출시했습니다. 이 도구는 기업의 디자인 시스템을 학습하여 일관된 브랜딩을 유지할 수 있으며, Canva와 같은 기존 디자인 툴과 연동되는 것을 목표로 합니다.
Anthropic launches Claude Design, a new product for creating quick visuals↗techcrunch.com
- 5
언웨이트: 품질 저하 없이 LLM을 22% 압축한 방법
Cloudflare가 모델의 정확도 손실 없이 LLM 가중치를 15~22% 압축할 수 있는 'Unweight' 기술을 공개했습니다. 이 기술은 GPU의 메모리 대역폭 병목 현상을 해결하기 위해 온칩(on-chip) 메모리에서 가중치를 직접 압축 해제함으로써, 더 적은 VRAM으로 더 많은 모델을 더 빠르게 실행할 수 있게 합니다.
Unweight: how we compressed an LLM 22% without sacrificing quality↗blog.cloudflare.com
- 7
Oracle AI Database에서 Python으로 ONNX 임베딩 워크플로우 구축하기
Oracle AI Database 26ai를 활용하여 ONNX 임베딩 모델을 데이터베이스 내부로 직접 로드하고, SQL만으로 임베딩 생성부터 벡터 검색까지 수행하는 통합 워크플로우를 소개합니다. 이 방식은 외부 임베딩 서비스나 별도의 벡터 DB 없이 데이터베이스 내에서 모든 과정을 완결함으로써 데이터 이동과 인프라 복잡성을 획기적으로 줄여줍니다.
Building ONNX Embedding Workflows in Oracle AI Database with Python↗dev.to
- 9
[2026] LLM 관측 가능성을 위한 OpenTelemetry — 자체 호스팅 설정
이 기사는 LLM 에이전트 워크플로우의 비용 효율적인 모니터링을 위해 OpenTelemetry(OTel)를 활용한 자체 호스팅 관측 가능성(Observability) 구축 방법을 설명합니다. 관리형 플랫폼의 높은 비용을 피하면서도 데이터 소유권을 유지하고, 표준화된 규약을 통해 모델 교체와 비용 추적을 용이하게 하는 아키텍처를 제안합니다.
[2026] OpenTelemetry for LLM Observability — Self-Hosted Setup↗dev.to![[2026] LLM 관측 가능성을 위한 OpenTelemetry — 자체 호스팅 설정](https://startupschool.cc/og/2026-opentelemetry-for-llm-observability-self-hosted-setup-09cd1c.jpg)
- 10
응답 후 LLM 분류 실행: Next.js after() + OpenRouter, 콜당 0.0002달러
Next.js의 `after()` API와 OpenRouter를 활용하여 사용자 응답 지연 없이 호출당 $0.0002라는 초저비용으로 LLM 기반 스팸 분류 시스템을 구축하는 실전 아키텍처를 소개합니다. LLM 호출을 메인 프로세스에서 분리하여 성능, 비용, 안정성을 동시에 확보하는 구체적인 구현 방법을 다룹니다.
Running LLM Classification After the Response: Next.js after() + OpenRouter at $0.0002 per Call↗dev.to
- 13
ERNIE-Image: 포스터, 만화, 텍스트 풍부한 시각 콘텐츠에 최적화된 텍스트-이미지 모델
바이두가 공개한 ERNIE-Image는 단순한 실사 이미지 생성을 넘어, 텍스트 렌더링, 레이아웃 구조, 다중 패널 구성 등 '사용 가능한 시각 콘텐츠' 생성에 최적화된 모델입니다. Diffusion Transformer(DiT) 아키텍처를 기반으로 포스터, 만화, 인포그래픽 등 구조적 정보가 중요한 디자인 영역에서 압도적인 성능을 보여줍니다.
ERNIE-Image: A Text-to-Image Model Built for Posters, Comics, and Text-Rich Visual Content↗dev.to
- 15
4,584개의 MCP 서버 분석 결과, 평균 신뢰 점수는 100점 만점에 53.9점
4,584개의 MCP(Model Context Protocol) 서버를 분석한 결과, 평균 신뢰 점수가 100점 만점에 53.9점에 불과한 것으로 나타났습니다. 이는 현재 MCP 생태계의 많은 서버가 실험적 단계에 머물러 있으며, AI 에이전트 개발 시 도구의 실제 런타임 동작과 안정성을 검증하는 것이 필수적임을 시사합니다.
We Analyzed 4,584 MCP Servers — The Average Trust Score Is 53.9 Out of 100↗dev.to
- 16
임베딩 공간의 드리프트를 감지하는 오픈 소스 Python 툴을 직접 만들었습니다
임베딩 공간의 변화를 직접 감지하여 모델 성능 저하가 발생하기 전에 조기 경보를 제공하는 오픈 소스 Python 도구 'drift-lens-monitor'가 출시되었습니다. 이 도구는 통계적 거리(FED, MMD)와 위상수학적 분석(Persistent Homology)을 활용해 임베딩 데이터의 구조적 변화를 정밀하게 추적합니다.
I built an open-source Python tool to detect drift in embedding spaces↗dev.to
- 18
13시간 동안 제한 없는 Firebase 브라우저 키로 Gemini API에 접속하며 54,000유로 폭증
Firebase 브라우저 키의 API 권한 제한 미비로 인해 단 13시간 만에 54,000유로(약 8,000만 원)의 Gemini API 비용이 청구된 사건이 발생했습니다. 구글 클라우드는 해당 사용을 프로젝트 내에서 발생한 '유효한 사용'으로 간주하여 비용 환불 요청을 거부했습니다.
€54k spike in 13h from unrestricted Firebase browser key accessing Gemini APIs↗discuss.ai.google.dev
- 20
Show HN: MacMind – 1989년 매킨토시에서 HyperCard로 구현된 트랜스포머 뉴럴 네트워크
1987년 출시된 HyperTalk 언어를 사용해 1989년형 매킨토시에서 구현된 초소형 트랜스포머 모델 'MacMind'를 소개합니다. 이 프로젝트는 현대 GPT-4와 같은 거대 언어 모델의 핵심 원리인 어텐션과 역전파가 규모의 차이일 뿐, 근본적으로 동일한 수학적 메커니즘임을 증명합니다.
Show HN: MacMind – A transformer neural network in HyperCard on a 1989 Macintosh↗github.com
- 22
내 노트북의 Qwen3.6-35B-A3B가 Claude Opus 4.7보다 더 나은 갈매기를 그려줬다
로컬 환경에서 실행되는 경량화된 Qwen 3.6-35B-A3B 모델이 Anthropic의 최신 대형 모델인 Claude Opus 4.7보다 특정 SVG 생성 작업(자전거 타는 갈매기 그리기)에서 더 뛰어난 성능을 보였습니다. 이는 거대 모델의 범용적 성능과 특정 태스크에서의 정밀도 사이의 괴리를 보여주는 흥미로운 사례입니다.
Qwen3.6-35B-A3B on my laptop drew me a better pelican than Claude Opus 4.7↗simonwillison.net










![TigerBeetle: 1조 트랜잭션 [영상]](https://startupschool.cc/og/tigerbeetle-a-trillion-transactions-video-b219af.jpg)