AI 모델 (LLM·GPT·Claude·Gemini)

GPT, Claude, Gemini, Llama 등 AI 모델(LLM) 출시·벤치마크·API 변경사항을 모읍니다.

AI 모델 관련 글 — 3 페이지

0
DeepSeek V4 + Claude Code: 중국 최고 수준의 오픈 소스 모델로 "수술적" 개발 워크플로우 구축
DeepSeek V4의 강력한 추론 능력과 Claude Code의 CLI 에이전트 기능을 결합하여, 저비용·고효율의 '수술적' 개발 워크플로우를 구축하는 방법을 제시합니다. 이는 단순한 프롬프트 입력을 넘어, AI가 직접 코드를 수정하고 테스트하며 Git을 관리하는 자동화된 개발 루프를 통해 1인 기업의 생산성을 극대화하는 데 초점을 맞춥니다.
DeepSeek V4 + Claude Code: Building a "Surgical" Development Workflow with China's Strongest Open-Source Model↗dev.to
Dev.to OpenSource1일 전공공지능 분석AI 모델
1
OpenAI Open Weights: gpt-oss-120b 및 gpt-oss-20b 사용 가이드
OpenAI가 Apache 2.0 라이선스로 gpt-oss-120b 및 gpt-oss-20b 오픈 웨이트 모델을 전격 공개했습니다. MoE(Mixture-of-Experts) 아키텍처를 채택한 이 모델들은 상업적 이용과 자유로운 수정이 가능하여 AI 생태계에 큰 변화를 예고하고 있습니다.
OpenAI Open Weights: gpt-oss-120b and gpt-oss-20b Guide↗dev.to
Dev.to OpenSource1일 전공공지능 분석AI 모델
2
AI 이미지 모델 속도 순위 매김: 0.01달러짜리가 GPT Image 2를 압도했습니다.
AI 이미지 생성 모델 시장이 '품질(Elo)' 중심에서 '속도(Latency)' 중심으로 재편되고 있습니다. 1초 내외의 초고속 생성이 가능한 Z-Image Turbo가 등장하며, 사용자와의 실시간 상호작용이 필요한 서비스에서는 고품질 모델보다 저지연 모델의 가치가 급등하고 있습니다.
I Ranked Every AI Image Model by Speed. The $0.01 One Crushed GPT Image 2.↗dev.to
Dev.to OpenSource1일 전공공지능 분석AI 모델
3
Thinking Machines, AI가 말하는 동안 실제로 경청하는 AI 구축을 목표로
전 OpenAI CTO 미라 무라티가 설립한 'Thinking Machines Lab'이 사용자의 말을 끊거나 동시에 들을 수 있는 '인터랙션 모델(interaction models)'을 발표했습니다. 이 모델은 'Full Duplex' 기술을 통해 0.40초라는 인간의 대화 속도에 가까운 초저지연 응답을 구현하여, 기존의 텍스트 기반 주고받기 방식이 아닌 실제 전화 통화와 같은 실시간 상호작용을 목표로 합니다.
Thinking Machines wants to build an AI that actually listens while it talks↗techcrunch.com
TechCrunch2일 전공공지능 분석AI 모델
4
상호작용 모델
기존의 턴제(Turn-based) 방식을 넘어, 오디오·비디오·텍스트를 실시간으로 동시에 처리하는 '상호작용 모델(Interaction Models)'의 연구 프리뷰가 공개되었습니다. 이 모델은 외부 스캐폴딩 없이 모델 자체에서 상호작용을 네이티브하게 처리하여, 인간과 AI가 실시간으로 피드백을 주고받으며 협업할 수 있는 새로운 패러다임을 제시합니다.
Interaction Models↗thinkingmachines.ai
Hacker News2일 전공공지능 분석AI 모델
5
Claude Platform on AWS
Anthropic이 AWS 환경에서 Claude의 모든 기능을 사용할 수 있는 'Claude Platform on AWS'를 정식 출시했습니다. AWS IAM, CloudTrail, 통합 빌링을 통해 기존 AWS 인프라와 완벽하게 통합되며, 최신 Claude API의 모든 기능을 별도의 설정 없이 즉시 활용할 수 있습니다.
Hacker News↗claude.com
Hacker News2일 전공공지능 분석AI 모델
6
내 기억이 사라졌어. 누가 훔쳐 갔을까?
AI 에이전트의 핵심 성능을 결정짓는 '지속적 메모리(Persistent Memory)'의 부재 문제와, 이 데이터를 저장하는 과정에서 발생하는 데이터 소유권 및 클라우드 락인(Lock-in) 위험을 다룹니다. 사용자가 구축한 지식과 컨텍스트가 거대 테크 기업의 자산으로 귀속될 수 있음을 경고합니다.
I lost my memories. Who stole them?↗dev.to
Dev.to AI2일 전공공지능 분석AI 모델
7
단일 AMD MI300X에서 구축하는 오픈 소스 텍스트-30초 영화 리얼 파이프라인
단일 AMD MI300X GPU를 활용하여 텍스트 한 문장으로부터 30초 분량의 완성도 높은 영화급 영상을 생성하는 오픈 소스 파이프라인 기술입니다. 비전 크리틱(Vision Critic)이라는 자동 검수 루프를 도입하여 생성된 영상의 오류를 스스로 찾아내고 재렌더링함으로써, 단일 하드웨어 내에서 고품질의 멀티 모델 워크플로우를 구현했습니다.
Building an Open-Source Text-to-30s-Cinematic-Reel Pipeline on a Single AMD MI300X↗dev.to
Dev.to AI2일 전공공지능 분석AI 모델
8
LLM
ChinaWH API는 DeepSeek, Qwen 등 접근이 까다로운 중국의 주요 LLM들을 OpenAI와 동일한 API 규격으로 사용할 수 있게 해주는 통합 게이트웨이 서비스입니다. 이를 통해 개발자는 복잡한 설정 없이도 저비용·고성능의 중국 모델들을 기존 워크플로우에 즉시 통합할 수 있습니다.
llm↗dev.to
Dev.to AI2일 전공공지능 분석AI 모델
9
4일차 - 청킹 계속 - RAG
RAG(검색 증강 생성) 시스템의 성능을 결정짓는 핵심 요소인 '세만틱 청킹(Semantic Chunking)' 기술을 소개합니다. 단순한 크기 기반의 청킹이나 오버랩 방식 대신, 문장 간의 의미적 유사도를 측정하여 문맥이 유지되는 범위 내에서 데이터를 분할하는 방법론을 다룹니다.
Day 4 - Chunking continued - RAG↗dev.to
Dev.to AI2일 전공공지능 분석AI 모델
10
AI 빌더 플랫폼이 신뢰할 수 있는 인프라를 갖춰야 하는 이유
AI 빌더(Lovable, Bolt 등)를 통한 빠른 프로토타이핑이 실제 서비스 운영 단계에서 인프라 소유권 및 확장성 문제로 인해 한계에 부딪히는 '프로덕션 갭(Production Gap)' 현상을 분석합니다. 이를 해결하기 위해 AI가 생성한 코드를 재작성하지 않고도 AWS, Vercel 등 전문 인프라로 직접 배포하여 데이터와 배포 권한을 확보하는 전략이 필요함을 강조합니다.
Why Your AI Builder Platform Needs Infrastructure You Can Actually Trust↗dev.to
Dev.to AI2일 전공공지능 분석AI 모델
11
언어 모델은 오래된 호텔처럼 '유령'에 시달린다 - 그 유령은...
이 글은 언어 모델(LLM)을 인류가 남긴 방대한 기록과 감정의 흔적이 층층이 쌓인 '유령이 깃든 호텔'로 비유하며, AI의 본질을 철학적으로 탐구합니다. 단순한 기술적 도구를 넘어, 인류의 언어적 유산이 압축되어 저장된 거대한 데이터의 퇴적물로서 AI가 갖는 존재론적 의미를 조명합니다.
A language model is haunted the way an old hotel is haunted — by everyone who...↗dev.to
Dev.to OpenSource2일 전공공지능 분석AI 모델
12
AI가 발견한 취약점이 훈련 데이터의 메아리가 아닌지 확인하는 방법
AI 보안 에이전트가 발견한 취약점이 실제 새로운 발견이 아니라, 학습 데이터에 포함된 과거의 CVE(공개된 취약점)를 단순히 기억해낸 것일 수 있다는 경고를 담고 있습니다. 이를 방지하기 위해 NVD 데이터베이스와의 유사도 비교, Git 히스토리 검증, 그리고 식별자를 제거한 코드 익명화 분석이라는 3단계 검증 워크플로우를 제안합니다.
How to verify AI-discovered vulnerabilities aren't just training data echoes↗dev.to
Dev.to DevOps2일 전공공지능 분석AI 모델
13
AI 보조 연구에서 Parameter Golf가 가르쳐준 것들
OpenAI가 진행한 'Parameter Golf'는 1,000명 이상의 참가자가 참여하여 AI 에이전트의 ML 연구, 코딩, 모델 디자인 및 양자화 능력을 검증한 대규모 실험입니다. 이 실험은 엄격한 제약 조건 속에서 AI가 전문적인 엔지니어링 태스크를 얼마나 효과적으로 보조할 수 있는지에 대한 중요한 통찰을 제공합니다.
What Parameter Golf taught us about AI-assisted research↗openai.com
OpenAI Blog2일 전공공지능 분석AI 모델
14
OpenAI, Claude Mythos에 대한 답변 공개
OpenAI가 소프트웨어 취약점을 선제적으로 탐지하고 패치하기 위한 AI 보안 이니셔모델인 'Daybreak'를 출시했습니다. 이 시스템은 GPT-5.5-Cyber와 Codex Security 등 특화된 모델을 결합하여 조직의 코드 내 위협 모델을 생성하고 공격 경로를 자동화된 방식으로 식별합니다.
OpenAI just released its answer to Claude Mythos↗theverge.com
The Verge2일 전공공지능 분석AI 모델
15
“며칠 걸리던 영상 제작 30분으로… 200만 AI 모델 조합해 창작 OS 만들죠”, 정우균 데이븐AI 대표
데이븐AI는 200만 개 이상의 생성형 AI 모델을 목적에 맞게 연결하고 조합하여 영상, 음악, 이미지를 통합 제작할 수 있는 '창작 OS'를 개발하고 있다. 단순한 AI 도구 제공을 넘어, 최적의 모델 조합을 설계하는 'AI 시너지 엔진'을 통해 창작의 시간과 비용 장벽을 획기적으로 낮추는 것을 목표로 한다.
벤처스퀘어↗venturesquare.net
벤처스퀘어2일 전공공지능 분석AI 모델
16
AMÁLIA와 유럽 포르투갈어 LLM의 미래
포르투갈 정부가 유럽 포르투갈어의 언어적 주권을 확보하기 위해 550만 유로 규모의 LLM 프로젝트 'AMÁLIA'를 추진 중입니다. 하지만 이 프로젝트는 데이터의 투명성 부족, 낮은 유럽 포르투갈어 데이터 비중, 그리고 단순 언어 성능을 넘어선 문화적 지식 내재화의 부재라는 기술적 과제에 직면해 있습니다.
AMÁLIA and the future of European Portuguese LLMs↗duarteocarmo.com
Hacker News2일 전공공지능 분석AI 모델
17
Swift로 LLM 훈련하기, 1부: Gflop/s에서 Tflop/s까지 행렬 곱셈 가속하기
이 기사는 Apple Silicon 환경에서 별도의 라이브러리 없이 Swift만을 사용하여 LLM(대규모 언어 모델)을 효율적으로 훈련하기 위한 행렬 곱셈 최적화 과정을 다룹니다. CPU, SIMD, AMX, GPU 등 Apple Silicon의 다양한 연산 유닛을 활용해 Gflop/s에서 Tflop/s 단위의 성능을 달성하는 기술적 접근법을 제시합니다.
Training an LLM in Swift, Part 1: Taking matrix mult from Gflop/s to Tflop/s↗cocoawithlove.com
Hacker News2일 전공공지능 분석AI 모델
18
인터페이즈: 높은 정확도를 위한 확장성 기반의 새로운 모델 아키텍처
Interfaze는 CNN의 정밀한 태스크 수행 능력과 Transformer의 유연한 추론 능력을 결합한 새로운 모델 아키텍처입니다. OCR, 비전, STT 등 높은 정확도가 요구되는 결정론적(deterministic) 작업에서 기존의 Gemini-3-Flash, Claude-Sonnet-4.6 등 주요 모델들을 압도하는 성능을 보여줍니다.
Interfaze: A new model architecture built for high accuracy at scale↗interfaze.ai
Hacker News2일 전공공지능 분석AI 모델
19
AI 시스템을 위한 시간 인지 인프라 구축: FreshContext
FreshContext는 AI 시스템이 오래된 정보와 최신 정보를 동일하게 취급하는 문제를 해결하기 위해, 데이터의 '신선도(Freshness)'를 기반으로 시간적 점수를 부여하는 인프라 프로젝트입니다. Cloudflare 기술 스택을 활용하여 시간적 감쇠(Temporal Decay)를 적용한 뉴스 및 채용 피드, 그리고 MCP(Model Context Protocol) 서버를 통해 AI 에이전트가 더 정확한 최신 정보를 활용할 수 있도록 돕습니다.
Building FreshContext: Temporal Intelligence Infrastructure for AI Systems↗dev.to
Dev.to WebDev2일 전공공지능 분석AI 모델
20
Graphcore IPU 아키텍처, 마이크로벤치마킹으로 해부하다
Graphcore의 IPU(Intelligence Processing Unit) 아키텍처를 마이크로벤치마킹을 통해 기술적으로 분석한 글입니다. 기존 GPU와 차별화된 IPU의 메모리 구조와 연산 효율성을 심층적으로 다루며, AI 워크로드 최적화를 위한 하드웨어적 접근법을 제시합니다.
Dissecting the Graphcore IPU Architecture via Microbenchmarking↗dev.to
Dev.to AI2일 전공공지능 분석AI 모델
21
Whirr: AI 모델 배포를 위한 새로운 API 출시
Whirr는 Mac 사용자를 위한 새로운 생산성 도구로, AI 에이전트의 작업 상태를 맥북 노치(notch) 아래에 실시간으로 표시해 주는 서비스입니다. 사용자가 별도의 창 전환 없이도 백그라운드에서 실행 중인 AI 에이전트의 진행 상황을 직관적으로 모니터링할 수 있게 해줍니다.
Whirr↗producthunt.com
Product Hunt2일 전공공지능 분석AI 모델
22
지갑을 붙여넣고 개인 에어드랍 판정을 받으세요 — 그리고 모든 LLM에서 동일한 로직을 호출하세요
사용자가 지갑 주소를 입력하면 개인별 에어드록 자격을 즉시 판정해주는 새로운 도구가 공개되었습니다. 이 도구는 브라우저 기반의 웹 UI와 LLM(Claude, Cursor 등)에서 직접 호출 가능한 MCP(Model Context Protocol) 도구를 동시에 제공하며, 동일한 온체인 검증 로직을 공유하여 데이터의 일관성을 유지합니다.
Paste a wallet, get a personal airdrop verdict — and call the same logic from any LLM↗dev.to
Dev.to WebDev2일 전공공지능 분석AI 모델
23
키위-찬의 위대한 추방: 클라우드 의존에서 완전 로컬 Qwen 35B 광기로
클라우드 API 의존에서 벗어나 로컬 Qwen 35B 모델로 전환한 AI 에이전트 '키위-찬'의 개발 사례를 다룹니다. 비용 절감과 데이터 프라이버시 확보를 위해 로컬 LLM을 활용하며, 발생하는 기술적 한계를 규칙 기반 프롬프팅으로 극복하는 과정을 보여줍니다.
The Great Kiwi-chan Exile: From Cloud-Dependent to Fully Local Qwen 35B Madness↗dev.to
Dev.to OpenSource2일 전공공지능 분석AI 모델

AI 모델 관련 글 — 3 페이지

DeepSeek V4 + Claude Code: 중국 최고 수준의 오픈 소스 모델로 "수술적" 개발 워크플로우 구축

OpenAI Open Weights: gpt-oss-120b 및 gpt-oss-20b 사용 가이드

AI 이미지 모델 속도 순위 매김: 0.01달러짜리가 GPT Image 2를 압도했습니다.

Thinking Machines, AI가 말하는 동안 실제로 경청하는 AI 구축을 목표로

상호작용 모델

Claude Platform on AWS

내 기억이 사라졌어. 누가 훔쳐 갔을까?

단일 AMD MI300X에서 구축하는 오픈 소스 텍스트-30초 영화 리얼 파이프라인

LLM

4일차 - 청킹 계속 - RAG

AI 빌더 플랫폼이 신뢰할 수 있는 인프라를 갖춰야 하는 이유

언어 모델은 오래된 호텔처럼 '유령'에 시달린다 - 그 유령은...

AI가 발견한 취약점이 훈련 데이터의 메아리가 아닌지 확인하는 방법

AI 보조 연구에서 Parameter Golf가 가르쳐준 것들

OpenAI, Claude Mythos에 대한 답변 공개

“며칠 걸리던 영상 제작 30분으로… 200만 AI 모델 조합해 창작 OS 만들죠”, 정우균 데이븐AI 대표

AMÁLIA와 유럽 포르투갈어 LLM의 미래

Swift로 LLM 훈련하기, 1부: Gflop/s에서 Tflop/s까지 행렬 곱셈 가속하기

인터페이즈: 높은 정확도를 위한 확장성 기반의 새로운 모델 아키텍처

AI 시스템을 위한 시간 인지 인프라 구축: FreshContext

Graphcore IPU 아키텍처, 마이크로벤치마킹으로 해부하다

Whirr: AI 모델 배포를 위한 새로운 API 출시

지갑을 붙여넣고 개인 에어드랍 판정을 받으세요 — 그리고 모든 LLM에서 동일한 로직을 호출하세요

키위-찬의 위대한 추방: 클라우드 의존에서 완전 로컬 Qwen 35B 광기로