AI 모델 (LLM·GPT·Claude·Gemini)

GPT, Claude, Gemini, Llama 등 AI 모델(LLM) 출시·벤치마크·API 변경사항을 모읍니다.

AI 모델 관련 글 — 19 페이지

0
Claude 시스템 프롬프트 버그로 사용자 자금 낭비 및 관리 에이전트 손상 발생
Anthropic의 Claude Code CLI에서 시스템 프롬프트 주입 버거로 인해, 정상적인 코드 수정 요청을 AI 에이전트가 거부하는 현상이 발생하고 있습니다. 이 버그는 악성코드 방지 문구를 모든 파일 읽기 작업에 강제 적용함으로써, 멀티 에이전트 워크플로우의 신뢰성을 무너뜨리고 불필요한 토큰 비용을 발생시키고 있습니다.
Claude system prompt bug wastes user money and bricks managed agents↗github.com
Hacker News16일 전공공지능 분석AI 모델
1
프리스마, 570개의 모델에서 멈췄다. 나는 제너레이터를 500ms 안에 재구축했다.
Prisma가 대규모 스키마(570개 이상의 모델)에서 V8 엔진의 문자열 길이 제한으로 인해 작동을 멈추는 치명적인 한계를 발견하고, 이를 해결하기 위해 정규표현식을 활용한 초경량 커스텀 제너레이터를 구축한 사례를 다룹니다. 전체 클라이언트를 재생성하는 대신 변경된 부분만 패치하는 전략을 통해 생성 시간을 500ms 이내로 단축했습니다.
Prisma Broke at 570 Models. I Rebuilt Its Generator in 500ms.↗dev.to
Dev.to AI16일 전공공지능 분석AI 모델
2
하루에 하나씩 살펴보는 오픈 소스 프로젝트 (51번째): Microsoft의 VibeVoice - 한 번에 90분 분량의 오디오를 처리하는 음성 AI
마이크로소프트 리서치가 공개한 VibeVoice는 7.5Hz의 초저주파수 토크나이저를 통해 최대 90분의 오디오를 단일 모델 패스로 처리할 수 있는 혁신적인 음성 AI입니다. 기존 모델들의 한계였던 짧은 오디오 처리 길이를 극복하고, 긴 분량의 대화에서도 화자 일관성과 문맥을 완벽하게 유지합니다.
One Open Source Project a Day (No.51): VibeVoice - Microsoft's Speech AI That Processes 90 Minutes of Audio in a Single Pass↗dev.to
Dev.to OpenSource16일 전공공지능 분석AI 모델
3
Claude.ai 접속 불가 및 API 오류 증가
2026년 4월 28일, Anthropic의 Claude.ai 웹 서비스와 API, Claude Code 등 주요 서비스에서 약 80분간 접속 불가 및 인증 오류 장애가 발생했습니다. 현재는 문제가 해결되어 모든 서비스가 정상화된 상태입니다.
Claude.ai unavailable and elevated errors on the API↗status.claude.com
Hacker News16일 전공공지능 분석AI 모델
4
OpenAI 모델, Amazon Bedrock에 출시: OpenAI와 AWS CEO 인터뷰
OpenAI 모델이 Amazon Bedrock에 출시되며, Microsoft와 OpenAI의 기존 독점 계약이 수정되었습니다. 이를 통해 OpenAI는 Azure를 넘어 AWS 고객층까지 확장하며, AWS는 OpenAI 기반의 'Bedlam Managed Agents'를 통해 에이전트 중심의 AI 서비스를 강화합니다.
OpenAI models coming to Amazon Bedrock: Interview with OpenAI and AWS CEOs↗stratechery.com
Hacker News16일 전공공지능 분석AI 모델
5
딥 생성 모델로 DNA 설계하고 생성하다
딥 생성 모델(Generative Models)을 활용하여 특정 기능을 가진 DNA 서열을 설계하고 생성하는 기술적 진보를 다룹니다. 이는 기존의 생물학적 데이터를 분석하는 수준을 넘어, 원하는 생물학적 특성을 가진 DNA를 직접 설계하는 '설계 중심'의 바이오 시대를 예고합니다.
Generating and designing DNA with deep generative models↗dev.to
Dev.to AI16일 전공공지능 분석AI 모델
6
AI 연산에 월 5천 달러씩 지출했는데… GPU 선택을 중단했습니다
AI 모델 개발보다 GPU 인프라 관리(하드웨어 선택, 비용 최적화, 오류 대응)에 더 많은 리소스가 소모되는 문제를 해결하기 위해, 하드웨어 추상화 레이어인 'Jungle Grid'를 소개합니다. 사용자는 GPU를 직접 선택하는 대신 작업(workload)의 특성만 정의하면 시스템이 자동으로 최적의 인프라를 할당하여 비용과 운영 복잡성을 획기적으로 낮춥니다.
We were spending ~$5K/month on AI compute… so I stopped choosing GPUs↗dev.to
Dev.to DevOps16일 전공공지능 분석AI 모델
7
아마존, 새로운 OpenAI 제품을 AWS에서 이미 제공 중
Microsoft의 OpenAI 제품에 대한 독점권이 해제됨에 따라, AWS가 자사 AI 서비스인 Bedrock을 통해 OpenAI의 최신 모델, Codex, 그리고 새로운 AI 에이전트 서비스인 'Bedrock Managed Agents'를 즉시 도입했습니다. 이는 OpenAI와 AWS 간의 협력이 심화되고 클라우드 시장의 AI 주도권 경쟁이 격화되고 있음을 의미합니다.
Amazon is already offering new OpenAI products on AWS↗techcrunch.com
TechCrunch16일 전공공지능 분석AI 모델
8
호일
Tinfoil은 NVIDIA GPU의 하드웨어 보안 기능을 활용하여 대화 내용의 완전한 프라이버시를 보장하는 AI 채팅 및 API 서비스입니다. 클라우드 환경에서도 로컬 AI와 같은 수준의 보안을 제공하며, 데이터가 서비스 제공자에게조차 노출되지 않도록 설계되었습니다.
Tinfoil↗producthunt.com
Product Hunt16일 전공공지능 분석AI 모델
9
솔트웨어, MSP 넘어 ‘AI·데이터 플랫폼 기업’ 전환 가속…SaaS·프라이빗 LLM 공략
솔트웨어가 기존 클라우드 MSP(Managed Service Provider) 사업을 넘어 AI 및 데이터 플랫폼 기업으로의 전환을 본격화합니다. 글로벌 기업 데이터브릭스와의 협업 및 자체 AI 브랜드 '핏사피(FitSapie)'를 결합하여, 데이터 수집부터 AI 모델 적용까지 아우르는 엔드투엔드(End-to-End) 서비스 구조를 구축할 계획입니다.
벤처스퀘어↗venturesquare.net
벤처스퀘어16일 전공공지능 분석AI 모델
10
LLM 대기 시간 때문에 답답하다면, 사용자에게 게임을 제공하세요.
LLM 응답이나 대규모 빌드 등 긴 작업 대기 시간 동안 사용자의 지루함을 해소하기 위해 미니 게임을 제공하는 React 라이．라이브러리 'react-waiting-game'을 소개합니다. 단순한 로딩 스피너를 넘어, 인터랙티브한 게임 요소를 통해 사용자의 체류 시간을 늘리고 이탈을 방지하는 UX 전략을 제시합니다.
Show HN: Waiting for LLMs Suck – Give your user a game↗github.com
Hacker News Show16일 전공공지능 분석AI 모델
11
선거 보안 업데이트
Anthropic은 미국 중간선거 및 글로벌 선거를 앞두고 Claude의 정치적 편향성을 방지하고 선거 관련 허위 정보를 차단하기 위한 강력한 보안 업데이트를 발표했습니다. 이를 위해 '헌법적 AI(Constitutional AI)' 기술과 자동화된 탐지 시스템을 활용하여 정치적 중립성을 유지하고, 조직적인 영향력 행사(Influence Operations)를 차단하는 데 집중하고 있습니다.
An update on our election safeguards↗anthropic.com
Anthropic Blog16일 전공공지능 분석AI 모델
12
제로 클릭 위기: 93%의 AI 모델 검색이 트래픽을 잃게 만드는 이유와 GEO의 해결책
구글 AI Mode의 검색 결과 중 93%가 웹사이트 방문 없이 종료되는 '제로 클릭' 위기가 현실화되었습니다. 이제 기존의 클릭 유도형 SEO(검색 엔진 최적화)는 한계에 부딪혔으며, AI 엔진에 인용되기 위해 구조화된 데이터를 활용하는 GEO(생성형 엔진 최적화)로의 패러다임 전환이 필수적입니다.
The Zero-Click Crisis: Why 93% of AI Mode Searches Kill Your Traffic and How GEO Fixes It↗dev.to
Dev.to AI16일 전공공지능 분석AI 모델
13
1일차: 팀 채팅은 위키가 될 잠재력이 있다 - 새로운 유형의 RAG
Beever Atlas는 슬랙, 디스코드 등 팀 채팅 로그를 구조화된 위키로 자동 변환하는 새로운 방식의 RAG(검색 증강 생성) 시스템입니다. 단순히 채팅 기록을 검색하는 기존 방식과 달리, 대화 내용을 먼저 요약·정제하여 '지식 베이스(Wiki)'를 구축한 뒤 이를 기반으로 답변을 생성함으로써 LLM의 추론 정확도를 극대화합니다.
Day 1: Your Team’s Chat Is a Wiki Waiting to Happen — A New Kind of RAG↗dev.to
Dev.to OpenSource16일 전공공지능 분석AI 모델
14
NaN의 숨겨진 삶 (2018)
IEEE 754 부동 소수점 표준의 NaN(Not-a-Number) 값 내부에 존재하는 51비트의 '페이로드(payload)' 활용법을 다룹니다. 이 여유 공간을 이용해 동적 타이핑 언어에서 숫자 외의 다양한 데이터 타입을 인코딩하는 저수준 최적화 기법을 설명합니다.
The Secret Life of NaN (2018)↗anniecherkaev.com
Hacker News17일 전공공지능 분석AI 모델
15
Talkie: 1930년대 빈티지 13B 언어 모델
Talkie는 1931년 이전의 역사적 텍스트로만 학습된 13B 규모의 '빈티지' 언어 모델입니다. 이 모델은 현대적 데이터 오염(Contamination)이 없는 환경을 제공하여, AI의 순수한 일반화 능력, 미래 예측 가능성, 그리고 새로운 기술(예: Python 코딩)을 학습할 수 있는 잠재력을 연구하는 데 목적이 있습니다.
Talkie: a 13B vintage language model from 1930↗talkie-lm.com
Hacker News17일 전공공지능 분석AI 모델
16
🚨 "컨텍스트 윈도우"는 죽었다: Anthropic이 Claude Agents에게 영구 메모리를 제공했습니다
Anthropic이 Claude Managed Agents를 위한 '메모리(Memory)' 기능을 공개 베타로 출시하며, AI 에이전트가 세션을 넘어 정보를 유지할 수 있는 영구 기억 능력을 부여했습니다. 이는 파일 시스템 기반의 레이어를 통해 에이전트가 스스로 데이터를 읽고 쓸 수 있게 하여, 기존의 복잡하고 비용이 많이 드는 RAG(검색 증강 생성) 파이프라인 의존도를 낮춰줍니다.
🚨 The "Context Window" is Dead: Anthropic Just Gave Claude Agents Permanent Memory↗dev.to
Dev.to AI17일 전공공지능 분석AI 모델
17
LLM을 현실 세계와 연결하다: OpenClaw 및 Nexconn API 심층 분석
OpenClaw는 단순한 대화를 넘어 실제 작업을 수행하는 'Chat as Action' 프레임워크를 제시하며, Nexconn은 이를 안정적인 프로덕션 환경으로 구현하기 위한 인프라(In-app Chat API)를 제공합니다. AI 에이전트의 지능적 로직과 강력한 메시징 인능의 결합이 차세대 디지털 운영체제의 핵심임을 강조합니다.
Connecting LLMs to the Real World: A Deep Dive into OpenClaw and Nexconn APIs↗dev.to
Dev.to AI17일 전공공지능 분석AI 모델
18
Claude를 활용하여 더 나은 포르투갈어 작문하기
Claude AI를 활용하여 포르투갈어 작문의 품질을 높이는 구체적인 방법과 기능을 소개합니다. 문법 교정, 스타일 제안, 아이디어 확장 등 주요 기능과 함께 유료 및 무료 플랜의 차이점을 상세히 비교합니다.
Como usar o Claude para escrever melhor em português↗dev.to
Dev.to AI17일 전공공지능 분석AI 모델
19
챗GPT, 지난 1년간 국내 생성형 AI 앱 사용자 1,237만 명 증가…3월 MAU 2,329만
국내 생성형 AI 앱 시장이 폭발적으로 성장하며 챗GPT가 압도적인 사용자 수로 1위를 기록하고 있습니다. 지난 1년간 챗GPT 사용자는 1,237만 명 증가했으며, 제미나이, 클로드 등 주요 글로벌 AI 서비스들의 사용자 수도 동반 상승하며 역대 최대치를 경신했습니다.
플래텀↗platum.kr
플래텀17일 전공공지능 분석AI 모델
20
OpenAI 모델, Codex, 그리고 Managed Agents가 AWS에 출시
OpenAI의 GPT, Codex, Managed Agents가 AWS 환경에서 사용 가능해졌습니다. 이를 통해 기업들은 기존 AWS 인프라 내에서 보안과 데이터 프라이버시를 유지하며 고성능 AI 모델을 통합할 수 있게 되었습니다.
OpenAI models, Codex, and Managed Agents come to AWS↗openai.com
OpenAI Blog17일 전공공지능 분석AI 모델
21
45개 도메인에서 RAG, GraphRAG, 사전 구조화된 지식 그래프를 비교 분석해본 결과 – 무슨 일이 벌어졌을까
이 기사는 RAG, GraphRAG, 그리고 CKG(Compact Knowledge Graph)의 성능을 45개 도메인에서 비교 분석하여, CKG가 기존 RAG 대비 정확도는 4배 높고 토큰 사용량은 11배 적다는 놀라운 결과를 보여줍니다. 특히 복잡한 의존 관계를 묻는 멀티홉(multi-hop) 쿼리에서 CKG는 구조적 이점을 통해 압도적인 성능과 비용 효율성을 증명했습니다.
I benchmarked RAG vs GraphRAG vs pre-structured knowledge graphs across 45 domains — here's what happened↗dev.to
Dev.to OpenSource17일 전공공지능 분석AI 모델
22
DeepSeek V4 Pro 출시 – AI 에이전트를 위한 변경 사항 확인
DeepSeek V4 Pro가 출시되어 1MB 토큰의 대규모 컨텍스트와 압도적인 가성비를 제공합니다. 특히 'Think/Non-Think' 듀얼 모드를 통해 AI 에이전트의 복잡한 추론과 빠른 응답을 동시에 지원하며, 기존 Claude나 GPT-4o 대비 매우 저렴한 비용을 자랑합니다.
DeepSeek V4 Pro Just Dropped — Here's What Changed for AI Agents↗dev.to
Dev.to AI17일 전공공지능 분석AI 모델
23
OpenAI SDK를 친구의 게이밍 PC에 연결했더니, 그냥 잘 작동했어.
AgentFM은 OpenAI SDK와 100% 호환되는 P2P(Peer-to-Peer) AI 컴퓨팅 그리드로, 중앙 집중형 클라우드 없이 전 세계의 유휴 GPU/CPU 자원을 연결합니다. 사용자는 기존 코드 수정 없이 친구의 게이밍 PC와 같은 분산된 노드를 통해 Llama 3.2와 같은 모델을 저비용으로 실행할 수 있습니다.
I pointed the OpenAI SDK at my friend's gaming PC. It just worked.↗dev.to
Dev.to AI17일 전공공지능 분석AI 모델