AI 모델 (LLM·GPT·Claude·Gemini)
GPT, Claude, Gemini, Llama 등 AI 모델(LLM) 출시·벤치마크·API 변경사항을 모읍니다.
AI 모델 관련 글 — 18 페이지
- 3
Lemonade v10.3: 자체 GPU에서 로컬 LLM, 이미지 생성, 음성 처리 무료 실행
오픈소스 로컬 AI 서버인 Lemonade가 v10.3으로 업데이트되었습니다. 이번 업데이트는 Tauri 전환을 통한 앱 경량화, 멀티모달 처리를 위한 OmniRouter 도입, AMD ROCm 7 지원을 핵심으로 하며, 클라우드 API 비용 절감과 데이터 보안을 위한 강력한 대안을 제시합니다.
Lemonade v10.3: Run Local LLMs, Image Gen, and Speech on Your Own GPU for Free↗dev.to
- 10
Cohere, 5.42 WER 음성 모델 오픈소스 공개 - 실제 오디오 테스트 결과 확인
Cohere가 Whisper-large-v3보다 높은 정확도와 빠른 속도를 자랑하는 새로운 오픈소스 음성 인식(ASR) 모델 'Cohere Transcribe'를 공개했습니다. 깨끗한 오디오와 실시간 스트리밍 환경에서는 우위를 점하지만, 다국어 혼용(Code-switched)이나 저음질 전화 통화 환경에서는 여전히 Whisper가 강점을 보입니다.
Cohere just open-sourced a 5.42 WER speech model - here's what testing it on real audio showed↗dev.to
- 15
Claude 시스템 프롬프트 버그로 사용자 자금 낭비 및 관리 에이전트 손상 발생
Anthropic의 Claude Code CLI에서 시스템 프롬프트 주입 버거로 인해, 정상적인 코드 수정 요청을 AI 에이전트가 거부하는 현상이 발생하고 있습니다. 이 버그는 악성코드 방지 문구를 모든 파일 읽기 작업에 강제 적용함으로써, 멀티 에이전트 워크플로우의 신뢰성을 무너뜨리고 불필요한 토큰 비용을 발생시키고 있습니다.
Claude system prompt bug wastes user money and bricks managed agents↗github.com
- 16
프리스마, 570개의 모델에서 멈췄다. 나는 제너레이터를 500ms 안에 재구축했다.
Prisma가 대규모 스키마(570개 이상의 모델)에서 V8 엔진의 문자열 길이 제한으로 인해 작동을 멈추는 치명적인 한계를 발견하고, 이를 해결하기 위해 정규표현식을 활용한 초경량 커스텀 제너레이터를 구축한 사례를 다룹니다. 전체 클라이언트를 재생성하는 대신 변경된 부분만 패치하는 전략을 통해 생성 시간을 500ms 이내로 단축했습니다.
Prisma Broke at 570 Models. I Rebuilt Its Generator in 500ms.↗dev.to
- 17
하루에 하나씩 살펴보는 오픈 소스 프로젝트 (51번째): Microsoft의 VibeVoice - 한 번에 90분 분량의 오디오를 처리하는 음성 AI
마이크로소프트 리서치가 공개한 VibeVoice는 7.5Hz의 초저주파수 토크나이저를 통해 최대 90분의 오디오를 단일 모델 패스로 처리할 수 있는 혁신적인 음성 AI입니다. 기존 모델들의 한계였던 짧은 오디오 처리 길이를 극복하고, 긴 분량의 대화에서도 화자 일관성과 문맥을 완벽하게 유지합니다.
One Open Source Project a Day (No.51): VibeVoice - Microsoft's Speech AI That Processes 90 Minutes of Audio in a Single Pass↗dev.to
- 19
OpenAI 모델, Amazon Bedrock에 출시: OpenAI와 AWS CEO 인터뷰
OpenAI 모델이 Amazon Bedrock에 출시되며, Microsoft와 OpenAI의 기존 독점 계약이 수정되었습니다. 이를 통해 OpenAI는 Azure를 넘어 AWS 고객층까지 확장하며, AWS는 OpenAI 기반의 'Bedlam Managed Agents'를 통해 에이전트 중심의 AI 서비스를 강화합니다.
OpenAI models coming to Amazon Bedrock: Interview with OpenAI and AWS CEOs↗stratechery.com
- 21
AI 연산에 월 5천 달러씩 지출했는데… GPU 선택을 중단했습니다
AI 모델 개발보다 GPU 인프라 관리(하드웨어 선택, 비용 최적화, 오류 대응)에 더 많은 리소스가 소모되는 문제를 해결하기 위해, 하드웨어 추상화 레이어인 'Jungle Grid'를 소개합니다. 사용자는 GPU를 직접 선택하는 대신 작업(workload)의 특성만 정의하면 시스템이 자동으로 최적의 인프라를 할당하여 비용과 운영 복잡성을 획기적으로 낮춥니다.
We were spending ~$5K/month on AI compute… so I stopped choosing GPUs↗dev.to
- 22
아마존, 새로운 OpenAI 제품을 AWS에서 이미 제공 중
Microsoft의 OpenAI 제품에 대한 독점권이 해제됨에 따라, AWS가 자사 AI 서비스인 Bedrock을 통해 OpenAI의 최신 모델, Codex, 그리고 새로운 AI 에이전트 서비스인 'Bedrock Managed Agents'를 즉시 도입했습니다. 이는 OpenAI와 AWS 간의 협력이 심화되고 클라우드 시장의 AI 주도권 경쟁이 격화되고 있음을 의미합니다.
Amazon is already offering new OpenAI products on AWS↗techcrunch.com














