AI 모델 (LLM·GPT·Claude·Gemini)
GPT, Claude, Gemini, Llama 등 AI 모델(LLM) 출시·벤치마크·API 변경사항을 모읍니다.
AI 모델 관련 글 — 23 페이지
- 0
Anthropic과 Amazon, 최대 5기가와트의 새로운 컴퓨트 협력 확대
Anthropic과 Amazon이 최대 5GW 규모의 컴퓨트 용량을 확보하기 위한 대규모 협력을 확대합니다. Anthropic은 향후 10년간 AWS 기술에 1,000억 달러를 투자하기로 약속했으며, 이를 통해 급증하는 Claude의 수요를 충족하고 Amazon의 커스텀 실리콘(Trainium)을 활용한 인프라 최적화를 추진합니다.
Anthropic and Amazon expand collaboration for up to 5 gigawatts of new compute↗anthropic.com
- 2
순간을 담아 보내세요: 고가치 브랜드의 AI, API, GPU 기반 Always-On 퍼포먼스 엔진으로서의 다이렉트 메일 재정의
다이렉트 메일(Direct Mail)을 단순한 일회성 캠페인이 아닌, 실시간 데이터와 구매 의도 신호를 기반으로 한 '상시 가동형(Always-On) 퍼포먼스 엔진'으로 재정의하는 전략을 다룹니다. 디지털 광고의 효율이 저하되는 상황에서 데이터 기반의 적시성 있는 오프라인 접점 활용 방안을 제시합니다.
Mail the Moment: Reframing Direct Mail as an Always-On Performance Engine for High-Value Brands↗amsive.com - 3
딥시크, 최첨단 모델과의 격차를 좁히는 새로운 AI 모델 미리보기
중국의 AI 연구소 DeepSeek가 초거대 파라미터와 압도적인 가성비를 갖춘 신규 모델 'DeepSeek V4'(Flash 및 Pro)를 공개했습니다. 이 모델은 1.6조 개의 파라미터를 보유한 최대 규모의 오픈 웨이트 모델로, 추론 및 코딩 성능에서 최첨단 모델들과 대등한 수준을 보여주며 API 비용을 획기적으로 낮췄습니다.
DeepSeek previews new AI model that ‘closes the gap’ with frontier models↗techcrunch.com
- 9
DeepSeek-V4, 화웨이 Ascend 칩에서 85% 활용률로 구동 – AI 인프라 및 가격에 대한 의미
DeepSeek-V4가 화웨이 Ascend 칩에서 85% 이상의 높은 연산 활용률을 기록하며, 중국의 독자적인 AI 인프라 경쟁력을 입증했습니다. 특히 GPT-4 Turbo 대비 최대 700배 저렴한 파격적인 API 가격을 통해 글로벌 AI 서비스의 비용 구조를 근본적으로 재편할 것으로 보입니다.
DeepSeek-V4 Runs on Huawei Ascend Chips at 85% Utilization — Here's What That Means for AI Infrastructure and Pricing↗dev.to
- 12
Anthropic과 NEC, 일본에서 AI 네이티브 엔지니어링 대규모 구축 파트너십
Anthropic과 일본 NEC가 대규모 파트너십을 체결하고, 일본 최대 규모의 'AI 네이티브 엔지니어링' 조직 구축에 나섭니다. NEC는 전 세계 3만 명의 임직원에게 Claude를 도입하고, 금융·제조·공공 부문을 겨냥한 산업 특화 AI 솔루션을 Anthropic과 공동 개발할 계획입니다.
Anthropic and NEC partner to build AI-native engineering at scale in Japan↗anthropic.com
- 14
하나의 구독, 20+ AI: AIKitPros 구축으로 월 55달러 AI 스택을 대체한 방법
여러 개의 유료 AI 구독 서비스(ChatGPT, Midjourney 등)를 하나의 API 허브인 AIKitPros로 통합하여, 30초 광고 제작 비용을 캠페인당 0.41달러 수준으로 획기적으로 낮춘 사례를 소개합니다. Dify 워크플로우와 정교한 재시도(Retry) 패턴을 결합해 작업 실패율을 20%에서 2% 미만으로 안정화한 것이 핵심입니다.
One Subscription, 20+ AIs: How I Built AIKitPros to Replace My $55/mo AI Stack↗dev.to
- 15
AI가 환각할 때: 월스트리트에서 라틴 아메리카까지 – 1,031개의 허위 문서와 OpenAI를 대변하는 기업도 타격을 입다
LLM의 환각(Hallucination) 현상이 법조계를 넘어 전 산업계의 신뢰를 위협하고 있습니다. OpenAI를 대변하는 엘리트 로펌조차 AI가 생성한 허위 판례를 제출해 제재를 받았으며, 관련 사례는 2026년 3월 기준 1,031건을 넘어섰습니다.
Cuando la IA Alucina: De Wall Street a Latinoamerica – 1,031 Documentos Falsos y la Firma que Representa a OpenAI Cayo Tambien↗dev.to
- 16
Claude, Spotify, Uber Eats, TurboTax 등 개인 앱과 직접 연결됩니다.
Anthropic의 Claude가 Spotify, Uber Eats, TurboTax 등 개인용 앱과 직접 연결되는 '앱 커넥터' 기능을 출시했습니다. 이를 통해 사용자는 대화 맥락에 따라 AI가 추천하는 앱을 활용해 예약, 구매 등 실질적인 작업을 수행할 수 있게 됩니다.
Claude is connecting directly to your personal apps like Spotify, Uber Eats, and TurboTax↗theverge.com
- 19
이커머스에서 로컬 Llama 4 설정으로 월 $800 API 비용 대체
월 80,000건의 제품 설명을 생성하던 이커머스 기업이 GPT-4o API 비용을 월 800달러에서 로컬 Llama 4(Maverick) 활용을 통해 전기료 수준인 40달러로 95% 이상 절감한 사례를 분석합니다. 비용 최적화, 데이터 프라이버시, 처리 속도 문제를 해결하기 위한 로컬 LLM 구축 및 하이브리드 운영 전략을 제시합니다.
I Replaced $800/mo in API Costs with a Local Llama 4 Setup for E-Commerce↗dev.to














