AI 모델 (LLM·GPT·Claude·Gemini)
GPT, Claude, Gemini, Llama 등 AI 모델(LLM) 출시·벤치마크·API 변경사항을 모읍니다.
AI 모델 관련 글 — 24 페이지
- 0
Claude, Spotify, Uber Eats, TurboTax 등 개인 앱과 직접 연결됩니다.
Anthropic의 Claude가 Spotify, Uber Eats, TurboTax 등 개인용 앱과 직접 연결되는 '앱 커넥터' 기능을 출시했습니다. 이를 통해 사용자는 대화 맥락에 따라 AI가 추천하는 앱을 활용해 예약, 구매 등 실질적인 작업을 수행할 수 있게 됩니다.
Claude is connecting directly to your personal apps like Spotify, Uber Eats, and TurboTax↗theverge.com
- 3
이커머스에서 로컬 Llama 4 설정으로 월 $800 API 비용 대체
월 80,000건의 제품 설명을 생성하던 이커머스 기업이 GPT-4o API 비용을 월 800달러에서 로컬 Llama 4(Maverick) 활용을 통해 전기료 수준인 40달러로 95% 이상 절감한 사례를 분석합니다. 비용 최적화, 데이터 프라이버시, 처리 속도 문제를 해결하기 위한 로컬 LLM 구축 및 하이브리드 운영 전략을 제시합니다.
I Replaced $800/mo in API Costs with a Local Llama 4 Setup for E-Commerce↗dev.to
- 8
OpenAI, GPT-5.5 출시하며 AI '슈퍼 앱'에 한 걸음 더 다가서
OpenAI가 더욱 지능적이고 직관적인 신규 모델 GPT-5.5를 출시하며, 단순한 챗봇을 넘어선 '슈퍼 앱(Super App)' 구축을 위한 본격적인 행보를 시작했습니다. 이번 모델은 에이전틱 컴퓨팅(Agentic Computing) 능력을 강화하여 코딩, 과학 연구, 데이터 분석 등 전문적인 워크플로우에서 압도적인 성능을 목표로 합니다.
OpenAI releases GPT-5.5, bringing company one step closer to an AI ‘super app’↗techcrunch.com
- 14
파일 메타데이터 조작을 통한 비디오 콘텐츠 ID 프로그램 방식 우회 방법
YouTube, TikTok 등 플랫폼의 Content ID 시스템을 우회하기 위해 비디오 파일의 메기데이터(Hash, EXIF, GUID 등)를 조작하여 디지털 지문을 재설정하는 기술적 방법을 다룹니다. 단순한 영상 편집을 넘어 파일의 바이너리 구조를 변경함으로써 플랫폼이 해당 파일을 '새로운 콘텐츠'로 인식하게 만드는 전략을 설명합니다.
How to Programmatically Bypass Video Content ID by Altering File Metadata↗dev.to - 15
GPT 이미지 2 Subject-Lock 편집: input_fidelity를 위한 실용적인 가이드
GPT Image 2의 'Subject-Lock' 기능은 input_fidelity 파라미터를 통해 참조 이미지의 특정 요소(제품, 로고, 형태 등)를 픽셀 단위로 유지하며 편집할 수 있는 혁신적인 기술입니다. 이를 통해 이커머스 제품 사진의 배경 교체, 라벨 변경, 패션 의상 리스타일링 등 기존 생성형 AI로는 불가능했던 정교한 이미지 변형 작업이 가능해집니다.
GPT Image 2 Subject-Lock Editing: A Practical Guide to input_fidelity↗dev.to
- 16
GPT 이미지 2 vs DALL-E 3: OpenAI의 새로운 이미지 모델에서 실제로 무엇이 달라졌나
OpenAI의 새로운 이미지 모델 GPT Image 2는 DALL-E 3의 고질적인 문제였던 텍스트 렌더링 오류, 저해상도, 비라틴 문자 지원 문제를 혁신적으로 해결했습니다. 특히 피사체를 고정하고 배경만 변경할 수 있는 'Subject-lock editing' 기능은 상업적 이미지 생성의 패러다임을 바꿀 핵심 기술로 평가받습니다.
GPT Image 2 vs DALL-E 3: What Actually Changed in OpenAI's New Image Model↗dev.to
- 21
LLM 애플리케이션에서 법의학적 가시성을 확보하기 위한 AI 감사 로그 구현
LLM 애플리케이션의 보안 위협은 단일 이벤트가 아닌 연속적인 의사결정 과정에서 발생하므로, 단순한 로그를 넘어 상호작용의 인과관계를 추적할 수 있는 '법의학적 가시성(Forensic Visibility)' 확보가 필수적입니다. 이를 위해 데이터 캡처, 암호화 체인, 조사 인터페이스로 구성된 3계급 아키텍처와 증거 수준의 데이터 기록 체계 구축이 필요합니다.
Implementing AI Audit Logs for Forensic Visibility in LLM Applications↗dev.to
- 22
하루에 하나씩 살펴보는 오픈 소스 프로젝트 (제46탄): Y Combinator CEO가 직접 만든 AI 두뇌를 오픈 소스로 공개
Y Combinator의 CEO Garry Tan이 자신이 실제로 사용하는 AI 메모리 시스템인 'GBrain'을 오픈 소스로 공개했습니다. GBrain은 외부 API 호출 전 로컬 메모리를 먼저 조회하는 'Brain-First' 설계를 통해 AI 에이전트의 비용을 절감하고 지능을 축적하는 혁신적인 구조를 제안합니다.
One Open Source Project a Day (No.46): The Y Combinator CEO Wrote His Own AI Brain and Open-Sourced It↗dev.to
- 23
Qwen3.6-27B, SWE-bench에서 77.2% 기록. 덴스 모델이 MoE를 압도하다.
알리바바의 Qwen3.6-27B(Dense) 모델이 SWE-bench Verified에서 77.2%를 기록하며, 효율성 중심의 MoE(Mixture of Experts) 모델인 35B-A3B를 성능으로 압도했습니다. 이는 복잡한 소프트웨어 엔지니어링 작업에서 전체 파라미터를 활용하는 Dense 모델의 추론 능력이 MoE의 효율성보다 더 강력할 수 있음을 시사합니다.
qwen3.6-27b scores 77.2% on SWE-bench. the dense model is winning against MoE.↗dev.to














