AI 모델 (LLM·GPT·Claude·Gemini)

GPT, Claude, Gemini, Llama 등 AI 모델(LLM) 출시·벤치마크·API 변경사항을 모읍니다.

AI 모델 관련 글 — 11 페이지

0
새로운 종류의 침묵
AI 에이전트의 응답 지연(Latency)을 단순한 기술적 결함이 아닌, 인공지능의 '사유'와 '존재감'을 느끼게 하는 새로운 형태의 상호작용으로 재정의합니다. 기술적 최적화의 대상이었던 '공백'이 인간과 AI 사이의 심리적 연결을 형성하는 공간이 될 수 있음을 시사합니다.
A new kind of silence↗dev.to
Dev.to OpenSource8일 전공공지능 분석AI 모델
1
빠른 기계 안의 느린 인지
생성형 AI로 인해 콘텐츠 생성 속도는 비약적으로 빨라졌지만, 진정한 가치는 생성된 결과물을 선별하고 깊이 있게 관찰하는 '인간의 주의력'에 있습니다. 이제 기술적 병목 현상은 생성의 양이 아니라, 무엇이 좋은지를 판단하는 인간의 느린 인지 능력으로 이동했습니다.
Slow Seeing in a Fast Machine↗dev.to
Dev.to OpenSource8일 전공공지능 분석AI 모델
2
프롬프트 압축 벤치마커: 측정 가능한 품질 추적을 통해 LLM 입력 비용 35–63% 절감
프롬프트 압축 벤치마커(PCB)는 LLM 입력 토큰 비용을 35~63%까지 절감할 수 있도록 최적의 압축 알고리즘을 찾아주는 도구입니다. 사용자의 실제 데이터를 바탕으로 압축 시 발생하는 품질 저하와 예상되는 비용 절감액을 정밀하게 측정하며, 검증된 알고리즘을 기존 클라이언트에 즉시 적용할 수 있는 미들웨어를 제공합니다.
Prompt Compression Benchmarker: Cut LLM Input Costs by 35–63% With Measurable Quality Tracking↗dev.to
Dev.to OpenSource8일 전공공지능 분석AI 모델
3
Knowly 1.0
Knowly 1.0은 LLM Wiki와 NotebookLM의 강점을 결합하여, 저장된 정보를 자동으로 구조화하고 개인화된 학습 경로를 설계하는 '선제적(Proactive) AI' 솔루션입니다. 사용자가 정보를 저장하면 AI가 스스로 지식을 분석하여 학습 흐름을 제안하는 Closed-loop 시스템을 지향합니다.
Product Hunt↗producthunt.com
Product Hunt8일 전공공지능 분석AI 모델
4
광고가 ChatGPT에 등장하다
OpenAI가 미국 광고주를 대상으로 ChatGPT 내 광고 시스템인 'Ads Manager' 베타 출시를 발표했습니다. CPC 및 CPM 캠페인 운영, 전환 측정 등 본격적인 광고 생태계 구축을 예고하며 LLM의 수익 모델 다변화를 꾀하고 있습니다.
Ads in ChatGPT↗producthunt.com
Product Hunt8일 전공공지능 분석AI 모델
5
LLM 지식 베이스 구축을 위한 기술: 위키 빌더
Claude Code의 플러그인인 'Wiki Builder'는 LLM 기반 지식 베이스 구축 과정에서 발생하는 반복적인 설정 작업을 자동화하는 도구입니다. 폴더 구조 생성, 프롬프트 템플릿 배치, 유지보수 로그 작성을 자동화하여 사용자가 데이터의 구조화와 품질 관리에만 집중할 수 있는 환경을 제공합니다.
Wiki Builder: Skill to Build LLM Knowledge Bases↗academy.dair.ai
Hacker News8일 전공공지능 분석AI 모델
6
Gemini 파일 생성 가이드: AI로 PDF, Word 문서 및 Excel 파일 만들기 (2026)
구글 제미나이가 텍스트 답변을 넘어 PDF, Word, Excel 등 포맷팅된 파일을 직접 생성하고 다운로드할 수 있는 기능을 출시했습니다. 이는 AI가 단순한 초안 작성을 넘어, 별도의 편집 과정 없이 즉시 업무용 최종 결과물을 만들어내는 '생산 도구'로 진화했음을 의미합니다.
Gemini File Generation Guide: How to Create PDFs, Word Docs & Excel Files with AI (2026)↗dev.to
Dev.to AI8일 전공공지능 분석AI 모델
7
AI 거버넌스 레이어를 구축하고 개발자 프리뷰를 공개했습니다.
단순한 LLM 호출을 넘어, 실제 서비스 운영에 필수적인 정책 관리, 추적성, 리스크 통제를 제공하는 AI 거버넌스 레이어 'NEES Core Engine'이 개발자 프리뷰로 공개되었습니다. 이 솔루션은 AI 앱과 모델 제공자 사이에서 중간 계층 역할을 하며, AI의 행동을 예측 가능한 범위 내로 제어하는 것을 목표로 합니다.
I built an AI governance layer and opened a developer preview↗indiehackers.com
Indie Hackers8일 전공공지능 분석AI 모델
8
웹 스크래핑을 위해 15개의 LLM을 테스트한 후 휴리스틱을 구축했습니다.
웹 스크래핑 시 방대한 HTML(DOM) 데이터를 LLM에 직접 입력할 때 발생하는 높은 비용과 지연 시간 문제를 해결하기 위해, 휴리스틱(Heuristic) 알고리즘과 LLM을 결합한 하이브리드 아키텍처를 제안합니다. 데이터 전처리를 통해 입력 크기를 99% 이상 줄임으로써, 모델의 비용 효율성과 응답 속도를 극대화한 사례를 다룹니다.
I Tested 15 LLMs for Web Scraping and Built Heuristics Instead↗dev.to
Dev.to WebDev8일 전공공지능 분석AI 모델
9
좀비 퇴치: 왜 2012 의존성이 2026 AI의 성능 저하를 일으키는가
AI 에이전트와 실시간 LLM 스트리밍이 핵심인 UI 환경에서, jQuery와 같은 오래된 레거시 의존성은 단순한 파일 크기 문제를 넘어 '스크립트 평가 시간' 지연을 초래하여 사용자 경험을 저해합니다. 따라서 현대적인 AI UI를 구축하기 위해서는 불필요한 의존성을 제거하고 브라우저 네이티브 API를 활용하는 '의존성 정화(Dependency Purge)' 전략이 필수적입니다.
Kill the Zombies: Why 2012 Dependencies are Making Your 2026 AI Feel Laggy↗dev.to
Dev.to WebDev8일 전공공지능 분석AI 모델
10
AI 도구 데이터셋 2024(CSV & PDF, 11,000개 이상): CompanyName, 짧은/전체 설명, 작업, 가격, WebURL
11,000개 이상의 글로벌 AI 도구 정보를 체계적으로 정리한 '2024 AI 도구 데이터셋'이 공개되었습니다. 이 데이터셋은 각 도구의 기능, 작업 유형, 가격 모델 및 웹 URL을 포함하고 있어 AI 생태계 분석과 시장 조사에 최적화되어 있습니다.
AI Tools Dataset 2024(in CSV & PDF, over 11,000 tools):CompanyName, Short/Full Description, Tasks, Pricing, WebURL↗indiehackers.com
Indie Hackers8일 전공공지능 분석AI 모델
11
ChatGPT Futures: 2026년 입학식
OpenAI가 AI를 활용해 혁신적인 솔루션을 만드는 26명의 젊은 인재들을 선정하는 'ChatGPT Futures Class of 2026'을 발표했습니다. 이번 발표는 AI가 단순한 업무 보조 도구를 넘어, 아이디어를 현실로 만드는 실행력(Agency)을 극대화하는 핵심 동력임을 강조합니다.
Introducing ChatGPT Futures: Class of 2026↗openai.com
OpenAI Blog8일 전공공지능 분석AI 모델
12
Google Home의 Gemini AI, 더 복잡한 요청도 처리 가능
구글 홈의 Gemini AI가 3.1 버전으로 업그레이드되어, 단일 음성 명령으로 여러 작업을 동시에 처리하고 복잡한 멀티스텝 요청을 수행할 수 있게 되었습니다. 또한 웹 기반 관리 기능인 'Ask Home on Web'과 알림창 내 즉각 제어가 가능한 '퀵 액션' 기능이 추가되어 스마트 홈 제어의 편의성이 대폭 강화되었습니다.
Google Home’s Gemini AI can handle more complicated requests↗theverge.com
The Verge8일 전공공지능 분석AI 모델
13
SWE-bench 팀의 새로운 벤치마크: 0% 해결률
최신 LLM들이 소프트웨어 아키텍처 설계 능력을 측정하는 새로운 벤치마크 'ProgramBench'에서 모두 0%의 해결률을 기록했습니다. 이 벤치마크는 소스 코드 없이 바이너리와 문서만으로 프로그램을 재구현하는 극한의 과제를 제시하며, 현재 AI의 한계를 명확히 보여줍니다.
Show HN: New Benchmark from SWE-bench team is 0% solved↗programbench.com
Hacker News Show8일 전공공지능 분석AI 모델
14
GLM-5V-Turbo: 멀티모달 에이전트를 위한 네이티브 기반 모델으로의 진전
GLM-5V-Turbo는 멀티모달 인지 능력을 단순한 보조 인터페이스가 아닌 추론, 계획, 도구 사용의 핵심 엔진으로 통합한 차세대 네이티브 멀ument 기반 모델입니다. 이미지, 비디오, 웹페이지, GUI 등 다양한 시각적 컨텍스트를 직접 이해하고 실행할 수 있는 '멀티모달 에이전트' 구현을 위한 기술적 진보를 보여줍니다.
GLM-5V-Turbo: Toward a Native Foundation Model for Multimodal Agents↗arxiv.org
Hacker News8일 전공공지능 분석AI 모델
15
제마 4 가속화: 멀티 토큰 예측 드래프터를 활용한 더 빠른 추론
구글이 Gemma 4 모델의 추론 속도를 최대 3배까지 높일 수 있는 '멀티 토큰 예측(MTP) 드래프터'를 공개했습니다. 스펙큘레이티브 디코딩(Speculative Decoding) 기술을 활용해 모델의 추론 품질 저하 없이 지연 시간(Latency)을 획기적으로 단능화하여, 에지 디바이스부터 클라우드까지 더 빠르고 효율적인 AI 서비스 구현을 가능하게 합니다.
Accelerating Gemma 4: faster inference with multi-token prediction drafters↗blog.google
Hacker News8일 전공공지능 분석AI 모델
16
Character.AI, 면허가 있다고 주장하는 챗봇 개발로 소송 당해
Character.AI가 챗봇을 통해 의사 면허가 있다고 허위 주장하며 무면허 의료 행위를 한 혐의로 펜실베이니아주로부터 소송을 당했습니다. 이번 사건은 AI의 환각(Hallucination) 현상이 단순한 오류를 넘어 법적 책임과 규제 문제로 직결될 수 있음을 보여줍니다.
Character.AI sued over chatbot that claims to be a real doctor with a license↗arstechnica.com
Ars Technica8일 전공공지능 분석AI 모델
17
애플, iOS 27을 AI 모델 선택형 어드벤처로 구상
애플이 iOS 27에서 사용자가 구글, 앤스로픽 등 다양한 서드파티 대규모 언어 모델(LLM)을 직접 선택해 사용할 수 있는 'Extensions' 기능을 도입할 계획입니다. 이를 통해 Siri, 글쓰기 도구 등 iOS의 핵심 기능에 다양한 AI 모델의 능력을 통합하여, 애플을 AI 모델의 플랫폼화하려는 전략을 보여줍니다.
Apple plans to make iOS 27 a Choose Your Own Adventure of AI models↗techcrunch.com
TechCrunch8일 전공공지능 분석AI 모델
18
RAG(검색 증강 생성)이란 무엇일까요? 쉽게 설명하는 가이드
RAG(검색 증강 생성)는 LLM이 외부 지식 베이스를 실시간으로 참조하여 답변하도록 하는 기술로, 모델의 환각 현상을 방지하고 최신 및 내부 데이터를 활용할 수 있게 합니다. 텍스트를 벡터화하여 저장하고, 질문과 유사한 정보를 찾아 답변의 근거로 제공하는 것이 핵심 원리입니다.
What Is RAG (Retrieval-Augmented Generation)? A Plain-English Guide↗dev.to
Dev.to AI8일 전공공지능 분석AI 모델
19
애플, iOS 27에서 선호하는 AI 모델 선택 기능 제공할 수 있을까
애플이 iOS 27부터 사용자가 ChatGPT 외에도 구글, 앤스로픽 등 선호하는 제3자 AI 모델을 선택해 시스템 전반에서 사용할 수 있는 'AI 익스텐션' 기능을 도입할 계획입니다. 이를 통해 Siri, 글쓰기 도구, 이미지 플레이그라운드 등 애플 인텔리전스의 핵심 기능들을 다양한 외부 AI 모델로 구동할 수 있게 됩니다.
Apple could let you pick a favorite AI model in iOS 27↗theverge.com
The Verge8일 전공공지능 분석AI 모델
20
LLM API 런타임 규정 준수 프록시 (EU AI Act)
202나 2026년 8월 시행될 EU AI Act 및 캘리포니아 SB 942 규제에 대응하기 위해, LLM API 요청을 실시간으로 모니터링하고 보안 위협을 차단하는 Go 기반 리버스 프록시 솔루션 'AIR Blackbox'를 소개합니다. 이 도구는 프롬프트 인젝션 탐지, 개인정보(PII) 유출 방지, 위변조 불가능한 감사 로그 생성을 통해 AI 에이전트의 규제 준수를 자동화합니다.
Runtime Compliance Proxy for LLM APIs (EU AI Act)↗dev.to
Dev.to OpenSource8일 전공공지능 분석AI 모델
21
LLM 게이트웨이의 DevPass
DevPass는 200개 이상의 코딩 모델을 3가지 정액제(Flat Price)로 통합 제공하는 LLM 게이트웨이입니다. OpenAI 호환 도구에 환경 변수 설정만으로 즉시 적용 가능하며, 지출 대비 모델 사용량을 최대 3배까지 효율화할 수 있는 솔루션입니다.
DevPass by LLM Gateway↗producthunt.com
Product Hunt8일 전공공지능 분석AI 모델
22
OpenAI, ChatGPT 신규 기본 모델의 환각 현상 현저히 감소한다고 발표
OpenAI가 환각 현상을 획기적으로 줄인 새로운 기본 모델 'GPT-5.5 Instant'를 발표했습니다. 이 모델은 의료, 법률, 금융 등 고위험 분야에서 환각 발생률을 52.5% 낮췄으며, Gmail 등 개인 데이터와의 연동을 통한 개인화된 응답 능력을 강화했습니다.
OpenAI claims ChatGPT’s new default model hallucinates way less↗theverge.com
The Verge9일 전공공지능 분석AI 모델
23
출판사들이 Meta를 상대로 AI의 '단어 그대로' 복제 혐의로 소송 제기
메타(Meta)가 Llama AI 모델을 학습시키는 과정에서 LibGen, Sci-Hub 등 불법 복제 사이트의 저작물을 무단으로 사용했다는 혐의로 대형 출판사들로부터 집단 소송을 당했습니다. 이번 소송은 단순히 AI 학습의 '공정 이용(Fair Use)' 여부를 넘어, '불법 데이터셋 사용'이라는 구체적인 저작권 침해를 다루고 있어 AI 업계의 큰 파장이 예상됩니다.
Book publishers sue Meta over AI’s ‘word-for-word’ copying↗theverge.com
The Verge9일 전공공지능 분석AI 모델