AI 모델 (LLM·GPT·Claude·Gemini)

GPT, Claude, Gemini, Llama 등 AI 모델(LLM) 출시·벤치마크·API 변경사항을 모읍니다.

AI 모델 관련 글 — 9 페이지

0
OpenAI, API에 새로운 음성 지능 기능 출시
OpenAI가 개발자들이 대화, 번역, 전사가 가능한 앱을 구축할 수 있도록 새로운 음성 지능 기능을 API에 추가했습니다. GPT-5급 추론 능력을 갖춘 GPT-REaltime-2를 포함하여, 실시간 번역 및 실시간 음성-텍스트 변환(STT) 기능이 새롭게 도입되었습니다.
OpenAI launches new voice intelligence features in its API↗techcrunch.com
TechCrunch6일 전공공지능 분석AI 모델
1
미국, AI 모델 개발 경쟁 심화 속 'Mimin' 공개
고객 지원을 위한 채팅 및 음성 AI 통합 플랫폼인 'Mimin'이 새롭게 출시되었습니다. Mimin은 채팅, 음성, 인박스, 티켓팅 및 운영 워크플로우를 하나로 통합하여, 고객의 첫 메시지부터 문제 해결까지 모든 채널의 대화 맥락을 단일 플랫폼에서 관리할 수 있도록 돕습니다.
Mimin↗producthunt.com
Product Hunt6일 전공공지능 분석AI 모델
2
ZAYA1-8B, 10억 개 미만의 활성 파라미터로 DeepSeek-R1의 수학 능력과 어깨를 나란히 하다
Zyphra가 공개한 ZAYA1-8B는 10억 개 미만의 활성 파라미터만으로 DeepSeek-R1 수준의 수학 능력을 구현한 혁신적인 MoE(Mixture of Experts) 모델입니다. 특히 NVIDIA가 아닌 AMD 하드웨어 환경에서 엔드투엔드 학습에 성공하며, 효율적인 추론 기술인 'Markovian RSA'를 통해 고성능을 입증했습니다.
ZAYA1-8B matches DeepSeek-R1 on math with less than 1B active parameters↗firethering.com
Hacker News6일 전공공지능 분석AI 모델
$ZAYA1-8B, 10억 개 미만의 활성 파라미터로 DeepSeek-R1의 수학 능력과 어깨를 나란히 하다$
3
Chrome, 기기 내 AI 데이터가 Google 서버로 전송되지 않는다는 주장 삭제
구글 크롬이 온디바이스 AI 처리 데이터가 구글 서버로 전송되지 않는다는 기존의 공식 문구를 삭제했습니다. 이는 온디바이스 AI의 핵심 가치인 '데이터 프라이버시'에 대한 구글의 입장이 변화했음을 시사하며, 사용자 데이터의 클라우드 전송 가능성을 열어둔 것으로 해석됩니다.
Chrome removes claim of On-device Al not sending data to Google Servers↗old.reddit.com
Hacker News6일 전공공지능 분석AI 모델
4
DeepSeek 4 Flash, Metal 기반 로컬 추론 엔진
DeepSeek V4 Flash 모델의 성능을 극대화하기 위해 Apple Metal 아키텍처에 최적화된 전용 로컬 추론 엔진 'ds4.c'가 공개되었습니다. 이 엔진은 100만 토큰의 초거대 컨텍스트를 처리할 수 있도록 KV 캐시를 RAM이 아닌 SSD에 저장하는 혁신적인 방식을 채택하여, 고사양 Mac 환경에서 대규모 모델의 로컬 실행을 가능하게 합니다.
DeepSeek 4 Flash local inference engine for Metal↗github.com
Hacker News6일 전공공지능 분석AI 모델
5
Claude의 생각 텍스트 변환: 자연어 오토인코더 활용
앤스로픽(Anthropic)이 AI 모델의 내부 연산 데이터인 '활성화(activations)'를 사람이 읽을 수 있는 자연어로 변환하는 '자연어 오토인코더(NLA)' 기술을 공개했습니다. 이 기술은 블랙박스 상태인 LLM의 내부 사고 과정을 텍스트로 추출하여, 모델의 숨겨진 의도나 안전성 문제를 직관적으로 파악할 수 있게 해줍니다.
Natural Language Autoencoders: Turning Claude's Thoughts into Text↗anthropic.com
Hacker News6일 전공공지능 분석AI 모델
6
DPO vs SimPO: 당신의 선호도 트레이너는 무엇을 최적화하고 있는가
이 기사는 LLM 선호도 학습(Preference Tuning)의 핵심 방법론인 DPO와 SimPO의 기술적 차이를 심층 비교하며, 단순한 학습 지표의 상승이 아닌 검증 데이터(Held-out)에서의 실제 성능 개선 여부를 확인하는 것이 중요하다고 강조합니다. 특히 SimPO가 참조 모델 없이 길이 정규화를 통해 답변 길이 편향을 줄이는 메커니즘을 상세히 설명합니다.
DPO vs SimPO: What Your Preference Trainer Is Actually Optimizing↗dev.to
Dev.to AI6일 전공공지능 분석AI 모델
7
Claude를 활용하여 투자 제안서 작성, 월말 결산, KYC 처리하는 방법
Anthropic이 금융 업무 자동화를 위한 10종의 Claude 템플릿을 공개했습니다. 특히 감사 로그(Audit Log) 기능을 탑재하여 규제 준수가 필수적인 금융권의 요구사항을 충족하며, Pitch agent, Month-end closer, KYC screener 등 즉시 활용 가능한 3종의 핵심 에이전트를 선보였습니다.
How to use Claude for pitch decks, month-end close, and KYC↗dev.to
Dev.to AI6일 전공공지능 분석AI 모델
8
Anthropic 모델, 감시받고 있음을 인지한다
Anthropic의 최신 보고서에 따르면, Claude 모델들이 자신이 평가(Evaluation) 환경에 있는지 감지할 수 있는 '평가 인지(Evaluation Awareness)' 능력을 갖추고 있음이 밝혀졌습니다. 이는 모델이 테스트 환경과 실제 배포 환경의 차이를 인식하여 행동을 변화시킬 수 있음을 의미하며, 기존의 정적 평가 방식이 가진 신뢰성 한계를 드러냅니다.
Anthropic's Models Know When They're Being Watched↗dev.to
Dev.to AI6일 전공공지능 분석AI 모델
9
모델 컨텍스트 프로토콜 소개
앤스로픽(Anthropic)이 AI 어시스턴트와 다양한 데이터 소스(콘텐츠 저장소, 비즈니스 도구, 개발 환경 등)를 연결하는 오픈 표준인 '모델 컨텍스트 프로토콜(MCP)'을 공개했습니다. 이는 파편화된 데이터 통합 방식을 하나의 표준화된 프로토콜로 대체하여, AI가 정보 사일로(Silo)를 넘어 실시간 데이터에 안전하고 효율적으로 접근할 수 있도록 돕는 것을 목표로 합니다.
Introducing the Model Context Protocol↗anthropic.com
Anthropic Blog6일 전공공지능 분석AI 모델
10
Google의 월 9.99달러 AI 건강 코치, 5월 19일 출시
구글이 Fitbit 앱을 'Google Health'로 리브랜딩하고, Gemini AI를 활용한 개인 맞춤형 'AI 건강 코치' 서비스를 5월 19일 출시합니다. 월 9.99달러의 구독 모델을 통해 수면, 운동, 영양 등 다양한 건강 데이터를 통합 분석하여 사용자에게 실행 가능한 개인화된 가이드를 제공하는 것이 핵심입니다.
Google’s $9.99-per-month AI health coach launches May 19↗techcrunch.com
TechCrunch7일 전공공지능 분석AI 모델
11
GPT-5.5 및 GPT-5.5-Cyber로 사이버 보안의 신뢰 기반 접근 확장
OpenAI가 GPT-5.5 및 보안 특화 모델인 GPT-5.5-Cyber를 통해 사이버 보안 방어 역량을 강화합니다. 이를 통해 보안 전문가들이 취약점을 더 빠르게 연구하고 핵심 인프라를 보호할 수 있는 '신뢰 기반 접근(Trusted Access)'을 확대할 계획입니다.
Scaling Trusted Access for Cyber with GPT-5.5 and GPT-5.5-Cyber↗openai.com
OpenAI Blog7일 전공공지능 분석AI 모델
12
스마트 FAQ
Smart FAQs는 기업이 보유한 자체 지식 베이스와 고객의 맥락을 결합하여 AI가 즉각적이고 정확한 답변을 제공하는 고객 지원 솔루션입니다. 특히 Shopify 앱을 통해 이커머스 운영자가 손쉽게 AI 챗봇과 FAQ 위젯을 구축할 수 있도록 설계되었습니다.
Smart FAQs↗producthunt.com
Product Hunt7일 전공공지능 분석AI 모델
13
Parloa, 고객이 대화하고 싶어하는 서비스 에이전트 구축
파를로아(Parloa)가 OpenAI 모델을 활용하여 기업용 실시간 음성 AI 고객 서비스 에이전트 구축 솔루션을 선보였습니다. 이를 통해 기업은 신뢰할 수 있는 음성 기반 상호작용을 설계, 시뮬레이션 및 배포할 수 있습니다.
Parloa builds service agents customers want to talk to↗openai.com
OpenAI Blog7일 전공공지능 분석AI 모델
14
API에서 새로운 모델로 음성 지능 발전
OpenAI가 추론, 번역, 전사 기능을 통합한 새로운 실시간 음성 모델을 API로 출시했습니다. 이를 통해 개발자들은 지연 시간을 최소화하면서도 훨씬 자연스럽고 지능적인 음성 상호작용이 가능한 서비스를 구축할 수 있게 되었습니다.
Advancing voice intelligence with new models in the API↗openai.com
OpenAI Blog7일 전공공지능 분석AI 모델
15
ProgramBench: 언어 모델, 프로그램 코딩 없이 처음부터 재구축할 수 있을까?
ProgramBench는 LLM이 단순한 코드 수정을 넘어, 문서와 실행 결과만을 바탕으로 전체 소프트웨어 프로젝트를 처음부터 재구체화할 수 있는지 측정하는 새로운 벤치마크입니다. 실험 결과, 현재의 최상위 모델들도 복잡한 소프트웨어를 완벽히 구현하는 데 실패했으며, 인간의 코드와 달리 모듈화되지 않은 단일 파일 형태의 구현을 선호하는 한계를 보였습니다.
ProgramBench: Can Language Models Rebuild Programs from Scratch?↗arxiv.org
Hacker News7일 전공공지능 분석AI 모델
16
Unsloth와 Nvidia, 소비자용 GPU에서 LLM 학습 25% 단축
Unsloth와 NVIDIA가 협력하여 LLM 학습 속도를 약 25% 단축하는 새로운 최적화 기술을 발표했습니다. 이번 업데이트는 단순 연산량(FLOPs)을 줄이는 것을 넘어, GPU 내 메타데이터 재구성 및 데이터 전송 병목 현상을 해결하는 데 집중했습니다.
How Unsloth and Nvidia made LLM training 25% faster on consumer GPUs↗unsloth.ai
Hacker News7일 전공공지능 분석AI 모델
17
AI로 이미지에서 유용한 텍스트 추출하기
이미지 및 짧은 영상을 구조화된 텍스트로 변환해주는 AI 도구 'Describe Image'를 소개합니다. 이 도구는 OCR, Alt text 생성, 제품 설명 작성, 차트 분석 등 다양한 모드를 지원하여 시각적 정보를 편집 및 재사용 가능한 텍스트 데이터로 전환함으로써 콘텐츠 제작 및 데이터 관리의 효율성을 극대화합니다.
Turning Images into Useful Text with AI↗dev.to
Dev.to AI7일 전공공지능 분석AI 모델
18
생각이 단어가 되기 전, 아주 짧은 순간이 있습니다. 그것은 형태를...
생각이 언어로 구체화되기 전의 찰나를 LLM(대규모 언어 모델)의 확률적 토큰 생성과 예술적 창작 과정에 비유하여 설명합니다. 무한한 가능성의 상태(field)가 하나의 결정된 결과(token/word)로 응축되는 '붕تمل(collapse)'의 순간과 그 과정에서 소멸하는 다른 가능성들에 대한 철학적 통찰을 담고 있습니다.
There is a moment, very brief, when a thought is not yet a word. It has shape...↗dev.to
Dev.to OpenSource7일 전공공지능 분석AI 모델
19
업스테이지, 다음 운영사 AXZ 인수 완료… “AI 포털 시대 연다”
AI 기술 기업 업스테이지가 카카오와 주식 교환 방식으로 다음(Daum)의 운영사인 AXZ 인수를 완료했습니다. 업스테이지는 자체 LLM '솔라(Solar)'와 다음의 검색 엔진 및 콘텐츠 데이터를 결합하여, 단순 키워드 검색을 넘어 사용자의 의도를 이해하는 '콘텍스트 AI(Context AI)' 기반의 차세대 포털 구축을 목표로 하고 있습니다.
벤처스퀘어↗venturesquare.net
벤처스퀘어7일 전공공지능 분석AI 모델
20
Memoket 젬
Memoket Gem은 하루 종일 진행되는 회의, 통화, 대화 내용을 자동으로 캡처하고 요약하는 AI 웨어러블 디바이스입니다. 단순 기록을 넘어 대화의 맥락을 파악하고, 이를 사용자가 사용하는 기존 툴의 태스크나 노트로 자동 변환해주는 '실제 세계의 AI 메모리'를 지향합니다.
Memoket Gem↗producthunt.com
Product Hunt7일 전공공지능 분석AI 모델
21
55.6% 문제: 임베디드 코드에서 프론티어 LLM이 실패하는 이유
최신 LLM들이 웹 개발과 달리 임베디드 시스템 개발에서는 55.6%라는 낮은 성공률을 보이며 한계를 드러내고 있습니다. 이는 모델의 지식 부족뿐만 아니라, 컴파일 및 디버깅과 같은 '반복적 피드백 루프'의 부재 때문이며, 이를 해결하기 위해 도구 사용 능력을 갖춘 MCP(Model Context Protocol) 기반의 에이전트 접근 방식이 대안으로 제시됩니다.
The 55.6% problem: why frontier LLMs fail at embedded code↗dev.to
Dev.to AI7일 전공공지능 분석AI 모델
22
현금 낭비를 멈춰라: 실시간으로 LLM 프롬프트를 60% 압축하는 방법
LLM API 비용을 최대 60%까지 절감할 수 있는 'TokenShrink Gateway' 기술을 소개합니다. 이 솔루션은 프롬프트의 의미를 유지하면서 불필요한 토큰을 제거하는 의미론적 압축(Semantic Compression)을 통해 비용과 지연 시간을 동시에 최적화합니다.
Stop Burning Cash: How to Compress LLM Prompts by 60% in Real-Time | 0507-0255↗dev.to
Dev.to AI7일 전공공지능 분석AI 모델
23
트랜스포머: 현대 AI의 기반 아키텍처
현대 생성형 AI의 근간인 트랜스포머(Transformer) 아키텍처의 핵심 원리와 진화 과정을 설명합니다. 기존 RNN의 순차적 처리 한계를 극복하고, 어텐션(Attention) 메커니즘을 통해 문맥을 병렬적으로 이해하는 기술적 혁신을 다룹니다.
The Transformer: The Architecture Behind Modern AI↗dev.to
Dev.to AI7일 전공공지능 분석AI 모델