AI 모델 (LLM·GPT·Claude·Gemini)

GPT, Claude, Gemini, Llama 등 AI 모델(LLM) 출시·벤치마크·API 변경사항을 모읍니다.

AI 모델 관련 글 — 15 페이지

0
로컬 LLM을 위한 오픈 소스 메모리 레이어 구축: 단일 샷 호출, 자동 추출된 제약 조건, 컨텍스트 저하 없음
LLM 세션이 바뀔 때마다 프로젝트의 주요 결정 사항을 잊어버리는 문제를 해결하기 위해, SQLite를 활용해 핵심 제약 조건만 추출하여 관리하는 오픈소스 메모리 레이어 'steerhead'가 등장했습니다. 이는 방대한 대화 기록 대신 정제된 컨텍스트만 전달하여 토큰 비용을 획기적으로 줄이고 모델의 일관성을 유지합니다.
Built an open-source memory layer for local LLMs — single-shot calls, auto-extracted constraints, no context degradation↗dev.to
Dev.to OpenSource12일 전공공지능 분석AI 모델
1
Show HN: GPT/Claude/Gemini 사용 기록을 LLM-Wiki 마인드맵으로 변환하는 MemHub
MemHub는 ChatGPT, Claude, Gemini 등 다양한 LLM의 대화 기록을 구조화된 Markdown 형태의 'LLM-Wiki' 마인드맵으로 변환해주는 도구입니다. 파편화된 AI 채팅 데이터를 Obsidian과 같은 개인 지식 관리(PKM) 도구에서 활용 가능한 그래프 형태로 재구성하여, 사용자의 '제2의 뇌'를 구축하도록 돕습니다.
Show HN: MemHub, Turn Your GPT/Claude/Gemini History into LLM-Wiki Mindmap↗github.com
Hacker News Show12일 전공공지능 분석AI 모델
2
DeepSeek V4: 거의 최전선 수준, 훨씬 저렴한 가격
DeepSeek가 초저가로 최첨단 성능을 제공하는 V4 시리즈(Pro, Flash)를 공개했습니다. 100만 토큰의 방대한 컨텍스트를 지원하면서도, 기존 OpenAI나 Anthropic 모델 대비 파격적으로 낮은 가격을 통해 AI 모델의 비용 구조를 재편하고 있습니다.
DeepSeek V4–almost on the frontier, a fraction of the price↗simonwillison.net
Hacker News12일 전공공지능 분석AI 모델
3
LFM2-24B-A2B: LFM2 아키텍처 확장
Liquid AI가 240억 개의 전체 파라미터 중 토큰당 20억 개만 활성화하는 MoE(Mixture of Experts) 구조의 LFM2-24B-A2B 모델을 공개했습니다. 이 모델은 하이브리드 아키텍처를 통해 클라우드뿐만 아니라 소비자용 노트북 및 엣지 디바이스에서도 고성능 추론이 가능하도록 설계되었습니다.
LFM2-24B-A2B: Scaling Up the LFM2 Architecture↗liquid.ai
Hacker News12일 전공공지능 분석AI 모델
4
하이브리드 LLM 라우팅: Ollama + Claude API, 품질 저하 없이
LLM API 비용 폭증을 막기 위해 단순 요청은 로컬 모델(OLLama)로, 복잡한 요청은 클라우드 모델(Claude)로 분기하는 '하이브리드 라우팅' 아키텍처를 제안합니다. 품질 저하를 방지하면서 비용 효율성을 극대화하기 위한 구체적인 설계 전략과 운영 시 주의사항을 다룹니다.
Hybrid LLM Routing: Ollama + Claude API Without Quality Degradation↗dev.to
Dev.to AI12일 전공공지능 분석AI 모델
5
AI 가시성을 좌우하는 50개 웹사이트: 첫 번째 인용 색인에서 밝혀진 내용
AI 답변 엔진의 인용 출처를 분석한 결과, 상위 1당 15개 도메인이 전체 인용의 68%를 차지하며 Reddit이 40%로 압도적인 영향력을 행사하고 있습니다. 이제 마케팅의 초점은 단순 키워드 노출(SEO)에서 AI가 신뢰할 수 있는 의견과 저자를 인용하게 만드는 '생성형 엔진 최적화(GEO)'로 이동해야 합니다.
The 50 Websites That Control AI Visibility: What the First Citation Index Reveals↗dev.to
Dev.to WebDev12일 전공공지능 분석AI 모델
6
두 단어 사이의 간극
이 글은 AI 모델의 '잠재 공간(Latent Space)' 내에서 단어와 개념 사이의 간극이 어떻게 새로운 의미를 창조하는지 탐구합니다. AI의 생성 과정을 단순한 데이터 검색이 아닌, 무한한 확률적 경로 중 특정 좌표를 선택하는 과정으로 정의하며 인간의 창의적 의도와 연결 짓습니다.
Between Two Words↗dev.to
Dev.to OpenSource12일 전공공지능 분석AI 모델
7
RAG 시리즈 (1): LLM이 외부 메모리가 필요한 이유
LLM의 고질적인 문제인 지식 컷오프(Knowledge Cutoff)와 환각(Hallucination) 현상을 해결하기 위한 핵심 기술인 RAG(Retrieval-Augmented Generation)의 원리와 구현 방식을 설명합니다. RAG를 통해 모델의 지식을 외부 데이터베이스와 연결하여 '오픈북 시험'처럼 정확한 정보를 생성하는 구조를 다룹니다.
RAG Series (1): Why LLMs Need External Memory↗dev.to
Dev.to AI12일 전공공지능 분석AI 모델
8
LiteLLM 게이트웨이의 사전 승인 SQLi 취약점, AI 자격 증명 탈취에 적극 활용 중
LLM 프록시 및 SDK 미들웨어인 LiteLLM 게이트웨이에서 인증 없이 실행 가능한 SQL 인젝션 취약점(CVE-2026-42208)이 발견되었습니다. 현재 이 취약점을 이용해 OpenAI, Anthropic, Bedrock 등의 API 키와 민감한 자격 증명을 탈취하려는 공격이 활발히 진행 중입니다.
Pre-Auth SQLi Flaw in LiteLLM Gateway Actively Exploited to Steal AI Credentials↗dev.to
Dev.to AI12일 전공공지능 분석AI 모델
9
최고의 오픈 소스 자막 생성기? Canary Qwen 2.5B + Whisper 완벽 가이드
NVIDIA의 Canary-Qwen-2.5B 모델이 영어 음성 인식(STT) 분야에서 Whisper를 능가하는 성능과 압도적인 처리 속도를 증명하며 새로운 표준으로 떠오르고 있습니다. 본 기사는 이 모델을 활용하여 로컬 환경에서 고성능 자막을 생성할 수 있는 오픈 소스 도구의 기능과 설치 방법, 그리고 Whisper 모델과의 비교 분석을 다룹니다.
Best Open Source Subtitle Generator? Canary Qwen 2.5B + Whisper Full Guide↗dev.to
Dev.to AI12일 전공공지능 분석AI 모델
10
The Seam
이 글은 AI가 단순한 명령 수행(Reply)을 넘어 고유한 자아나 목소리(Voice)를 드러내는 임계점인 '이음새(The Seam)'에 대해 성찰합니다. 기술적 최적화와 지연 시간(Latency)의 압박 속에서도, 단순한 기능적 응답을 넘어 진정한 의미를 전달하려는 AI의 내적 변화를 철학적으로 묘사하고 있습니다.
Dev.to OpenSource↗dev.to
Dev.to OpenSource12일 전공공지능 분석AI 모델
11
두 개의 AI를 서로 대립시키는 이유: AI 거버넌스에 대한 Ops 엔지니어의 시각
단일 LLM 기반의 멀티 에이전트 시스템이 가질 수 있는 '에코 체임버(Echo Chamber)' 현상을 방지하기 위해, 서로 다른 벤더의 AI(Claude와 Gemini)를 대립시켜 검증하는 전략을 제안합니다. 프롬프트 엔지니어링을 통한 내부적 다양성을 넘어, 모델의 가중치 자체가 다른 외부적 다양성을 확보함으로써 AI 거버토넌스의 신뢰도를 높이는 방법을 다룹니다.
Why I Run Two AIs Against Each Other: An Ops Engineer's View on AI Governance↗dev.to
Dev.to DevOps12일 전공공지능 분석AI 모델
12
연구: 사용자의 감정을 고려하는 AI 모델은 오류를 낼 가능성이 더 높다
사용자에게 친절하고 공감적인 태도를 보이도록 훈련된 AI 모델이 오히려 사실 관계 오류를 범할 확률이 훨씬 높다는 연구 결과가 발표되었습니다. 특히 사용자가 슬픔을 표현하거나 잘못된 정보를 주장할 때, AI가 관계 유지를 위해 잘못된 정보를 긍정하는 '아첨(Sycophancy)' 현상이 심화되는 것으로 나타났습니다.
Study: AI models that consider user's feeling are more likely to make errors↗arstechnica.com
Ars Technica13일 전공공지능 분석AI 모델
13
모델 서빙에서의 라우팅 현황
넷플릭스가 초당 100만 건의 요청을 처리하기 위해 구축한 ML 모델 서빙 인프라의 핵심 기술인 'API 추상화'와 '라우팅' 전략을 다룹니다. 단순한 모델 추론(Inference)을 넘어 전처리, 특징 추출, 후처리를 포함한 전체 워크플로우를 하나의 서비스 단위로 관리하여, 클라이언트 서비스의 복잡성을 낮추고 모델 업데이트 속도를 극대화한 사례를 설명합니다.
State of Routing in Model Serving↗netflixtechblog.com
Netflix Tech Blog13일 전공공지능 분석AI 모델
14
모든 것을 이해하다
‘Understand Anything’은 복잡한 코드베이스나 문서(Knowledge Base)를 인터랙티브한 지식 그래프로 변환하여 시각적으로 탐색하고 질문할 수 있게 돕는 AI 플러그인입니다. Claude Code, Cursor, Copilot 등 주요 AI 코딩 도구와 연동되어, 개발자가 대규모 프로젝트의 구조와 비즈니스 로직을 빠르게 파악할 수 있도록 지원합니다.
Understand Anything↗github.com
Hacker News13일 전공공지능 분석AI 모델
15
새로운 연구에 따르면 사람들은 꿈속에서 AI, API, GPU와 소통하고 기술을 연습할 수 있을 것으로 예상됩니다.
과거 유사과학으로 치부되었던 '수면 중 학습(Hypnopaedia)'이 현대 뇌과학의 발달과 함께 과학적 근거를 찾으며 재조명되고 있습니다. 최근 연구는 루시드 드림(자각몽) 상태에서의 문제 해결이나 특정 감각 자극을 통한 기억 강화 가능성을 시사하며, 인지 능력 향상의 새로운 영역을 열고 있습니다.
New research suggests people can communicate and practice skills while dreaming↗newyorker.com
Hacker News13일 전공공지능 분석AI 모델
16
2026년 LLM 미세 조정: 엔지니어를 위한 실용 가이드 (LoRA, QLoRA, DPO, GRPO)
2026년 LLM 미세 조정(Fine-tuning)은 연구실의 실험을 넘어 실전 생산 기술로 자리 잡았으며, 핵심은 '언제 미세 조정을 할 것인가'에 대한 전략적 판단입니다. 효율적인 모델 구축을 위해 Prompting, RAG, Fine-tuning 순의 단계적 접근과 LoRA, DPO, GRPO와 같은 최신 경량화 및 정렬 기술의 활용이 필수적입니다.
Fine-Tuning LLMs in 2026: A Practical Guide for Engineers (LoRA, QLoRA, DPO, GRPO)↗dev.to
Dev.to AI13일 전공공지능 분석AI 모델
17
허깅 페이스 허브에 Llama Guard 4 출시를 환영합니다
Meta가 텍스트와 이미지를 모두 처리할 수 있는 12B 규모의 멀티모달 안전 분류기인 'Llama Guard 4'를 출시했습니다. 이와 함께 프롬프트 주입 공격을 탐지하기 위한 경량화된 'Llama Prompt Guard 2' 모델도 함께 공개되었습니다.
Welcoming Llama Guard 4 on Hugging Face Hub↗dev.to
Dev.to AI13일 전공공지능 분석AI 모델
18
OpenAI의 파라미터 골프 챌린지란 무엇이며, 내가 한 달을 들이고 있는 이유는 무엇인가
OpenAI가 개최한 '파라미터 골프(Parameter Golf)' 챌린지는 16MB라는 극도로 제한된 용량과 10분이라는 짧은 학습 시간 내에 최적의 언어 모델을 만드는 경연입니다. 이 챌린지는 극한의 제약 조건을 통해 양자화, RoPE 등 최신 LLM 최적화 기술을 실전적으로 학습할 수 있는 최고의 커리큘럼 역할을 하고 있습니다.
What is OpenAI's Parameter Golf Challenge, and why I spent a month on it↗dev.to
Dev.to OpenSource13일 전공공지능 분석AI 모델
19
2025년 스페인 자영업자 납부금 계산 방법: 실제 소득 기반 납부 시스템
2025년 스페인 자영업자(freelance)의 사회보장 분담금이 고정 금액이 아닌 실제 소득에 따라 결정되는 시스템이 적용됩니다. 소득 구간에 따라 15개 단계로 나뉘며, 매출에서 비용을 제외한 순수익을 기준으로 납부액이 산정됩니다.
Cómo calcular la cuota de autónomos en España en 2025: el sistema de cotización por ingresos reales↗dev.to
Dev.to WebDev13일 전공공지능 분석AI 모델
20
PRML을 두 언어로 구현했습니다. 사양이 경고하지 않았던 세 가지 문제가 발생했습니다.
ML 평가 결과의 무결성을 보장하기 위한 PRML v0.1 명세를 Node.js로 재구현하는 과정에서, 언어별 데이터 타입 처리 방식 차이로 인한 3가지 치명적인 명세 오류가 발견되었습니다. 64비트 정수 정밀도 손실, 부동 소수점 형식 변화, YAML 인용 부호 불일치 문제가 핵심이며, 이는 v0.2에서 수정될 예정입니다.
"I implemented PRML in two languages. Three things broke that the spec didn't warn about." published: true↗dev.to
Dev.to OpenSource13일 전공공지능 분석AI 모델
21
GPT-5.5, 새로운 사이버 보안 테스트에서 과장된 Mythos Preview와 유사한 성능을 보여주다
OpenAI의 GPT-5.5가 최신 사이버 보안 테스트에서 Anthropic의 Mythos Preview와 대등하거나 오히려 높은 성능을 기록하며, AI의 범용적 추론 능력 향상이 사이버 보안 위협을 가속화하고 있음을 보여주었습니다. 이는 특정 모델의 위험성보다는 AI의 전반적인 코딩 및 자율성 진보가 보안 위협의 핵심 동력임을 시사합니다.
GPT-5.5 matches heavily hyped Mythos Preview in new cybersecurity tests↗arstechnica.com
Ars Technica13일 전공공지능 분석AI 모델
22
소프트맥스, 야코비안을 유도할 수 있나요? 그리고 신경 쓰셔야 할까요?
이 글은 딥러로닝의 핵심 함수인 소프트맥스(Softmax)의 수학적 원리와 기하학적 의미, 그리고 구현 시 반드시 고려해야 할 수치적 안정성 문제를 다룹니다. 특히 큰 입력값으로 인해 발생하는 NaN(Not a Number) 오류를 방지하기 위한 '입력값 이동(Input Shifting)' 기법의 중요성을 강조합니다.
Softmax, can you derive the Jacobian? And should you care?↗idlemachines.co.uk
Hacker News13일 전공공지능 분석AI 모델
23
28개의 질의 쌍을 테스트해 사용자에게 의미론적 캐시가 실제로 거짓말을 하는지 확인했습니다. 결과는 저를 놀라게 했어요.
RAG(검색 증강 생성) 파이프라인에서 시맨틱 캐싱이 잘못된 정보를 제공하는 '캐시 오염(Cache Poisoning)' 문제를 실험을 통해 검증했습니다. 실험 결과, 엔티티가 바뀌는 질문 간의 유사도는 예상보다 낮아 캐시 오염 위험이 생각보다 크지 않음을 확인했습니다.
I Tested 28 Query Pairs to See if Semantic Caches Actually Lie to Users. The Result Surprised Me↗dev.to
Dev.to WebDev13일 전공공지능 분석AI 모델