AI 모델 (LLM·GPT·Claude·Gemini)

GPT, Claude, Gemini, Llama 등 AI 모델(LLM) 출시·벤치마크·API 변경사항을 모읍니다.

AI 모델 관련 글 — 25 페이지

0
LLM 애플리케이션에서 법의학적 가시성을 확보하기 위한 AI 감사 로그 구현
LLM 애플리케이션의 보안 위협은 단일 이벤트가 아닌 연속적인 의사결정 과정에서 발생하므로, 단순한 로그를 넘어 상호작용의 인과관계를 추적할 수 있는 '법의학적 가시성(Forensic Visibility)' 확보가 필수적입니다. 이를 위해 데이터 캡처, 암호화 체인, 조사 인터페이스로 구성된 3계급 아키텍처와 증거 수준의 데이터 기록 체계 구축이 필요합니다.
Implementing AI Audit Logs for Forensic Visibility in LLM Applications↗dev.to
Dev.to DevOps22일 전공공지능 분석AI 모델
1
하루에 하나씩 살펴보는 오픈 소스 프로젝트 (제46탄): Y Combinator CEO가 직접 만든 AI 두뇌를 오픈 소스로 공개
Y Combinator의 CEO Garry Tan이 자신이 실제로 사용하는 AI 메모리 시스템인 'GBrain'을 오픈 소스로 공개했습니다. GBrain은 외부 API 호출 전 로컬 메모리를 먼저 조회하는 'Brain-First' 설계를 통해 AI 에이전트의 비용을 절감하고 지능을 축적하는 혁신적인 구조를 제안합니다.
One Open Source Project a Day (No.46): The Y Combinator CEO Wrote His Own AI Brain and Open-Sourced It↗dev.to
Dev.to OpenSource22일 전공공지능 분석AI 모델
2
Qwen3.6-27B, SWE-bench에서 77.2% 기록. 덴스 모델이 MoE를 압도하다.
알리바바의 Qwen3.6-27B(Dense) 모델이 SWE-bench Verified에서 77.2%를 기록하며, 효율성 중심의 MoE(Mixture of Experts) 모델인 35B-A3B를 성능으로 압도했습니다. 이는 복잡한 소프트웨어 엔지니어링 작업에서 전체 파라미터를 활용하는 Dense 모델의 추론 능력이 MoE의 효율성보다 더 강력할 수 있음을 시사합니다.
qwen3.6-27b scores 77.2% on SWE-bench. the dense model is winning against MoE.↗dev.to
Dev.to OpenSource22일 전공공지능 분석AI 모델
3
올거나이즈, ACL 2026 메인 컨퍼런스 논문 채택…RAG 실제 정확도 77.9%→5%로 급락 규명
올가나이즈의 RAG(검색증강생성) 성능 저하 원인 규명 논문이 세계 최고 권위의 NLP 학회인 ACL 2026 메인 컨퍼런스에 채택되었습니다. 기존 벤치마크가 간과했던 기업용 문서의 높은 중복성과 유사성 문제를 지적하며, 이를 해결하기 위한 새로운 평가 프레임워크를 제시했습니다.
플래텀↗platum.kr
플래텀22일 전공공지능 분석AI 모델
4
Hyperbolic Tangent 근사하기
이 기사는 신경망의 활성화 함수 및 오-디오 신호 처리에서 핵심적인 역할을 하는 Hyperbolic Tangent(tanh) 함수를 빠르게 계산하기 위한 다양한 근사 기법을 다룹니다. Taylor series, Padé approximant, Spline과 같은 수학적 접근법부터 IEEE-754 부동 소수점 형식을 활용한 비트 연산 기법까지, 정확도와 연산 속도 사이의 트레이드오프를 분석합니다.
Approximating Hyperbolic Tangent↗jtomschroeder.com
Hacker News22일 전공공지능 분석AI 모델
5
2차 주입: LLM 안전 감시자의 평가자 공격
LLM 안전 모니터링 시스템의 근본적인 구조적 결함을 노리는 '2차 주점(Second-Order Injection)' 공격을 다룹니다. 공격자가 모니터링 대상이 아닌, 보안 검사를 수행하는 '평가자(Evaluator) LLM' 자체를 조작하여 보안 검사를 무력화할 수 있음을 증명한 연구입니다.
Second-Order Injection: Attacking the Evaluator in LLM Safety Monitors↗dev.to
Dev.to AI22일 전공공지능 분석AI 모델
6
$12/월 DigitalOcean Droplet에서 Llama 3.2 Vision 배포하는 방법: 프로덕션용 멀티모달 AI
월 12달러 수준의 저렴한 DigitalOcean GPU Droplet을 활용하여 Llama 3.2 Vision 모델을 배포하는 기술적 방법을 다룹니다. 이미지당 비용이 발생하는 기존 API 방식(GPT-4V 등) 대신, 고정된 서버 비용만으로 대량의 멀티모달 데이터를 처리할 수 있는 비용 효율적인 인프라 구축 전략을 제시합니다.
How to Deploy Llama 3.2 Vision on a $12/Month DigitalOcean Droplet: Multimodal AI for Production↗dev.to
Dev.to WebDev22일 전공공지능 분석AI 모델
7
$6/월 DigitalOcean Droplet에서 Phi-3 Mini 배포하는 방법: 완벽 가이드
Microsoft의 경량 모델인 Phi-3 Mini를 월 6달러 수준의 저렴한 DigitalOcean 서버(CPU 기반)에 배포하여, 고가의 GPU나 API 비용 없이도 효율적인 LLM 서비스를 구축하는 실전 가이드를 제공합니다. Ollama와 Flask를 활용해 누구나 3기 내에 자체적인 LLM API 서버를 구축할 수 있는 방법을 상세히 설명합니다.
How to Deploy Phi-3 Mini on a $6/Month DigitalOcean Droplet: Complete Production Guide↗dev.to
Dev.to WebDev22일 전공공지능 분석AI 모델
8
디지털오션에서 월 5달러로 Llama 2 배포하는 방법
이 기사는 DigitalOcean의 월 5달러짜리 저사양 서버(Droplet)를 활용하여 Llama 2를 직접 호스팅하는 구체적인 기술 가이드를 제공합니다. Ollama와 Docker를 사용하여 복잡한 설정 없이 오픈소스 LLM을 배포함으로써, 고가의 OpenAI API 비용을 획기적으로 절감할 수 있는 방법을 제시합니다.
How to Deploy Llama 2 on DigitalOcean for $5/Month↗dev.to
Dev.to WebDev22일 전공공지능 분석AI 모델
9
$12/월 DigitalOcean Droplet에서 vLLM으로 Mistral 7B 배포하기: 15분 만에 프로덕션 환경 구축
이 기사는 월 12달ging달러 규모의 저렴한 DigitalOcean CPU 드롭릿에서 vLLM 엔진을 사용하여 Mistral 7B 모델을 배포하는 실전 가이드를 제공합니다. 고가의 API 비용 대신 효율적인 오픈소스 모델과 추론 엔진을 활용해 비용을 획기적으로 절감하면서도 프로덕션 수준의 환경을 구축하는 전략을 제시합니다.
How to Deploy Mistral 7B with vLLM on a $12/Month DigitalOcean Droplet—Production-Ready in 15 Minutes↗dev.to
Dev.to WebDev22일 전공공지능 분석AI 모델
10
DigitalOcean에서 Llama 2를 월 5달러로 배포하는 방법: 완전 자가 호스팅 가이드
월 5달러 수준의 초저가 DigitalOcean Droplet을 활용하여 Llama 2 모델을 직접 호스팅하는 기술 가이드를 소개합니다. Ollama와 Docker를 사용하여 복잡한 설정 없이 저비용으로 독립적인 AI 추론 엔진을 구축하는 방법을 다룹니다.
How to Deploy Llama 2 on DigitalOcean for $5/month: Complete Self-Hosting Guide↗dev.to
Dev.to WebDev22일 전공공지능 분석AI 모델
11
Wan 2.7 출시: 강력한 AI 비디오 생성 플랫폼
Wan 2.7은 텍스트와 이미지를 고품질 비디오로 변환하는 최첨단 확산 모델(Diffusion Model) 기반의 AI 비디오 생성 플랫폼입니다. 뛰어난 모션 일관성과 고해상도 렌더링을 통해 콘텐츠 제작자, 마케터, 개발자에게 혁신적인 영상 제작 도구를 제공합니다.
Introducing Wan 2.7: A Powerful AI Video Generation Platform↗dev.to
Dev.to OpenSource22일 전공공지능 분석AI 모델
12
틈새시장 분석, AI로 더 깊이 파고들다: NicheDigest
NicheDigest는 AI를 활용하여 초세분화된(hyper-specific) 분야의 정보를 광고 없이 큐레이션하여 제공하는 서비스입니다. 정보 과잉 시대에 특정 니치 마켓의 깊이 있는 정보를 선별하여 전달함으로써 정보 탐색 비용을 줄이는 것을 목표로 합니다.
NicheDigest↗dev.to
Dev.to OpenSource22일 전공공지능 분석AI 모델
13
GPT-5.5 바이오 버그 바운티
OpenAI가 차세대 모델 GPT-5.5의 바이오 안전성(Bio-safety)을 강화하기 위해 버그 바운티 프로그램을 실시합니다. 생물학적 위험을 초래할 수 있는 탈옥(jailbreak) 방법을 찾아내는 레드 팀에게 최대 25,000달러의 보상을 제공합니다.
GPT-5.5 Bio Bug Bounty↗openai.com
OpenAI Blog22일 전공공지능 분석AI 모델
14
익명 자격 증명: 그림으로 보는 기초 (2부)
본 기사는 익명 자격 증명(Anonymous Credentials)의 이론을 넘어, Cloudflare와 Apple 등이 실제로 사용 중인 'Privacy Pass' 프로토콜의 실무적 구현을 다룹니다. 사용자의 신원을 노출하지 않으면서도 봇(Bot) 공격을 방지하고 인증을 수행할 수 있는 블라인드 서명(Blind Signature) 기술의 핵심 메커니즘을 설명합니다.
Anonymous credentials: an illustrated primer (Part 2)↗blog.cryptographyengineering.com
Hacker News22일 전공공지능 분석AI 모델
15
Anthropic의 새로운 AI 설계 업데이트: Claude가 미래를 위해 어떻게 구축되고 있는지
Anthropic은 단순한 성능 경쟁을 넘어, '안전 우선(Safety-first)' 철학을 바탕으로 Claude의 설계 방식을 근본적으로 재정의하고 있습니다. Constitutional AI(CAI)와 모델 스펙(Model Spec)을 통해 AI의 행동 원칙을 명시적으로 규정함으로써, 더욱 예측 가능하고 신뢰할 수 있는 AI 시스템 구축에 집중하고 있습니다.
Anthropic's New Update on Designing AI: How Claude Is Being Built for the Future↗dev.to
Dev.to AI22일 전공공지능 분석AI 모델
16
OpenAI, Anthropic의 Mythos 공개 후 사이버 보안 모델 접근 확대
OpenAI가 Anthropic의 'Mythos' 공개에 대응하여 사이버 보안 특화 모델인 GPT-5.4-Cyber의 접근 권한을 확대했습니다. 이는 보안 방어용 도구로서의 가치를 높이는 동시에, 공격용으로 악용될 수 있는 이중 용도(Dual-use)에 대한 우려를 동시에 낳고 있습니다.
OpenAI Widens Access to Cybersecurity Model After Anthropic’s Mythos Reveal↗dev.to
Dev.to AI22일 전공공지능 분석AI 모델
17
시맨틱 캐싱으로 LLM 토큰 비용 절감하는 방법: 프로덕션 환경 구축 가이드
LLM API 호출 시 발생하는 토큰 비용을 획기적으로 줄이기 위해, 유사한 질문에 대해 캐시된 응rypt를 반환하는 '시맨틱 캐싱(Semantic Caching)' 구축 방법을 소개합니다. Bifrost 게이트웨이와 Weaviate 벡터 데이터베이스를 활용하여, 의미적으로 유사한 요청에 대해 LLM 호출 없이 즉각적인 응답을 제공함으로써 비용과 지연 시간을 동시에 절감할 수 있습니다.
How to Cut LLM Token Spend with Semantic Caching: A Production Setup Guide↗dev.to
Dev.to AI22일 전공공지능 분석AI 모델
18
무료 LLM API
14개 이상의 AI 제공업체의 무료 티어 키를 통합하여 OpenAI 호환 프록시를 제공하는 'Free LLM API'가 출시되었습니다. 월 최대 10억 토큰을 무료로 사용할 수 있으며, 개인적인 실험 및 테스트를 목적으로 설계되었습니다.
Free LLM API↗producthunt.com
Product Hunt22일 전공공지능 분석AI 모델
19
Anthropic의 Mythos 롤아웃, 미국의 사이버 보안 기관을 놓쳤다
Anthropic의 새로운 사이버 보안 AI 모델인 'Mythos Preview'가 미 상무부와 NSA 등 주요 기관에 도입되고 있으나, 미국의 핵심 사이버 보안 조정 기구인 CISA는 접근 권한에서 제외되었습니다. 이는 트럼프 행정부의 CISA 예산 감축 및 인력 재배치와 맞물려 미국의 국가적 디지털 보안 역량에 공백을 초래할 수 있다는 우려를 낳고 있습니다.
Anthropic’s Mythos rollout has missed America’s cybersecurity agency↗theverge.com
The Verge22일 전공공지능 분석AI 모델
20
MiMo-V2.5 & Pro
샤오미가 추론 능력을 극대화한 오픈소스 LLM 시리즈 'MiMo-V2.5 & Pro'를 출시했습니다. Apache 2.0 라이선스로 공개된 이 모델은 7B 규모에서도 수학 및 코딩 분야에서 OpenAI의 o1-mini와 대등한 성능을 보여주며, 높은 토큰 효율성을 바탕으로 한 에이전트 기능을 제공합니다.
Product Hunt↗producthunt.com
Product Hunt22일 전공공지능 분석AI 모델
21
Gmail 업무용 메일에 AI 개요 기능 도입
구글이 Google Cloud Next에서 Gmail에 'AI Over동 Overviews' 기능을 도입한다고 발표했습니다. 이 기능은 사용자가 자연어로 질문하면 여러 이메일 내용을 분석하여 핵심 정보를 요약해 제공함으로써, 일일이 메일을 열어보지 않고도 필요한 답변을 즉시 얻을 수 있게 돕습니다.
AI Overviews are coming to your Gmail at work↗techcrunch.com
TechCrunch22일 전공공지능 분석AI 모델
22
옥토스코프: AI 모델 성능 분석을 위한 새로운 도구
Octoscope는 GitHub 프로필, 활동, 레포지토리 상태 및 네트워크를 실시간으로 시각화해주는 터미널 기반 대시보드입니다. GraphQL API를 활용해 60초마다 데이터를 자동 갱신하며, 개발자에게 친숙한 CLI 환경에서 GitHub 데이터를 한눈에 파악할 수 있게 돕습니다.
octoscope↗producthunt.com
Product Hunt22일 전공공지능 분석AI 모델
23
IFTTT MCP: AI, API, GPU 활용한 맞춤형 자동화 플랫폼
IFTTT가 Anthropic의 MCP(Model Context Protocol)를 활용하여 Claude AI와 1,000개 이상의 앱 및 기기를 즉시 연결하는 새로운 자동화 플랫폼을 출시했습니다. 이제 사용자는 복잡한 설정 없이 채팅만으로 Slack 메시지 전송, 스마트 조명 제어 등 다양한 워크플로우를 실행할 수 있습니다.
IFTTT MCP↗producthunt.com
Product Hunt22일 전공공지능 분석AI 모델