AI 모델 (LLM·GPT·Claude·Gemini)

GPT, Claude, Gemini, Llama 등 AI 모델(LLM) 출시·벤치마크·API 변경사항을 모읍니다.

AI 모델 관련 글 — 18 페이지

0
증명 없이 FHE를 사용하는 것은 위험 부담
완전동형암호(FHE)는 암호화된 상태로 연산을 가능하게 하지만, 어떤 연산이 수행되었는지 증명할 수 없다는 보안 허점이 있습니다. H33은 모든 연산에 대해 74바이트 규모의 양자 내성(PQ) 증명을 제공하여, 연산의 무결성을 독립적으로 검증할 수 있는 솔루션을 제시합니다.
Why FHE Without Attestation Is a Liability↗dev.to
Dev.to WebDev15일 전공공지능 분석AI 모델
1
새로운 AI 모델, 성능과 효율성 모두 잡다
Liminary는 사용자가 저장한 모든 정보를 AI의 '작업 메모리'로 변환하여, 회의, 연구, 글쓰기 전반에 걸쳐 통합된 지식 맥락을 제공하는 생산성 도구입니다. 단순한 챗봇을 넘어 파편화된 지식을 연결함으로써, 사용자가 별도의 시작점 없이도 출처가 명확한 결과물을 생성할 수 있도록 돕습니다.
Liminary↗producthunt.com
Product Hunt15일 전공공지능 분석AI 모델
2
istempmail.com을 만들었습니다.
isttempmail.com은 웹사이트 운영자가 일회용(disposable) 이메일 주소를 실시간으로 감지하고 차단할 수 있도록 돕는 보안 도구입니다. API와 워드프레스 플러그인을 제공하여 SaaS 및 마켓플레이스 플랫폼의 가짜 계정 생성과 스팸 어뷰징을 방지합니다.
I built istempmail.com↗dev.to
Dev.to WebDev15일 전공공지능 분석AI 모델
3
Lemonade v10.3: 자체 GPU에서 로컬 LLM, 이미지 생성, 음성 처리 무료 실행
오픈소스 로컬 AI 서버인 Lemonade가 v10.3으로 업데이트되었습니다. 이번 업데이트는 Tauri 전환을 통한 앱 경량화, 멀티모달 처리를 위한 OmniRouter 도입, AMD ROCm 7 지원을 핵심으로 하며, 클라우드 API 비용 절감과 데이터 보안을 위한 강력한 대안을 제시합니다.
Lemonade v10.3: Run Local LLMs, Image Gen, and Speech on Your Own GPU for Free↗dev.to
Dev.to OpenSource15일 전공공지능 분석AI 모델
4
라구나 XS.2 오픈 모델, 2024년 심층 분석: 엔지니어들을 위한 가이드
제공된 기사 내용이 기술적 오류(Liquid syntax error)로 인해 유효한 정보를 포함하고 있지 않아 분석이 불가능합니다. 원문 데이터의 손상으로 인해 '라구나 XS.2' 모델에 대한 어떠한 기술적 분석도 수행할 수 없습니다.
Laguna XS.2 Open Model in 2024: A Deep Dive for Engineers↗dev.to
Dev.to OpenSource15일 전공공지능 분석AI 모델
5
Voice Agent API
AssemblyAI가 실시간 음성 에이전트 구축을 위한 'Voice Agent API'를 출시했습니다. 개발자는 복잡한 인프라 구축 없이 오디오 입력만으로 1초 미만의 지연 시간을 가진 고성능 음성 AI 서비스를 구현할 수 있습니다.
Product Hunt↗producthunt.com
Product Hunt15일 전공공지능 분석AI 모델
6
크린 AI
Crin AI는 텍스트가 토큰과 벡터로 변환되는 과정을 애니메이션 노드 그래프로 시각화하여 보여주는 혁신적인 AI 학습 플랫폼입니다. 기존의 수동적인 영상 강의에서 벗어나, 데이터의 변화 과정을 실시간으로 목격하며 학습할 수 있는 개발자 중심의 인터랙티브 경험을 제공합니다.
Crin AI↗producthunt.com
Product Hunt15일 전공공지능 분석AI 모델
7
Google TV에 더 많은 Gemini 기능이 추가될 예정
구글이 Google TV에 생성형 AI인 Gemini 기능을 대폭 강화하고, 유튜브 쇼츠(YouTube Shorts) 전용 피드를 도입하여 거실 경험을 혁신합니다. 이미지 생성 모델 'Nano Banana'와 비디오 생성 모델 'Veont'를 통해 사용자가 음성만으로 사진을 편집하거나 영상을 제작할 수 있는 인터랙티브한 환경을 구축하는 것이 핵심입니다.
More Gemini features are coming to Google TV↗techcrunch.com
TechCrunch15일 전공공지능 분석AI 모델
8
RAG vs Fine-Tuning: 실제로 어느 쪽을 사용해야 할까?
LLM 애플리케이션 구축 시 직면하는 핵심 난제인 RAG와 파인튜닝의 차이점과 선택 기준을 명확히 제시합니다. 데이터의 업데이트 주기, 출처 인식 필요성, 출력 형식의 정밀도에 따라 최적의 아키텍처를 결정하는 실무적인 프레임워크를 제공합니다.
RAG vs Fine-Tuning: Which One Should You Actually Use?↗dev.to
Dev.to WebDev15일 전공공지능 분석AI 모델
9
AI가 자료를 선택할 때: 구조화된 레코드가 인용 정확도를 높이는 이유
AI 시스템이 정보를 재구성하는 과정에서 출처와 내용 사이의 연결 고리가 약해져 잘못된 인용(Misattribution)이 발생하고 있습니다. 이를 해결하기 위해 단순한 추론이 아닌, 기계가 즉각적으로 인식할 수 있는 구조화된 데이터 레이어인 'AI Citation Registry'의 도입이 필요합니다.
When AI Selects Sources: Why Structured Records Increase Citation Accuracy↗dev.to
Dev.to AI15일 전공공지능 분석AI 모델
10
Cohere, 5.42 WER 음성 모델 오픈소스 공개 - 실제 오디오 테스트 결과 확인
Cohere가 Whisper-large-v3보다 높은 정확도와 빠른 속도를 자랑하는 새로운 오픈소스 음성 인식(ASR) 모델 'Cohere Transcribe'를 공개했습니다. 깨끗한 오디오와 실시간 스트리밍 환경에서는 우위를 점하지만, 다국어 혼용(Code-switched)이나 저음질 전화 통화 환경에서는 여전히 Whisper가 강점을 보입니다.
Cohere just open-sourced a 5.42 WER speech model - here's what testing it on real audio showed↗dev.to
Dev.to OpenSource15일 전공공지능 분석AI 모델
11
DeepSeek-V4 공개, 드디어 1M 컨텍스트를 모두에게 제공합니다
DeepSeek-V4가 100만(1M) 토큰의 초장문 컨텍스트 윈도우를 오픈 소스로 공개했습니다. 고성능의 Pro 모델과 비용 효율적인 Flash 모델로 이원화하여, 누구나 저렴한 비용으로 방대한 데이터를 처리할 수 있는 시대를 열었습니다.
DeepSeek-V4 is Here, and Yes — 1M Context Is Finally for Everyone↗dev.to
Dev.to OpenSource15일 전공공지능 분석AI 모델
12
Claude, 창의적인 작업에 활용하다
Anthropic이 Adobe, Blender, Autodesk 등 주요 크리에이티브 소프트웨어와 직접 연동되는 'Claude 커넥터'를 발표했습니다. 이를 통해 Claude는 단순한 텍텐츠 생성을 넘어, 전문적인 디자인, 3D 모델링, 오디오 편집 워크플로우 내에서 실질적인 작업을 수행하고 자동화하는 '에이전트'로 진화합니다.
Claude for Creative Work↗anthropic.com
Hacker News15일 전공공지능 분석AI 모델
13
오푸스를 활용하여 LLM 비용을 절감했습니다
대규모 CI 로그 분석 시 발생하는 막대한 LLM 비용 문제를 해결하기 위해, 저렴한 모델(Haiku)이 1차 분류를 담당하고 고성능 모델(Opus)이 복잡한 문제만 해결하는 'Triager' 멀티 에이전트 아키텍처를 도입했습니다. 데이터를 프롬프트에 직접 넣는 대신 에이전트가 SQL을 통해 필요한 데이터만 조회하는 'Pull' 방식을 채택하여 비용 효율성과 분석 정확도를 동시에 높였습니다.
We decreased our LLM costs with Opus↗mendral.com
Hacker News15일 전공공지능 분석AI 모델
14
ChatGPT가 광고를 어떻게 제공하는가
OpenAI가 ChatGPT 내에 구현한 광고 시스템의 기술적 메커니즘을 분석한 내용입니다. ChatGPT는 SSE(Server-Sent Events)를 통해 대화 흐름에 광고 유닛을 직접 주입하며, OAIQ라는 전용 SDK와 Fernet 암호화 토큰을 사용하여 사용자의 클릭부터 광고주 사이트에서의 전환까지 정밀하게 추적하는 폐쇄형 루프(Closed-loop) 광고 생태계를 구축하고 있습니다.
How ChatGPT serves ads↗buchodi.com
Hacker News15일 전공공지능 분석AI 모델
15
Claude 시스템 프롬프트 버그로 사용자 자금 낭비 및 관리 에이전트 손상 발생
Anthropic의 Claude Code CLI에서 시스템 프롬프트 주입 버거로 인해, 정상적인 코드 수정 요청을 AI 에이전트가 거부하는 현상이 발생하고 있습니다. 이 버그는 악성코드 방지 문구를 모든 파일 읽기 작업에 강제 적용함으로써, 멀티 에이전트 워크플로우의 신뢰성을 무너뜨리고 불필요한 토큰 비용을 발생시키고 있습니다.
Claude system prompt bug wastes user money and bricks managed agents↗github.com
Hacker News15일 전공공지능 분석AI 모델
16
프리스마, 570개의 모델에서 멈췄다. 나는 제너레이터를 500ms 안에 재구축했다.
Prisma가 대규모 스키마(570개 이상의 모델)에서 V8 엔진의 문자열 길이 제한으로 인해 작동을 멈추는 치명적인 한계를 발견하고, 이를 해결하기 위해 정규표현식을 활용한 초경량 커스텀 제너레이터를 구축한 사례를 다룹니다. 전체 클라이언트를 재생성하는 대신 변경된 부분만 패치하는 전략을 통해 생성 시간을 500ms 이내로 단축했습니다.
Prisma Broke at 570 Models. I Rebuilt Its Generator in 500ms.↗dev.to
Dev.to AI15일 전공공지능 분석AI 모델
17
하루에 하나씩 살펴보는 오픈 소스 프로젝트 (51번째): Microsoft의 VibeVoice - 한 번에 90분 분량의 오디오를 처리하는 음성 AI
마이크로소프트 리서치가 공개한 VibeVoice는 7.5Hz의 초저주파수 토크나이저를 통해 최대 90분의 오디오를 단일 모델 패스로 처리할 수 있는 혁신적인 음성 AI입니다. 기존 모델들의 한계였던 짧은 오디오 처리 길이를 극복하고, 긴 분량의 대화에서도 화자 일관성과 문맥을 완벽하게 유지합니다.
One Open Source Project a Day (No.51): VibeVoice - Microsoft's Speech AI That Processes 90 Minutes of Audio in a Single Pass↗dev.to
Dev.to OpenSource15일 전공공지능 분석AI 모델
18
Claude.ai 접속 불가 및 API 오류 증가
2026년 4월 28일, Anthropic의 Claude.ai 웹 서비스와 API, Claude Code 등 주요 서비스에서 약 80분간 접속 불가 및 인증 오류 장애가 발생했습니다. 현재는 문제가 해결되어 모든 서비스가 정상화된 상태입니다.
Claude.ai unavailable and elevated errors on the API↗status.claude.com
Hacker News16일 전공공지능 분석AI 모델
19
OpenAI 모델, Amazon Bedrock에 출시: OpenAI와 AWS CEO 인터뷰
OpenAI 모델이 Amazon Bedrock에 출시되며, Microsoft와 OpenAI의 기존 독점 계약이 수정되었습니다. 이를 통해 OpenAI는 Azure를 넘어 AWS 고객층까지 확장하며, AWS는 OpenAI 기반의 'Bedlam Managed Agents'를 통해 에이전트 중심의 AI 서비스를 강화합니다.
OpenAI models coming to Amazon Bedrock: Interview with OpenAI and AWS CEOs↗stratechery.com
Hacker News16일 전공공지능 분석AI 모델
20
딥 생성 모델로 DNA 설계하고 생성하다
딥 생성 모델(Generative Models)을 활용하여 특정 기능을 가진 DNA 서열을 설계하고 생성하는 기술적 진보를 다룹니다. 이는 기존의 생물학적 데이터를 분석하는 수준을 넘어, 원하는 생물학적 특성을 가진 DNA를 직접 설계하는 '설계 중심'의 바이오 시대를 예고합니다.
Generating and designing DNA with deep generative models↗dev.to
Dev.to AI16일 전공공지능 분석AI 모델
21
AI 연산에 월 5천 달러씩 지출했는데… GPU 선택을 중단했습니다
AI 모델 개발보다 GPU 인프라 관리(하드웨어 선택, 비용 최적화, 오류 대응)에 더 많은 리소스가 소모되는 문제를 해결하기 위해, 하드웨어 추상화 레이어인 'Jungle Grid'를 소개합니다. 사용자는 GPU를 직접 선택하는 대신 작업(workload)의 특성만 정의하면 시스템이 자동으로 최적의 인프라를 할당하여 비용과 운영 복잡성을 획기적으로 낮춥니다.
We were spending ~$5K/month on AI compute… so I stopped choosing GPUs↗dev.to
Dev.to DevOps16일 전공공지능 분석AI 모델
22
아마존, 새로운 OpenAI 제품을 AWS에서 이미 제공 중
Microsoft의 OpenAI 제품에 대한 독점권이 해제됨에 따라, AWS가 자사 AI 서비스인 Bedrock을 통해 OpenAI의 최신 모델, Codex, 그리고 새로운 AI 에이전트 서비스인 'Bedrock Managed Agents'를 즉시 도입했습니다. 이는 OpenAI와 AWS 간의 협력이 심화되고 클라우드 시장의 AI 주도권 경쟁이 격화되고 있음을 의미합니다.
Amazon is already offering new OpenAI products on AWS↗techcrunch.com
TechCrunch16일 전공공지능 분석AI 모델
23
호일
Tinfoil은 NVIDIA GPU의 하드웨어 보안 기능을 활용하여 대화 내용의 완전한 프라이버시를 보장하는 AI 채팅 및 API 서비스입니다. 클라우드 환경에서도 로컬 AI와 같은 수준의 보안을 제공하며, 데이터가 서비스 제공자에게조차 노출되지 않도록 설계되었습니다.
Tinfoil↗producthunt.com
Product Hunt16일 전공공지능 분석AI 모델