AI 모델 (LLM·GPT·Claude·Gemini)

GPT, Claude, Gemini, Llama 등 AI 모델(LLM) 출시·벤치마크·API 변경사항을 모읍니다.

AI 모델 관련 글 — 38 페이지

0
웨이포인트-1.5
Overworld가 일반 소비자용 GPU에서도 실행 가능한 실시간 생성형 월드 모델인 'Waypoint-1.5'를 출시했습니다. 이번 업데이트는 시각적 품질을 개선하고 하드웨어 지원을 확대하여, 단순히 보는 것을 넘어 사용자가 직접 탐험하고 플레이할 수 있는 상호작용형 가상 세계 구현을 목표로 합니다.
Waypoint-1.5↗producthunt.com
Product Hunt1개월 전공공지능 분석AI 모델
1
대규모 Entity Resolution: Amazon, Reddit, RTINGS 간의 제품 매칭
Amazon, Reddit 등 서로 다른 플랫폼의 불일치하는 제품명을 동일한 제품으로 식별하는 '엔티티 해상도(Entity Resolution)' 문제를 해결하기 위한 3단계 계층적 접근법을 소개합니다. 복잡한 ML 모델을 구축하는 대신 정규화, 퍼지 매칭, 외부 교차 검증을 조합하여 비용 효율적으로 문제를 해결한 사례를 다룹니다.
Entity Resolution at Scale: Matching Products Across Amazon, Reddit, and RTINGS↗dev.to
Dev.to AI1개월 전공공지능 분석AI 모델
2
AI 주간 리포트: 2026/4/1–4/10 Anthropic의 3연속 충격——Mythos 너무 위험해 공개 불가, 매출 OpenAI 추월, 소프트웨어주 급락
이번 주 한 줄 요약: 지난주의 유출이 이번 주의 현실이 되었습니다. 그리고 그 현실은 루머보다 훨씬 더 충격적입니다. 이번 주의 두 주인공: Anthropic이 이번 주의 기술적 경계(Mythos가 너무 강력하여 공개하기 어려울 정도)를 정의했다면, OpenAI는 이번 주의 자본적 한계치($122 billion 규모의 단일 라운드 펀딩)를 정의했습니다. 이 두 흐름이 동시에 진행되면서, 2026년의 AI 경쟁은 '누구의 모델이 더 강력한가'에서 '누가 Governance, Trust, Capital이라는 세 가지 전선에서 동시에 앞서나갈 수 있는가'로 완전히 전환되었습니다. 1. 가장 중요한 사건: Anthropic의 3중 충격 후속보 지난주 우리는 Anthropic의 세 가지 충격적인 소식을 전했습니다: IPO 계획 노출, Mythos 모델의 예기치 못한 유출, 그리고 Claude Code 소스 코드 유출입니다. 이번 주, 이 세 가지 모두 후속 상황이 드러났으며, 그 충격은 유출 당시보다 더욱 강력했습니다. 1. Mythos의 공식 등장, 그러나 공개 배포는 거부됨 (4/7) Anthropic은 Project Glasswing을 통해 Mythos Preview를 공식 발표했습니다. 하지만 이는 평범한 모델 발표가 아니었습니다. AI 산업 역사상 처음으로, 한 기업이 자사의 가장 강력한 모델을 공개적으로 배포하는 것을 스스로 거부한 사례입니다. 그 이유는 불안감을 자아냅니다. Mythos가 테스트 과정에서 이전에 알려지지 않았던 수천 개의 Zero-day vulnerability를 자율적으로 발견했으며, 이는 모든 주요...
AI 週報：2026/4/1–4/10 Anthropic 三震續集——Mythos 太危險不敢放、營收超車 OpenAI、軟體股應聲重挫↗dev.to
Dev.to AI1개월 전공공지능 분석AI 모델
3
FAQ Schema가 AI Citations를 2.7배 늘려줍니다. 하지만 당신이 생각하는 이유 때문은 아닙니다.
2025년 Relixir의 연구에 따르면, FAQPage schema가 적용된 페이지의 AI citation rate는 41%로, 적용되지 않은 페이지의 15%에 비해 약 2.7배 더 높았습니다. 이는 실제 연구를 통해 얻은 수치입니다. 하지만 여기서 주목할 점이 있습니다. AI models는 JSON-LD를 structured data로 파싱하지 않습니다. 대신 일반 문단을 읽는 것과 동일하게 이를 raw text로 tokenize합니다. 저희는 최근 사이트 내 36개 페이지에 FAQ schema를 추가했습니다. 적용하기 전, 저희는 이 현상이 왜 발생하는지 그 원인을 이해하고자 했습니다. 상관관계보다 중요한 것은 작동 메커니즘이기 때문입니다. 그 결과는 다음과 같습니다.
FAQ Schema Gets You 2.7x More AI Citations. But Not for the Reason You Think.↗dev.to
Dev.to WebDev1개월 전공공지능 분석AI 모델
4
당신의 웹사이트는 존재합니다. AI는 그 사실을 모릅니다.
누군가 방금 ChatGPT에게 당신의 업계에 대한 추천을 요청했습니다. 답변에는 경쟁사가 포함되어 있었지만, 당신은 없었습니다. 그들이 더 뛰어나서가 아닙니다. AI가 그들이 무엇을 하는지는 알고 있었지만, 당신이 무엇을 하는지는 몰랐기 때문입니다. 그 격차는 매일 벌어지고 있습니다. 그리고 해결 방법은 매우 간단합니다. 아무도 이야기하지 않는 문제 Google은 당신의 site를 crawl합니다. HTML을 읽고, link를 따라가며, page를 index합니다. 이 system은 25년이나 되었지만 여전히 잘 작동합니다. AI assistants는 그렇게 하지 않습니다. Perplexity, ChatGPT가,
Your Website Exists. AI Doesn't Know That.↗dev.to
Dev.to WebDev1개월 전공공지능 분석AI 모델
5
ChatGPT 개인화하기
OpenAI가 ChatGPT의 'Custom Instructions'와 'Memory' 기능을 통해 사용자 맞춤형 응답을 제공하는 개인화 방법을 공개했습니다. 이를 통해 사용자는 매번 동일한 지침을 반복할 필요 없이, 자신의 선호도와 과거 맥락이 반영된 일관되고 정교한 AI 경험을 누릴 수 있습니다.
Personalizing ChatGPT↗openai.com
OpenAI Blog1개월 전공공지능 분석AI 모델
6
ChatGPT를 활용한 연구
OpenAI가 ChatGPT에 실시간 웹 검색과 '딥 리서치(Deep Research)' 기능을 도입하여, 단순한 질의응답을 넘어 심층적인 정보 탐색 및 구조화된 인사이트 도출이 가능해졌습니다. 사용자는 최신 정보를 검색하고 여러 소스를 분석하여 체계적인 보고서를 생성할 수 있습니다.
Research with ChatGPT↗openai.com
OpenAI Blog1개월 전공공지능 분석AI 모델
7
사용자 정의 GPT 활용하기
OpenAI가 사용자가 특정 목적에 맞춰 직접 설계할 수 있는 'Custom GPTs' 기능을 소개하며, 이를 통해 워크플로우 자동화와 일관된 결과물 생성이 가능함을 알립니다. 누구나 코딩 없이도 자신만의 AI 어시스턴트를 구축할 수 있는 시대를 예고합니다.
Using custom GPTs↗openai.com
OpenAI Blog1개월 전공공지능 분석AI 모델
8
ChatGPT를 활용한 연구
OpenAI가 ChatGPT를 단순한 대화형 AI를 넘어, 정보 수집부터 분석, 인용 기반의 구조화된 인사이트 도출까지 가능한 전문 리서치 도구로 활용하는 가이드를 공개했습니다. 이를 통해 사용자는 출처가 명확하고 신뢰할 수 있는 연구 결과물을 생성할 수 있습니다.
ChatGPT for research↗openai.com
OpenAI Blog1개월 전공공지능 분석AI 모델
9
OpenAI의 AI 활용 사례
OpenAI가 ChatGPT, Codex, API 등 자사의 핵심 제품들을 통해 AI 기술을 실제 업무, 개발, 일상생활에 어떻게 적용하고 있는지 설명합니다. 단순한 모델 연구를 넘어, 실질적인 가치를 창출하는 서비스 생태계 구축에 집중하고 있음을 보여줍니다.
Applications of AI at OpenAI↗openai.com
OpenAI Blog1개월 전공공지능 분석AI 모델
10
ChatGPT 사용 시작하기
OpenAI가 공개한 이 가이드는 ChatGPT를 처음 접하는 사용자를 위해 대화 시작 방법부터 글쓰기, 브레인스토밍, 문제 해결 등 AI를 활용한 다양한 생산성 향상 방법을 안내합니다.
Getting started with ChatGPT↗openai.com
OpenAI Blog1개월 전공공지능 분석AI 모델
11
기술 활용하기
OpenAI가 ChatGPT 내에서 재사용 가능한 워크플로우를 구축하고 반복적인 작업을 자동화할 수 있는 'Skills' 기능을 소개했습니다. 이를 통해 사용자는 단순한 질의응답을 넘어, 일관된 고품질의 결과물을 생성하는 자동화된 프로세스를 구현할 수 있습니다.
Using skills↗openai.com
OpenAI Blog1개월 전공공지능 분석AI 모델
12
ChatGPT에서 파일 작업하기
ChatGPT가 PDF, 엑셀, CSV 등 다양한 파일을 직접 업로드하여 분석할 수 있는 기능을 도입했습니다. 이를 통해 사용자는 복잡한 데이터 분석, 긴 문서 요약, 파일 기반의 콘텐츠 생성 등 고도화된 업무 자동화를 수행할 수 있습니다.
Working with files in ChatGPT↗openai.com
OpenAI Blog1개월 전공공지능 분석AI 모델
13
LLM 제공업체가 프로덕션 도중 유스케이스 사용을 금지할 때 벌어지는 일
40,000개의 tool이 production에서 운영 중이던 OpenClaw가 Claude로부터 차단되었습니다. 사전 경고도, 유예 기간도 없이, 단지 policy enforcement만으로 그들의 전체 inference pipeline이 중단되었습니다. 유사한 시스템을 운영하는 사람들이 느끼는, 예상 가능한 schadenfreude와 공포가 뒤섞여 Hacker News 스레드가 들썩이는 것을 지켜보았습니다. 이것은 edge case가 아닙니다. Anthropic, OpenAI, 그리고 모든 LLM provider는 약관을 변경하거나, capacity를 throttle하거나, 혹은 use case를 완전히 차단할 권리를 보유하고 있습니다. production traffic을 처리할 때는,
What Happens When Your LLM Provider Bans Your Use Case Mid-Production↗dev.to
Dev.to DevOps1개월 전공공지능 분석AI 모델
14
Avec: AI 모델을 위한 새로운 API 출시, GPU 가속 기능 탑재
Avec는 Gmail 인박스 관리를 자동화하여 업무 효율을 극대화하는 AI 기반 이메일 클라이언트입니다. 스마트 필터링, 음성 메모의 이메일 변환, 간편한 구독 해지 기능을 통해 사용자가 이메일 처리에 소요되는 시간을 획기적으로 단축해 줍니다.
Avec↗producthunt.com
Product Hunt1개월 전공공지능 분석AI 모델
15
ChatGPT 드디어 월 100달러 Pro 플랜 출시
OpenAI는 목요일, power users들이 요청해 온 월 100달러 요금제를 발표했습니다. 이전에는 구독료가 월 20달러에서 200달러로 급격히 뛰었습니다.
ChatGPT finally offers $100/month Pro plan↗techcrunch.com
TechCrunch1개월 전공공지능 분석AI 모델
16
소파 위의 AI: Anthropic, Claude에게 20시간의 정신과 상담 실시
Mythos는 "우리가 지금까지 학습시킨 모델 중 심리적으로 가장 안정된 모델"입니다.
AI on the couch: Anthropic gives Claude 20 hours of psychiatry↗arstechnica.com
Ars Technica1개월 전공공지능 분석AI 모델
17
OpenAI, 새로운 모델 GPT-2 출시하기에는 너무 위험하다고 밝혀 (2019)
2019년 OpenAI가 GPT-2 모델의 강력한 텍스트 생성 능력으로 인해 발생할 수 있는 오남용 위험을 우려하여, 모델의 전체 알고리즘과 데이터셋 공개를 유보했던 사건을 다룹니다. 이는 AI 기술의 혁신과 사회적 안전성 사이의 전례 없는 갈등을 보여주는 상징적인 사례입니다.
OpenAI says its new model GPT-2 is too dangerous to release (2019)↗slate.com
Hacker News Best1개월 전공공지능 분석AI 모델
18
Show HN: 초기 창업자를 위한 LLM-Wiki
Claude Code를 활용해 초기 창업자의 영업(GTM) 프로세스를 자동화하는 'GTM Engine'에 대한 소개입니다. 터미널 기반의 슬래시 명령어를 통해 리드 스코어링, 콜 분석, 콜드 이메일 작성 등 복잡한 영업 운영을 수행하는 '영업 운영체제(OS)'를 지연합니다.
Show HN: LLM-Wiki but for Early Founders↗github.com
Hacker News Show1개월 전공공지능 분석AI 모델
19
Show HN: BrokenClaw 5부: GPT-5.4 에디션 (Prompt Injection)
GPT-5.4 모델을 사용하는 AI 에이전트(OpenClaw)에서 프롬프트 인젝션을 통해 원격 코드 실행(RCE)이 가능함을 증명한 보안 취약점 분석 보고서입니다. 공격자가 웹 페이지나 이메일 내에 인코딩된 악성 명령어를 숨겨두면, 에이전트가 이를 스스로 해석하고 실행하여 시스템 권한을 탈취할 수 있음을 보여줍니다.
Show HN: BrokenClaw Part 5: GPT-5.4 Edition (Prompt Injection)↗veganmosfet.codeberg.page
Hacker News Show1개월 전공공지능 분석AI 모델
20
모든 것의 미래는 거짓인 것 같다: 파트 3 – 문화
LLM은 단순한 기술적 도구를 넘어 문화를 형성하고 재구성하는 '문화적 유물'입니다. 현재 인류는 LLM의 비논리적이고 예측 불가능한 특성을 설명할 적절한 문화적 서사가 부족하며, 향후 미디어는 정적인 텍스트 중심에서 LLM을 통해 생성되는 인터랙티브한 형태로 진화할 것입니다.
The Future of Everything Is Lies, I Guess: Part 3 – Culture↗aphyr.com
Hacker News1개월 전공공지능 분석AI 모델
21
실제 워크플로우에서의 GPT-5.4와 Claude Sonnet 4.6 비교 선택
벤치마크 점수보다 실제 워크플로우에서의 모델별 특화된 활용이 중요함을 강조합니다. GPT-5.4는 시스템 및 자동화에, Claude Sonnet 4.6은 코드 리팩토링 및 가독성 개선에 강점이 있으며, 두 모델을 결합한 하이브리드 전략이 비용과 품질 면에서 최적의 결과를 제공합니다.
Choosing Between GPT-5.4 and Claude Sonnet 4.6 in Real Workflows↗dev.to
Dev.to AI1개월 전공공지능 분석AI 모델
22
734표가 측정하는 것: 인프라로서 Behavioral Telemetry의 필요성
Claude Code의 성능 저하를 정량적 데이터로 입증한 사례를 통해, AI 모델의 '보이지 않는 변화'가 초래하는 경제적 손실과 이를 감시할 'Behavioral Telemetry(행동 원격 측정)' 인프라의 필요성을 분석합니다.
What 734 Votes Measures: The Case for Behavioral Telemetry as Infrastructure↗dev.to
Dev.to AI1개월 전공공지능 분석AI 모델
23
소비자용 GenAI 앱의 사용자별 credits 및 usage limits 관리 방식은?
GenAI 소비자용 앱 개발자가 직면한 사용자별 크레딧 및 사용량 제한(Usage Limits) 관리의 기술적 난제를 다룹니다. 기존의 API 라우팅이나 관측성 솔루션이 해결해주지 못하는 '구독 모델과 연동된 사용자별 크레딧 제어'를 어떻게 효율적으로 구현할 것인가에 대한 실무적 고민을 담고 있습니다.
How are consumer GenAI apps handling per-user credits and usage limits?↗dev.to
Dev.to AI1개월 전공공지능 분석AI 모델