AI 모델 (LLM·GPT·Claude·Gemini)
GPT, Claude, Gemini, Llama 등 AI 모델(LLM) 출시·벤치마크·API 변경사항을 모읍니다.
AI 모델 관련 글 — 20 페이지
- 3
45개 도메인에서 RAG, GraphRAG, 사전 구조화된 지식 그래프를 비교 분석해본 결과 – 무슨 일이 벌어졌을까
이 기사는 RAG, GraphRAG, 그리고 CKG(Compact Knowledge Graph)의 성능을 45개 도메인에서 비교 분석하여, CKG가 기존 RAG 대비 정확도는 4배 높고 토큰 사용량은 11배 적다는 놀라운 결과를 보여줍니다. 특히 복잡한 의존 관계를 묻는 멀티홉(multi-hop) 쿼리에서 CKG는 구조적 이점을 통해 압도적인 성능과 비용 효율성을 증명했습니다.
I benchmarked RAG vs GraphRAG vs pre-structured knowledge graphs across 45 domains — here's what happened↗dev.to
- 16
Show HN: Mdlens – 마크다운 중심 저장소에서 토큰 사용량 감소 및 검색 성능 향상
Mdlens는 AI 에이전트가 마크다운(Markdown) 문서를 검색할 때 토큰 사용량을 줄이고 정확도를 높여주는 CLI 도구입니다. 기존의 비효율적인 파일 읽기 방식 대신, 필요한 정보만 정밀하게 추출한 '증거 팩(evidence pack)'을 제공하여 에이전트의 운영 비용을 획기적으로 절감합니다.
Show HN: Mdlens – Reduce token spend and boost retrieval on Markdown-heavy repos↗github.com
- 18
Claude Desktop, 써드파티 API 지원 시작 — 설정 방법은 다음과 같습니다
Anthropic의 Claude Desktop에 'Developer Mode'가 도입되어, 사용자가 월정액 구독 대신 개인 API 키나 서드파티 API 게이트웨이를 통해 Claude를 사용할 수 있게 되었습니다. 이를 통해 사용자는 토큰 단위 결제로 비용을 최적화하고, 하나의 엔드포인트로 Claude, GPT, Gemini 등 다양한 모델을 통합 관리할 수 있는 유연성을 얻게 됩니다.
Claude Desktop Now Supports Third-Party APIs — Here's How to Set It Up↗dev.to
- 21
파생 AI 모델 게시 시 라이선스 위반을 피하는 방법
AI 모델을 파인튜닝, 병합(Merge) 또는 Abliteration(거부 메커니즘 제거)하여 새로운 모델을 배포할 때, 원본 모델의 라이선스 의무 사항을 반드시 준수해야 한다는 경고를 담고 있습니다. 개발자들이 모델 가중치를 단순한 '데이터'로 오인하여 출처 표기나 라이선스 계승 의무를 놓치는 실수를 방지하기 위한 구체적인 체크리스트를 제시합니다.
How to Avoid License Violations When Publishing Derivative AI Models↗dev.to


















