오픈소스 뉴스
오픈소스 프로젝트의 새 릴리스, 라이선스 이슈, 커뮤니티 동향을 전합니다.
총 70건
오픈소스 핵심 글
- 4
바이브보이스: 오픈소스 기반 음성 AI의 새로운 지평
VibeVoice는 초저주파수(7.5Hz) 토크나이저와 차세대 확산(Diffusion) 기술을 결합하여, 60분 이상의 장문 음성 인식(ASR)과 90분 분량의 다중 화자 음성 합성(TTS)을 지원하는 오픈소스 음성 AI 프레임워크입니다. Hugging Face Transformers 라이브러리에 통합되어 개발자 접근성을 높였으며, 실시간 스트리밍 기능까지 갖춘 혁신적인 모델 시리즈입니다.
VibeVoice: Open-source frontier voice AI↗github.com
오픈소스 관련 전체 글
- 5
스텐노: 귀중한 대화를 위한 오픈소스 AI 기반 인텔리전스 레이어
스텐노(Steno)는 데이터 프라이버시를 최우선으로 하는 오픈소스 AI 기반 노트 서비스로, 클라우드 없이 로컬 환경에서 작동합니다. 최신 v0.3.0 업데이트를 통해 전체 노트 쿼리, 화자 분리된 전사 기능, 대화 기록 관리 기능을 제공하며, Granola와 같은 기존 서비스의 강력한 대안으로 주목받고 있습니다.
Steno: Opensource AI powered intelligence layer for your confidential conversations.↗dev.to
- 7
TSU 프로토콜: 실리콘 밸리와 월스트리트를 초대하여 오픈소스 AI 실리콘 후원하기 (1778204312)
TSU 프로토콜은 익명성과 DAO(탈중앙화 자율 조직)를 기반으로 운영되는 오픈소스 RISC-V NPU 표준 프로젝트입니다. 기존의 기업 중심 모델에서 벗어나, 커스텀 AI 명령어를 포함한 하드웨어 설계를 누구나 사용할 수 있는 로열티 프리 표준으로 구축하고 크립토 펀딩을 통해 실리콘 제작을 추진하고 있습니다.
TSU Protocol: Inviting Silicon Valley & Wall Street to Sponsor Open-Source AI Silicon (1778204312)↗dev.to
- 9
자체 LLM을 포기하고 Graviton4 인스턴스에서 오픈소스 Llama 3.2로 전환한 이유: 2026년 비용 및 지연 시간 데이터
Proprietary LLM(GPT-4 등)에서 AWS Graviton4 기반의 self-hosted Llama 3.2로 전환하여 월간 추론 비용을 약 68% 절감하고, p99 지연 시간을 1.8초에서 620ms로 대폭 개선한 사례를 다룹니다. 성능 저하는 1.2% 미만에 그치며 비용 효율성과 기술적 독립성을 동시에 확보했습니다.
Why We Ditched Proprietary LLMs for Open-Source Llama 3.2 on Graviton4 Instances: 2026 Cost and Latency Data↗dev.to
- 12
6만 7천 개의 오픈소스 AI 에이전트 프로젝트를 색인했습니다. 그 안에 무엇이 들어있는지 살펴보세요.
6만 7천 개의 오픈소스 AI 에이전트 프로젝트를 전수 조사한 결과, 에코시스템 내 극심한 양극화와 폭발적인 공급 증가가 확인되었습니다. 특히 상위 1%가 전체 스타(Star)의 83%를 독점하고 있으며, 프로젝트의 품질을 예측하는 핵심 지표로 '실패 기록(MISTUALS.md)'의 존재가 주목받고 있습니다.
I Indexed 67,000 Open-Source AI Agent Projects. Here's What's Actually Inside.↗dev.to
- 13
Cohere, 5.42 WER 음성 모델 오픈소스 공개 - 실제 오디오 테스트 결과 확인
Cohere가 Whisper-large-v3보다 높은 정확도와 빠른 속도를 자랑하는 새로운 오픈소스 음성 인식(ASR) 모델 'Cohere Transcribe'를 공개했습니다. 깨끗한 오디오와 실시간 스트리밍 환경에서는 우위를 점하지만, 다국어 혼용(Code-switched)이나 저음질 전화 통화 환경에서는 여전히 Whisper가 강점을 보입니다.
Cohere just open-sourced a 5.42 WER speech model - here's what testing it on real audio showed↗dev.to
- 14
하루에 하나씩 살펴보는 오픈소스 프로젝트 (50번째): TypeScript 마법사가 .claude 디렉토리를 GitHub에 업로드하며 전 세계 1위 달성
TypeScript 전문가 Matt Pocock이 자신의 Claude Code용 작업 지침(.claude 디렉토리)을 공개하여 GitHub 트렌딩 1위를 달성했습니다. 이는 단순한 코드 생성을 넘어, AI를 정교한 엔지니어링 프로세스(설계 검증, TDD 등)에 활용하는 '에이전트 스킬'의 중요성을 시사합니다.
One Open Source Project a Day (No.50): The TypeScript Wizard Pushed His .claude Directory to GitHub and Hit #1 Worldwide Overnight↗dev.to
- 15
20개의 유명한 오픈소스 프로젝트의 GitHub Actions 워크플로우 비용을 측정한 결과, 처참했습니다.
20개의 유명 오픈소스 프로젝트를 분석한 결과, 비효적한 GitHub Actions 설정으로 인해 월간 약 51,000달러(약 7,000만 원)의 불필요한 비용이 발생하고 있음이 드러났습니다. 타임아웃 미설정, 캐시 미사용, 동시성 제어 부재가 주요 원인으로 지목되었습니다.
I priced the GitHub Actions workflows of 20 famous OSS projects. The results were ugly.↗dev.to
- 16
Show HN: 제가 만든 오픈소스 에이전트, Gemini-3-flash-preview에서 TerminalBench 1위 달성
오픈소스 AI 코딩 에이전트 'Dirac'이 Gemini-3-flash-preview 모델을 사용하여 TerminalBench-2 리더보드에서 1위를 달성했습니다. Dirac은 정교한 컨텍스트 관리와 AST(추상 구문 트리) 조작 기술을 통해 기존 에이전트 대비 API 비용을 약 64.8% 절감하면서도 더 높은 정확도를 구현했습니다.
Show HN: OSS Agent I built topped the TerminalBench on Gemini-3-flash-preview↗github.com










