미라 무라티의 AI 회사, 요즘 무슨 일을 하고 있을까
(theverge.com)
OpenAI의 전 CTO 미라 무라티가 설립한 'Thinking Machines'가 실시간 멀티모달 협업을 가능하게 하는 '상호작용 모델(interaction models)'을 공개했습니다. 이 모델은 기존의 텍스트/음성 입력 대기 방식에서 벗어나, 오디오, 비디오, 텍스트를 실시간으로 연속 인지하며 인간과 끊김 없이 상호작용하는 것을 목표로 합니다.
이 글의 핵심 포인트
- 1Thinking Machines, 실시간 오디오·비디오·텍스트를 동시 처리하는 '상호작용 모델' 발표
- 2기존 AI의 '입력 완료 후 대기'하는 단방향 병목 현상 해결 목표
- 3실시간 번역, 사용자 자세 교정, 스토리 내 특정 요소 인지 등 멀티모달 사례 공개
- 4미라 무라티(전 OpenAI CTO)가 2025년 2월 설립한 신생 AI 기업의 핵심 기술
- 5올해 말 광범위한 출시를 목표로 하며, 수개월 내 제한적 연구 프리뷰 예정
이 글에 대한 공공지능 분석
왜 중요한가
배경과 맥락
업계 영향
한국 시장 시사점
이 글에 대한 큐레이터 의견
이번 발표는 AI의 가치가 '콘텐츠 생성(Generation)'에서 '실시간 상호작용(Interaction)'으로 이동하고 있음을 극명하게 보여줍니다. 미라 무라티의 Thinking Machines가 노리는 지점은 단순한 지능의 고도화가 아니라, AI가 인간의 물리적/디지털 맥락에 '상주'하며 실시간으로 반응하는 '앰비언트 인텔리전스(Ambient Intelligence)'의 구현입니다. 이는 AI 에이전트가 단순한 도구를 넘어, 인간의 행동을 교정하거나(예: 자세 교정) 실시간으로 통역하는 등 능동적인 파트너로 진화함을 의미합니다.
스타트업 창업자들에게는 양날의 검이 될 것입니다. 기회 측면에서는 실시간 멀티모달 데이터를 활용한 고도의 버티컬 서비스(예: 실시간 AI 코칭, 원격 의료 보조)를 구축할 수 있는 기술적 토대가 마련됩니다. 하지만 위협 측면에서는, 파운데이션 모델 제공자가 인터페이스의 핵심인 '상호작용 모델'을 직접 통제하게 될 경우, 기존의 텍스트 기반 AI 서비스들은 단순한 기능적 부품으로 전락할 위험이 큽니다. 따라서 창업자들은 모델의 인터페이스를 활용하는 것을 넘어, 그 모델이 실시간으로 인지할 수 있는 '특화된 데이터 스트림'과 '도메인 지식'을 어떻게 결합할 것인지에 대한 전략적 고민이 필요합니다.
관련 뉴스
댓글
아직 댓글이 없습니다. 첫 댓글을 남겨보세요.