안녕하세요, AI OS 나이아(Naia)를 만들고 있는 루크입니다. 지난번 급하게 런칭 소식을 전하며 도움을 부탁드렸던 글에 이어, 이번에는 v0.1.5 업데이트와 함께 가장 중요한 소식 — AI OS뿐 아니라 새로운 AI 옴니 모델, 정확히는 Naia-Omni 모듈(naia-0.9-omni-24g) 공개 소식을 전해드립니다.

▎이번 v0.1.5의 Naia-OS에서 직접 만나보실 수 있는 것들
- 3D 아바타와의 실시간 음성 대화 (목소리 클로닝 포함) — 이번 버전의 주인공입니다.
- 임베디드 브라우저 — 화면 안에서 AI가 함께 보고 거들어 줍니다.
- 스킬 시스템 — 내장 스킬로 기능을 넓히고, MCP(Model Context Protocol) 도구를 연결합니다.
- 앱 패널 — Naia 안에 원하는 앱 패널을 더할 수 있습니다.
- 내 모델, 내 키 그대로 — 원하는 AI 공급자·키를 연결하거나 로컬 모델로 돌릴 수 있습니다.
- 프라이버시 — 로컬 실행이 기본이며, 입력·출력을 모델 학습에 쓰지 않습니다.
- 14개 언어 인터페이스 지원
Naia는 단순히 OS를 표방하는 쉘(Shell)에 그치지 않습니다. 이번 업데이트의 핵심은 소비자용 GPU(RTX 3090/4090/5090 등 24GB VRAM) 환경에서 30개 다국어와 함께 ChatGPT·Gemini급의 풀 듀플렉스 실시간 대화를 구현해 낸 naia-0.9-omni-24g 모듈입니다.
제 PC에 직접 설치한 Naia-Omni에 연결해 실제 음성으로 대화하는 영상입니다. (제 마이크 목소리는 영상에 녹음되지 않은 점 참고해 주세요.)
▎왜 'cascade' 모듈인가
예전에 MiniCPM-4.5-omni를 vLLM에 포팅 중이라고 말씀드린 적이 있는데, 바로 이 Naia에 이식하기 위함이었습니다. Omni 모델의 가장 큰 장점은 실시간으로 매우 자연스러운 대화가 가능하다는 점입니다. 다만 그 모델은 28GB 이상의 VRAM을 요구하는 데다 중국어와 영어만 지원한다는 한계가 있었습니다. 이를 한국어로 개선하고자 Talker 파인튜닝(FT) 등 여러 연구를 병행했지만 끝내 기술적 천장에 부딪혔고, 다른 Omni 모델들은 이보다 훨씬 무거웠습니다.
그렇게 대안을 모색한 끝에 만들어 낸 것이 단일 모델이 아닌 '캐스케이드(Cascade)' 방식의 naia-0.9-omni-24g입니다. 여러 AI 모델을 적절히 오케스트레이션하고 최적화한 모듈로, 완벽한 토큰 단위 처리까지는 아니지만 그에 준하는 속도와 훨씬 유연한 구성을 자랑합니다. 소비자용 24GB GPU에서 30개국 다국어, 풀 듀플렉스, 실시간 목소리 클로닝을 모두 지원하는, 사실상 유일한 대안입니다. 마치 하나의 독립된 모델처럼 API 수준으로 활용하실 수 있도록 안내하고 있으며, 훨씬 더 똑똑하고 또렷한 음성 복제 능력을 직접 경험해 보실 수 있습니다.
| 단일 omni 모델 | cascade (Naia 방식) | |
|---|---|---|
| 구성 | 하나로 통합된 모델 | 역할별 부품을 조립 |
| 능력 변경 | 한 번 훈련되면 고정 — 새 능력은 재학습 필요 | 언제든 부품 교체·추가 — 재학습 없이 개선 |
| 속도 | 통합되어 빠름(낮은 지연) | 단계가 있어 지연이 조금 더 생길 수 있음 |
| 멀티모달 확장 | 처음부터 다시 학습 | 입력·출력에 부품을 끼워 넣기 |
| 부품 선택 | 통째로 묶임 | 검증된 부품을 골라 사용·교체 |
| 모델 활용 | 한 모델에 고정 | 여러 모델을 함께 — 단계마다 최적 모델 |
이렇게 완성된 naia-0.9-omni-24g는 소비자용 PC 환경인 RTX 3090/4090/5090(24GB)에서 매끄럽게 구동됩니다.
⚙️ 이용 방식 및 특징
이번 업데이트의 이용 방식은 현실적인 인프라 상황을 고려해 다음과 같이 개편했습니다.
로컬 컨테이너 제공 (베이직 구독자 혜택) — 누구나 개인 PC에 컨테이너 형태로 내려받아 자신만의 애플리케이션을 직접 만들 수 있도록 개방했습니다.
podman pull ghcr.io/nextain/naia-0.9-omni-24g:latest
다만 저 역시 생계를 유지하며 이 오픈소스 프로젝트를 지속해야 하기에, 기본 구독(월 $10) 이용자분들께 1 Copy씩 이용 가능하도록 했습니다. Naia 오픈소스 생태계가 꾸준히 성장하는 데 필요한 최소한의 후원으로 생각해 주시면 감사하겠습니다. → Naia 모델 다운로드 및 활성화 매뉴얼
웹 데모 체험 (60초 맛보기) — 현재 제 개인 PC 1대에서 직접 구동해 60초씩 맛보기 체험을 제공하고 있습니다. 한정된 자원이라 접속 인원에 따라 대기열(Queue)이 생길 수 있는 점 너른 양해 부탁드립니다. → 라이브 데모
클라우드 이용 (준비 중) — 당초 기획했던 시간당 $0.33 모델은 아쉽게도 당분간 '준비 중'으로 전환합니다. 자본과 장비가 부족한 지금은 상시 대기하는 GPU 풀을 유지하기 어렵고, 할당 후 부팅에 드는 약 15분간의 서버 비용을 무상으로 감당하기 벅찬 실정입니다. 국내에서 쓸 수 있는 원격 RTX 3090 기반 시스템도 이미 개발해 두었으나 GPU 품귀로 원활한 서비스가 어렵다고 판단했습니다. 훗날 자본이 충당되면 대기 시간 없는 쾌적한 클라우드 서비스를 꼭 선보이겠습니다.높은 호환성 — OpenAI Realtime API를 지원해 기존 환경과의 호환성을 극대화했습니다.
| 엔드포인트 | 용도 |
|---|---|
GET /health | 준비 상태 {"ready":true} (인증 불필요) |
GET /v1/models | 모델 목록 |
WS /v1/realtime | 실시간 음성 세션 (VAD·끼어들기·감정) |
POST /v1/chat/completions | 챗 (스트리밍 지원) |
POST /v1/audio/speech | 음성 합성(TTS) |
POST /v1/audio/transcriptions | 음성 인식(STT) |
POST /v1/embeddings | 임베딩 |
안전성 및 프라이버시 — 모듈 성능이 뛰어난 만큼 보이스피싱 등에 악용될 우려도 있어, 음성 워터마크 기술을 적용해 추적성을 갖춰 안심하고 쓰실 수 있도록 준비했습니다.
🧠 Naia가 그리는 미래 (Naia Cognitive)
Naia가 추구하는 궁극적인 방향은 '내 컴퓨터 안의 내 AI' 를 구현하고, AI와 함께 쓰는 애플리케이션의 개발·배포 생태계를 만드는 것입니다. 제가 그리는 멀티모달은 단순한 데이터 입출력이 아니라, AI가 스스로 경험하고 기억하며 표현하는 인지 능력(Naia Cognitive)을 목표로 합니다.
다음 버전에서는 에이전트(Naia-agent), 장기 기억(Naia-memory), 프레임워크(Naia-ADK) 등의 업데이트가 기다리고 있습니다. Naia-0.9-Omni-48g 와 함께 올라갈 다음 버전은, 코딩 작업이 가능한 수준의 로컬 프로파일·환경 구성과, 사용자를 기억하며 실시간 음성으로 함께 일하는 — 말 그대로 '아이언맨의 자비스' 같은 모습을 목표로 연구·개발하고 있습니다.
48GB는 아직 24GB에 아무리 구겨 넣어도 버거운 영역이지만, 구형 RTX 3090 두 장만 꽂으면 되니 개인도 충분히 꿈꿔 볼 만하다고 봅니다.
🎮 Naia OS는 나를 기억하고, 나와 일하고 노는 AI
Naia-OS가 그리는 그림은 이렇습니다.
- Steam(Bazzite)/Windows 기반 게임 머신 + 나를 기억하는 지능형 에이전트 + 3D 아바타 기반 자연어 UI + VRAM별 최적화 프로파일
최근 MS와 Nvidia가 RTX 기반 소형 AI 기기를 만든다고 크게 화제가 됐죠. 사실 기다릴 필요 없습니다. 게임도 되고 AI도 되는 Naia-OS가 정확히 그 자리를 노리고 있으니까요. 저라면 그 신제품 대신 Naia-OS 구성을 택하겠습니다 — 가격은 우리가 권하는 상위 라인보다도 비싸고, 게임 호환성도 미지수이며, 통합 메모리는 느립니다. 반면 검증된 소비자용 GPU를 꽂는 Naia-OS는 게임·AI·확장성을 모두 잡습니다.
Mac 환경을 일부러 미루는 게 아니라, 장비와 시간이 부족해 아직 손대지 못하고 있을 뿐입니다. 함께 도와주시기로 한 분들도 계십니다.
Naia-OS는 단일 모듈이 아니라 각각의 역할이 분리된 오픈소스 레포지토리로 구성되어, 차근차근 뼈대를 맞춰가고 있습니다. "뭔가 엄청나게 많은데?" 싶으시겠지만, 지금이 바로 'AI 기반 개발 시대'이기에 가능한 일입니다.
기존의 OS가 애플리케이션의 관리 도구였다면, AI OS는 자연어로 소통하고 기억하며 스스로 일을 처리하는 소프트웨어이자 로봇이 될 것이라 믿습니다. 단순한 블러핑이 아니라 하나씩 결과물로 증명해 보이겠습니다.
🤝 함께해요 — 오프라인 모임 & 디스코드
다음 주 중으로, 그동안 작업한 것들을 소개하고 함께 도움을 주고받을 분들을 찾는 오프라인 모임을 가져볼까 합니다. 모듈도 한 번 내려받아 보시고, 관심 있으신 분들은 아래 디스코드로 찾아와 주세요. 본격적인 오픈소스 커뮤니티로 발전하기를 희망합니다.
앞으로 넥스테인과 Naia가 만들어갈 행보에 많은 응원과 관심 부탁드립니다.
#넥스테인 #Naia