
· Luke
Gemini 3.1 Flash Live サポート + MiniCPM-o 4.5 vLLM 挑戦 — Naia OSのS2Sリアルタイム音声AI開発記
Gemini 3.1 Flash Liveのリリース日に合わせ、Naia OSがリアルタイム音声対話(S2S/Omni)モデルをどのようにサポートするに至ったかを公開します。STT/TTSパイプラインを捨ててOmniモデルに移行した理由、MiniCPM-o 4.5をvLLM-omniに導入する際に経験した試行錯誤、そしてAI-nativeオープンソース貢献実験までをまとめました。
voice-ainaia-osgemini-lives2somni-modelminicpm-ovllmsttttsllmarchitecturelessons-learned



