내장 브라우저 패널은 Naia 안에서 웹 페이지를 열고, AI가 웹 작업을 수행할 수 있게 합니다. Vercel의 agents-browser 프로젝트의 기능 대부분을 지원하는 것을 목표로 합니다.
알림: 브라우저 패널은 현재 실험 단계이며 불안정할 수 있습니다. 간헐적으로 화면이 표시되지 않거나 Chrome 프로세스가 예기치 않게 종료될 수 있습니다. 안정화 작업이 진행 중입니다.
요구 사항
내장 브라우저는 Google Chrome이 필요합니다.
- Linux: Flatpak 또는 시스템 패키지로 설치합니다. 미설치 시 설치 안내가 표시됩니다.
flatpak install com.google.Chrome - Windows: Chrome이 자동 탐지됩니다. 미설치 시 패널 내 "Chrome 다운로드" 버튼이 표시됩니다.
Windows: 브라우저 패널은 DPI-aware Tauri WebView2 자식 창 방식(v0.5 업데이트)으로 안정적인 네이티브 임베딩을 지원합니다.
패널 열기
오른쪽 사이드바(ModeBar)에서 브라우저 탭을 클릭하면 Chrome이 Naia 창 안에 임베딩됩니다.
AI 도구
AI가 브라우저에서 수행할 수 있는 도구 목록입니다:
- 탐색 — URL 이동
- 뒤로/앞으로/새로고침 — 페이지 이동
- 클릭 — 페이지 요소 클릭
- 입력 — 텍스트 필드 입력
- 스크롤 — 페이지 스크롤
- 키보드 — 키 입력 (Enter, Tab 등)
- 스냅샷 — 접근성 트리 읽기
- 읽기 — 텍스트 콘텐츠 추출
- 스크린샷 — 화면 캡처 (WebView DOM)
- 탭 스크린샷 — 패널 뷰포트 캡처 (OS 화면 버퍼 — 네이티브 오버레이에서도 동작)
- JS 실행 — JavaScript 실행
권한 관리
브라우저 패널의 특징은 모든 AI 도구 권한을 하단 도구 모음에 토글로 배치하여, 사용자가 각 기능을 개별적으로 켜고 끌 수 있다는 점입니다.
기본적으로 대부분의 도구가 활성화되어 있지만, JavaScript 실행(JS eval)은 보안상 기본 비활성화되어 있습니다. 신뢰할 수 있는 환경에서만 켜세요.
Chrome 자체의 마이크, 카메라, 알림 권한도 별도로 설정할 수 있습니다.
북마크
자주 방문하는 페이지를 북마크로 저장할 수 있습니다. 브라우저 패널 사이드바에서 북마크를 관리하세요.
사용 예시
채팅에서 AI에게 웹 작업을 요청할 수 있습니다:
- "구글에서 'Naia OS'를 검색해줘"
- "이 페이지의 내용을 요약해줘"
- "로그인 폼에 이메일을 입력해줘"
- "현재 페이지 스크린샷 찍어줘"
알려진 제한 사항
- Chrome이 설치되어 있어야 합니다 (Linux: Flatpak/시스템; Windows: 자동 탐지)
- 간헐적으로 Chrome 프로세스가 종료될 수 있습니다. 이 경우 재시도 버튼을 클릭하세요
- Linux: X11 창 임베딩에는
GDK_BACKEND=x11(XWayland 모드) 필요 - Windows: 브라우저 도구 사용을 위해 Chrome 설치 필요 (WebView2 방식)
- 현재 안정화 작업이 진행 중입니다