Anthropicが提供するCLI型AIコーディングツール「Claude Code」に、公式のボイスモード機能が追加されました。2026年3月3日、Claude CodeチームのThariq Shihipar氏がX(旧Twitter)で公表した内容によると、/voiceコマンドで音声対話モードを切り替えられるようになっています(出典: @trq212)。現時点では全ユーザーの約5%に先行提供され、数週間かけて段階的に拡大される予定です。

Claude Codeの生みの親であるBoris Cherny氏(Anthropic Head of Claude Code)も、この1週間で音声モードを使ってCLIコードの大部分を書いていたと報告しています(出典: @bcherny)。

/voiceコマンドの有効化と基本操作

ボイスモードへのアクセス権が付与されると、Claude Code起動時のウェルカム画面に通知が表示されます。

有効化の手順

# Claude Codeを起動
cd your-project
claude

# セッション内で/voiceコマンドを実行
/voice

/voiceを入力すると音声モードに切り替わります。もう一度/voiceを実行するとテキスト入力モードに戻ります。

スペースキーによるプッシュトゥトーク

音声入力はプッシュトゥトーク方式を採用しています。スペースキーを押している間だけマイクが有効になり、離すと発話内容がテキストに変換されてClaudeに送信されます。

操作の流れは次のとおりです。

  1. /voiceで音声モードをオンにする
  2. スペースキーを長押ししながらマイクに向かって話す
  3. スペースキーを離すと発話が送信される
  4. Claudeが応答テキストを生成し、音声でも読み上げる

PC Watchの報道によると、文字起こしの途中からキーボード入力に切り替えたり、逆にタイピングの途中から音声に戻したりする柔軟な操作も可能です(出典: PC Watch)。

対応プランと利用条件

Claude Codeの公式ボイスモードは、Claude Codeを利用できる有料プラン全てが対象です。

プラン月額ボイスモード対応
Pro$20対象(順次展開)
Max 5x$100対象(順次展開)
Max 20x$200対象(順次展開)
Team$25/ユーザー(年払い)/ $30(月払い)対象(順次展開)
Enterprise要問合せ対象(順次展開)

2026年3月3日時点で、アクセスできるのは全ユーザーの約5%です。アクセス権の付与はサーバーサイドで制御されており、ユーザー側で強制的に有効化する方法はありません。対象になるとClaude Code起動時のウェルカム画面に案内が自動表示されます。

なお、PC Watchの報道によると、Anthropicは「現時点でClaude Agent SDKへのボイスモード統合は予定していない」としています(出典: PC Watch)。開発者がプログラマティックにボイスモードを利用するユースケースは、当面はサポート外です。

公式ドキュメントへの掲載状況

2026年3月3日時点で、Claude Code公式ドキュメント(code.claude.com/docs)のCLIリファレンスやインタラクティブモードのコマンド一覧に/voiceは掲載されていません。ベータ版として段階的にロールアウトしている最中であり、全ユーザーへの展開完了後に公式ドキュメントへ追記される見通しです。

現在確認できている/voiceコマンドの情報源は、以下の3つです。

  • Anthropicエンジニア Thariq Shihipar氏のX投稿(出典
  • Claude Code開発責任者 Boris Cherny氏のX投稿(出典
  • PC Watchの報道記事(出典

対応言語と日本語音声入力

Claude(Web版・モバイルアプリ版)のボイスモードは、2026年3月時点で英語のみの対応です(出典: Claude Help Center)。Claude Codeのネイティブボイスモードも同様に、初期段階では英語が主な対応言語と見られます。

日本語音声でClaude Codeを操作したい場合、現状では次の選択肢があります。

  • VoiceMode MCP(Mike Bailey氏開発のOSS): OpenAI提供のWhisperをSTTに使用しており、日本語の認識精度が高い
  • Aqua Voice(Aqua Voice Inc.提供): 独自AIモデル「Avalon」がコーディング用語を含む日本語を適切に変換
  • OS標準音声入力: macOS Dictation / Windows音声認識はいずれも日本語に対応

Claude Code公式ボイスモードの多言語対応は、ロールアウトの拡大に合わせて追加される可能性があります。Anthropicの公式発表を待つのが確実です。

VoiceMode MCPとの使い分け

公式ボイスモードの登場以前から、Claude Codeに音声対話機能を追加する手段としてVoiceMode MCPが広く利用されてきました。Mike Bailey氏が開発するこのオープンソースのMCPサーバーは、GitHubスター数847(2026年2月時点)に達しています(GitHub: mbailey/voicemode、MITライセンス)。

両者には性質の異なるメリットがあり、完全に置き換わるものではありません。

観点公式 /voiceVoiceMode MCP
提供元Anthropic(公式機能)Mike Bailey氏(OSS / MITライセンス)
セットアップ/voiceを実行するのみuvx、Python 3.10+、ffmpeg等のインストールが必要
STT/TTSエンジンAnthropic管理(詳細未公開)OpenAI Whisper / OpenAI TTS(ローカル代替可)
日本語音声対応未確認(英語のみの可能性)Whisperにより日本語認識可能
コストClaude Code利用料に含まれるOpenAI APIキーが別途必要(ローカル構成なら無料)
カスタマイズ性限定的STT/TTSエンジンの切り替え、ローカルサーバー構築が可能
オフライン動作不可(クラウド前提)可能(Whisper.cpp + Kokoro-FastAPI構成時)
利用可否段階的ロールアウト中(約5%)誰でも即座に導入可能

公式 /voice が向いているケース

  • 追加ツールなしで手軽に音声コーディングを試したい
  • OpenAI APIキーを持っていない、または取得したくない
  • セットアップの手間をゼロにしたい

VoiceMode MCPが向いているケース

  • 公式ボイスモードのロールアウト対象外である
  • 日本語音声入力が必要
  • 音声データを外部送信せずローカルで処理したい(プライバシー要件)
  • STT/TTSエンジンを自由にカスタマイズしたい

公式ボイスモードが全ユーザーに展開され、多言語対応が実現するまでは、VoiceMode MCPが引き続き有力な選択肢です。

VoiceMode MCPのセットアップ概要

公式ボイスモードを利用できないユーザー向けに、VoiceMode MCPの導入手順を簡潔にまとめます。

前提条件

  • Python 3.10以上
  • uvパッケージマネージャー
  • ffmpeg
  • OpenAI APIキー(ローカルSTT/TTS構成の場合は不要)

macOSの場合

brew install ffmpeg portaudio
curl -LsSf https://astral.sh/uv/install.sh | sh
claude mcp add --scope user voicemode -- uvx voice-mode
export OPENAI_API_KEY="sk-..."

Ubuntu / Debianの場合

sudo apt install -y ffmpeg libportaudio2 portaudio19-dev \
  libasound2-dev libasound2-plugins python3-dev gcc
curl -LsSf https://astral.sh/uv/install.sh | sh
claude mcp add --scope user voicemode -- uvx voice-mode
export OPENAI_API_KEY="sk-..."

Windows(WSL2)の場合

sudo apt install -y ffmpeg libportaudio2 portaudio19-dev \
  libasound2-dev libasound2-plugins pulseaudio python3-dev gcc
pulseaudio --start
claude mcp add --scope user voicemode -- uvx voice-mode
export OPENAI_API_KEY="sk-..."

セットアップ完了後、Claude Codeセッション内で「Let’s have a voice conversation」と入力すると音声対話が開始されます。

ローカルSTT/TTSでコストとプライバシーを最適化する

VoiceMode MCPはOpenAI APIの代わりにローカルサーバーを利用する構成にも対応しています。

# ggml-orgが開発するWhisper.cppをSTTとして使用
export VOICEMODE_STT_BASE_URL="http://127.0.0.1:2022/v1"

# remsky氏が開発するKokoro-FastAPIをTTSとして使用
export VOICEMODE_TTS_BASE_URL="http://127.0.0.1:8880/v1"

この構成では音声データがネットワーク外に出ないため、企業のセキュリティポリシーが厳しい環境でも利用できます。OpenAI APIの利用料(Whisper STT: $0.006/分、TTS: $15/100万文字)もゼロになります。

その他の音声入力手段

Claude Code公式ボイスモードやVoiceMode MCP以外にも、音声でClaude Codeを操作する方法があります。

Aqua Voiceによるシステムレベル音声入力

Aqua Voice Inc.(Finnian Brown氏・Jack McIntire氏が2023年創業、Y Combinator W24卒業)が提供するAqua Voiceは、macOSとWindowsで動作するシステムレベルの音声入力アプリです(公式: aquavoice.com)。

ホットキーで音声入力を開始すると、カーソルがある任意のアプリケーション(Claude Codeのターミナルを含む)にテキストが挿入されます。Proプラン($8/月)ではカスタム辞書を最大800件まで登録でき、プロジェクト固有の技術用語の認識精度を高められます。

OS標準の音声入力

追加コスト不要で最も手軽な方法です。

  • macOS: システム設定 → キーボード → 音声入力をオンにし、Fnキー2回押しで起動
  • Windows 11: Win + Hキーで音声入力パネルを起動

プログラミング専門用語の認識精度は限定的ですが、「テストを実行して」「このファイルをリファクタリングして」のような自然言語の指示には十分対応できます。

音声コーディングの選択肢を整理する

Claude Codeで音声を使う4つの方法を比較します。

観点公式 /voiceVoiceMode MCPAqua VoiceOS標準音声入力
音声入力対応対応対応対応
音声読み上げ対応対応非対応非対応
日本語対応未確認Whisper依存(高精度)対応(Avalon)対応
追加コストなし(プラン料金に含む)OpenAI API利用料(ローカルなら無料)無料〜$8/月無料
セットアップ/voiceのみPython環境・依存パッケージ構築アプリインストールOS設定のみ
利用可否ロールアウト対象のみ誰でも可誰でも可誰でも可
Claude Code専用はいはいいいえ(全アプリ対応)いいえ(全アプリ対応)
オフライン不可可(ローカル構成時)可(macOS)
Claude Code音声入力方法の選び方フローチャート — /voice、VoiceMode MCP、Aqua Voice、OS標準音声入力の判断基準

状況別のおすすめ:

  • /voiceのロールアウト対象になっている → まず公式ボイスモードを試す。追加設定なしで双方向の音声対話が使えます
  • ロールアウト対象外 + 双方向音声対話が欲しい → VoiceMode MCPを導入する。日本語にも対応し、ローカル構成でプライバシーも確保できます
  • ロールアウト対象外 + 入力だけ音声化したい → Aqua Voiceが手軽。Claude Code以外のアプリでも使えるため投資対効果が高い
  • コストをかけたくない → OS標準音声入力で十分。自然言語の指示であれば実用的です

公式ボイスモードの今後

Claude Codeのボイスモードは、Anthropicの開発チーム自身が日常的に使っている機能です。Boris Cherny氏が「CLI codeの大部分をvoice modeで書いた」と述べていることからも、実用レベルに達している機能だとわかります。

今後のロールアウト拡大に伴い、以下の点が注目されます。

  • 全ユーザーへの展開時期: 「数週間かけて」との発表ですが、具体的なスケジュールは未定です
  • 多言語対応: Claude Web/モバイルのボイスモードは英語のみ(2026年3月時点)。Claude Codeでも同様の制約が想定されますが、将来的な多言語化が期待されます
  • VS Code / JetBrains拡張での対応: ターミナル版Claude Codeで先行提供されていますが、IDE拡張版での対応は不明です
  • 公式ドキュメントの更新: /voiceコマンドがCLIリファレンスやインタラクティブモードのコマンド一覧に追加される見通しです

公式ボイスモードが全ユーザーに開放されるまで、VoiceMode MCPやAqua Voice等の外部ツールは引き続き音声コーディングの有力な手段です。特に日本語環境での開発では、Whisperベースの音声認識を活用できるVoiceMode MCPの存在価値が高いままです。

まとめ

Claude Codeに公式ボイスモードが追加され、/voiceコマンド一つで音声対話が可能になりました。スペースキー長押しのプッシュトゥトーク方式で、話しかけるだけでコーディング指示を出せます。2026年3月3日時点では約5%のユーザーに先行提供されており、Pro・Max・Team・Enterpriseの全有料プランが対象です。

公式機能はセットアップ不要で手軽ですが、ロールアウト対象外のユーザーや日本語音声入力が必要な開発者には、VoiceMode MCP(Mike Bailey氏開発、MITライセンス)が引き続き最適な選択肢です。Aqua Voice(Aqua Voice Inc.提供)やOS標準音声入力も、用途に応じて組み合わせることで効率的な音声コーディング環境を構築できます。