音声入力で開発速度を上げる設定まとめ – キーボードを打たない開発体験
「もう少しキーボードを打つ量を減らしたい」と思い始めたのは、長時間の作業後に手首が重くなるのを感じてからだ。
1日中コードを書いていると、手首の疲労が蓄積する。健康的な問題でもあるが、純粋に「入力速度のボトルネックをキーボードに依存しなくていいのでは?」という好奇心もあった。
音声入力を開発ワークフローに組み込んで3ヶ月。設定の試行錯誤と、実際に使ってみて分かったことをまとめる。
音声入力で何をするか(しないか)
最初に誤解を解いておく。「音声でコードを書く」は現実的ではない。
def calculate_fibonacci(n: int) -> list[int]:
こういうコードを声で読み上げて入力するのは、シンタックスの複雑さもあって効率が悪い。コードの入力は今もキーボードに任せている。
音声入力が威力を発揮するのは「自然言語のテキスト入力」だ。具体的にはこのあたり。
特にAIへのプロンプト入力との相性が良い。長い指示文を声で話してすぐに送信できるため、思考のリズムが途切れにくい。
macOSの音声入力設定
Macには標準の音声入力機能が内蔵されており、設定するだけで使える。
設定手順
1. システム設定 > キーボード > 音声入力
2. 「音声入力を有効にする」をオン
3. ショートカットキーを設定(デフォルトはfnダブルタップ)
4. 言語に「日本語」を追加
設定後はfnキーを2回押すとマイクアイコンが表示され、音声入力モードになる。もう一度fnを押すか、一定時間待つと自動的に停止する。
おすすめの追加設定
ショートカットキーはfnダブルタップのままでも使えるが、私は⌥(Option)ダブルタップに変更した。fnキーは誤操作しやすいため。
音声入力の精度について
macOS標準の音声入力は、日本語の精度がかなり高い。日常的な文章なら変換ミスはほぼない。
ただしいくつかクセがある。
数字の読み上げ
「ごじゅうに」と言うと「52」になることが多いが、「5と2」と言うと「5と2」という文字になる。意図的に数字を入れたい場合は「数字の52」と言うと確実。
記号の入力
「カンマ」「ピリオド」「コロン」は変換される。「スラッシュ」「バックスラッシュ」は変換されないことが多く、手動入力が必要になる。
英語の固有名詞
「GitHub」「Python」「Slack」などのエンジニアリング用語は概ね認識される。ただし「Kubernetes」「Supabase」など発音が独特なものはたまに誤変換する。
ショートカットとApple Scriptで自動化する
音声入力の入力先を固定する工夫をした。
デフォルトでは「現在フォーカスが当たっているテキストフィールドに入力される」仕様だ。ブラウザとターミナルとエディタを行き来していると、どこに入力されるか分からなくなる。
よく使う用途(コミットメッセージ入力用の小さなウィンドウを常駐させるなど)は、Apple Scriptで簡易入力ダイアログを呼び出すショートカットを設定した。
-- 音声入力結果を受け取るダイアログを表示し、クリップボードにコピーする
tell application "System Events"
set inputResult to text returned of (display dialog "音声入力してください:" default answer "" with title "クイック入力")
set the clipboard to inputResult
end tell
このスクリプトをAutomatorのクイックアクションに登録し、ショートカット⌘⌃Vに割り当てた。起動すると小さなダイアログが開き、音声入力後にOKを押すとクリップボードに保存される仕組みだ。
実際の使用感としては「音声で喋る → ダイアログに表示されるのを確認 → OKを押す → ペースト」という流れで、タイプミスを視覚的に確認してから確定できる。
Claude Codeとの相性が良かった
音声入力との組み合わせで特に効果があったのが、Claude Codeへのプロンプト入力だ。
コードを書いていて「この処理、もう少しシンプルに書けないかな」と思ったとき、以前は英語または日本語でプロンプトをタイプしていた。音声入力に切り替えると、考えながら話すだけでプロンプトが完成する。
(声で)「この関数、ネストが深くてわかりにくい。
早期リターンのパターンで書き直してほしい。
ロジックは変えないで。」
タイピングに比べて、思考の言語化が自然な話し言葉に近いため、プロンプトが具体的になりやすい。「あれしてほしい」という曖昧な表現より、話しながら自然と詳細が補完されていく感覚がある。
コミットメッセージへの活用
コミットメッセージは音声入力に最も向いている用途の一つだ。
git commit -m "feat: ユーザー登録フォームにバリデーションを追加(メールアドレス形式チェック・パスワード強度チェック)"
こういうメッセージをターミナルで入力するとき、以前はタイプするか短縮していた。音声入力なら話すだけで済む。コミットメッセージが詳細になると、後でgit logを見たときの可読性が上がる副次効果もある。
3ヶ月使い続けた結果
正直なところ、「手首の疲労が劇的に減った」というほどの変化はない。コードの入力自体はキーボードに依存しているため、根本的な解決にはなっていない。
ただ、テキストコミュニケーション(Slack、コメント、ドキュメント)の入力負荷はかなり下がった実感がある。文章を打つ量が多い日ほど効果を感じる。
音声入力を習慣化するためのコツとして、「使う場面を絞る」ことが重要だと気づいた。最初は全部音声でやろうとして混乱した。コードはキーボード、文章は音声、という明確な使い分けルールを作ることで自然に使えるようになった。
音声入力に向いている作業
音声入力に向いていない作業
まとめ
macOSの音声入力を開発ワークフローに取り入れた。
「キーボードを打たない開発体験」は現実的な目標ではないが、「打つ量を減らす開発体験」は実現できている。音声入力は銀の弾丸ではないが、ツールボックスに追加する価値はある一本だと思う。
興味があれば、まずmacOS標準の音声入力を1週間試してみることをおすすめする。追加ツールが不要で設定5分、コストもかからない。