Date
2026/05/08
Category
AI業務効率化
Title
音声入力AI徹底比較|3大ツールを実際に併用した話
音声入力AIをいくつ使い分ければ仕事は本当に速くなるのか。私はいまAqua Voice、Typeless、Superwhisperの3つを使い勝手を確かめるため比較使用しながら、メール返信・記事執筆・コードのコメント書き・打ち合わせ前メモまで、ほぼすべてのテキスト入力を音声に置き換えています。
この記事では、3ツールを並行して使ってきた立場から、機能・精度・速度・価格・対応OS・カスタマイズ性、そしてSNSの口コミまでを横断的に比較します。「結局どれを選べばいいのか」を、用途別の結論まで含めて徹底的に整理しました。
キーボード入力は150年近く続く前提でしたが、ここ1〜2年で「LLMで後処理する音声入力」が実用レベルに到達し、状況が一気に変わりました。タイピングの3〜4倍の速度で入力でき、フィラー(「えっと」「あー」)の除去、文意の整形、自動句読点までAIが裏で走るため、出力されるのは清書済みのテキストです。実際、メールの初稿・記事ドラフト・Slackの返信・Claude Codeへのプロンプトまで、ほぼすべてのキーボード入力を音声に置き換えた結果、私自身は1日あたり1〜2時間のテキスト作業時間が削減されている実感があります。
私自身、Claude Codeに搭載されている /voice コマンドではなく外部の音声入力ツールをメインで使う運用に切り替えました。理由は単純で、専用ツールの方が起動レイテンシ・整形品質・連携範囲のすべてで上回るためです。中でも代表的な選択肢が、この記事で扱う3つです。
まずは概観を一枚に整理します。詳細は後段で個別に深掘りしますが、ここで「自分はどれが候補か」の当たりを付けてみてください。

項目 | Aqua Voice | Typeless | Superwhisper |
|---|---|---|---|
処理方式 | クラウド | クラウド | ローカル(オフライン可) |
対応OS | macOS / Windows | macOS / Windows / iOS / Android / Web | macOS / Windows(β)/ iOS |
レイテンシ | 約450ms(最速級) | 約1秒前後 | 1〜2.4秒(端末性能次第) |
無料枠 | 生涯1,000語 | 週8,000語(永続) | 基本機能は無料 |
有料プラン | $8/月(年契約) | $12/月(年契約)/ $30/月 | $8.49/月 / ライフタイム$249 |
強み | 速度・コードや画面の文脈認識 | 整形品質・全プラットフォーム対応 | オフライン処理・買い切り選択肢 |
弱み | モバイル非対応・クラウド依存 | 月払いだと割高・権限要求 | UIが取っつきにくい・初期費用 |
金額・スペックはいずれも本記事執筆時点の公式ページ(Aqua Voice 公式プラン / Typeless 公式料金 / Superwhisper 公式)を参照しています。学割(Aqua Voice 70%オフ、Superwhisper 40%オフ)や期間限定クーポンが適用される場合があるため、契約前に必ず最新情報を確認してください。
3つの中で私がいちばん長く使っているのがAqua Voiceです。アメリカのスタートアップが開発したクラウド型のAI音声入力で、独自モデル「Avalon」が「文字起こし」ではなく「編集」を学習している点に特徴があります。話した内容そのままの文字列ではなく、フィラーを取り除き、文脈に合わせて整えた文章をそのまま出力します。
PC中心で開発・ライティング・チャット応対を行う人、レイテンシのストレスを最も嫌う人、コードや専門用語の誤変換にうんざりしている人。私の場合、Claude Codeに対するプロンプトをひたすら音声で打ち込む使い方と、相性がいちばん良いのがAqua Voiceです。
Typelessはスタンフォード大学出身のチームが開発したAI音声入力で、「Speak, don't type(打たずに、話そう)」をコンセプトに、整形済みテキストを返すことに極端なこだわりを持っているのが特徴です。フィラーの自動除去、繰り返し検出、自己訂正の認識(「あ、違った」と言い直したら正しい方だけ残す)、構造化テキストへの自動フォーマットまで、一連のAI後処理が音声入力に統合されています。
長文メール・提案書・記事ドラフトなど「書き言葉」の最終品質を重視する人。ライター、コンサル、士業、移動が多くスマホからも入力したい人。私が記事の初稿や顧客向けメールの下書きを音声で書くときは、Typelessを選ぶ頻度が高くなります。
SuperwhisperはOpenAIの音声認識モデル「Whisper」をベースに、Apple SiliconのNeural Engineを最大限に活用するように作られたMac中心のツールです(Windows版もβで提供)。最大の特徴は完全オフラインで動作可能な点で、設定次第では音声データを一切クラウドに送信せずローカルで処理を完結できます。
Apple Silicon搭載Macをメイン機にしている人、機密情報を扱うためクラウドに音声を送りたくない人、サブスクを増やしたくない人。私はオンラインミーティング後の議事メモを、外に出したくない情報を含むケースで音声化するときにSuperwhisperを使います。

3ツール間で第三者が同条件で日本語のCER(文字誤り率)を測ったベンチマークは、本記事執筆時点では公開されていません。各社のレビュー記事を横断的に読むと、「素の認識精度はSuperwhisperが安定、整形を含めた最終アウトプットの自然さはTypelessが頭一つ抜ける、コードや画面文脈に強いのはAqua Voice」という3すくみの構図になっています。私の体感も概ね同じで、用途によって優劣が入れ替わるため、認識精度だけで一本に絞るのは難しいというのが結論です。
速度はAqua Voiceの圧勝です。450msと1秒以上の差は、実際に使い比べると別物です。発話して2秒待たされるかどうかは、1日に音声入力を100回起動する人にとって、累積で大きな疲労差になります。「思考を切らさない」という体験を重視するならAqua Voiceを最優先で検討するべきです。
iOS / Androidまで含めて1つの環境で完結するのはTypelessだけです。Aqua VoiceとSuperwhisperはPCに寄せた設計のため、スマホからの入力もしたい場合はTypelessをモバイル兼用で持ち、PC側は別ツールという組み合わせが現実解になります。
Aqua Voiceは800語のカスタム辞書、SuperwhisperはWhisperの複数モデル切替+置換ルール、Typelessはパーソナル辞書+AIによる文体カスタマイズと、ベクトルが違います。エンジニアが固有名詞を機械的にねじ込みたいならAqua VoiceかSuperwhisper、文体そのものを学習させたいならTypelessが向きます。
機密性の優先順位は、Superwhisper(オフライン可)> Typeless(ゼロデータ保持・SOC 2)> Aqua Voice(クラウド送信あり)。日本企業の情シス審査を意識するならTypelessが最も通しやすく、医療・士業など「外部送信そのものを避けたい」業務ならSuperwhisperの一択になります。
X(旧Twitter)や個人ブログ、note記事を横断して読むと、各ツールに対する生の評価には次のような傾向があります。
共通して言えるのは、「音声入力AIは万能ではなく、合う用途と合わない用途がはっきり分かれる」という点です。1ツールで全業務をカバーしようとすると、必ずどこかでストレスが溜まります。
私はこの3ツールを次のように使い分けています。
「3つも契約するつもりはない、1本に絞りたい」という方への現実的な推奨は次の通りです。

音声入力AIは、もはや「導入するかどうか」ではなく「どう使い分けるか」のフェーズに入っています。1日に1時間でもキーボード入力をしている人なら、3ツールのいずれかは確実に投資対効果に見合います。まずは無料枠で1〜2週間試し、自分の業務にどの整形品質・どの速度が合うかを体で判断するのが、いちばん早い結論への近道です。
業種ごとの具体的な音声入力活用事例も、あわせて参考にしてください。
「AIで何ができるか分からない」「興味はあるが業務に活かせていない」
── そんな方は、まず1回お話ししてみませんか。
→ AI業務効率化のスポット相談(30分 ¥6,000〜・初回限定)
Company
株式会社Fyve
Address
〒810-0001
福岡県福岡市中央区天神4丁目6-28
天神ファーストビル7階
Tel
080-1460-2728
info@fyve.co.jp