Chrome専用の音声認識テキスト化WEBアプリ『Chrome書記』

『Chrome書記』はマイクの音声からテキスト文字に変換するWEBツール。印刷物の文字起こしなんかに使えると思います。

Google音声認識を利用しているので、しっかり発声すれば、とても精度が高いです。Chromeのv25から導入されたWeb Speech APIを使っているので最新のChromeのみで動作しますが、Androidでは今のところ使えません。

認識した文章は、それぞれ変換候補も選べるので役立つと思います。

使い方

音声認識開始ボタンを押してマイクで話すだけです。使い方の動画を撮ってみました。

認識した文章はどんどん入力されていきますが、ある程度の長さで間を置いて区切ったほうが認識率が上がります。区切られた文章をクリックすれば変換候補が表示され、第一候補と入れ替えることもできます。

終了ボタンは押さなくても、一定時間喋らないと自動的に終了します。

市販の音声認識ソフトとしては、日本ではAmiVoiceとドラゴンスピーチの2大ソフトが双璧をなしています。

Chrome書記をみれば分かるとおり、現在はフリーでも充分に実用的な性能ですが、市販ソフトはさらに踏み込んだ使い勝手を実現しており、辞書登録などが可能なので認識力もずっと上がります。

AmiVoiceとドラゴンスピーチは長年のライバル関係の末、今はどちらも同程度のスペックを有しており、音声認識の進化も限界に近づいていると考えてよいでしょう。まとまった規模のテキスト起こしが必要ならば、専用ソフト・専用マイクの導入を検討しましょう。

先日購入したNexus7のGoogle音声入力の精度にビビったからです。この精度なら文字起こしに使えるぞと、Androidで音声エディタも使ってみたんですが、 PCで同じことが出来ないかなとリサーチ。最新のChromeならGoogleのWeb Speech APIが利用できる事が分かりました。

Web Speech APIのサンプルサイトでも十分実用に耐えますが、いちいち日本語に切り替えるのも面倒で、もう少し日本仕様にカスタマイズした物が欲しくなって作りました。

なので『Chrome書記』はWeb Speech APIのデモと大して変わりません。 Chromeのみで動作というのは、それだけでかなりニッチな条件になってしまいますが、Web Speech APIは開発者にとってこれ以上簡単に導入できない?と思わせるほど使いやすいです。