研究者だとインタビュ調査、ライターさんだとインタビューの文字起こしで必要になってくる作業が音声データを文字起こしである。
昔はすべて人力でやっていたが、最近は音声認識の技術も上がってきたので、下原稿的なものとしてコンピューターに文字起こしをやってもらうという形になってきているようだ。
1. Googleドキュメント
Androidでも文字認識は使われているので、広く知られているサービスだが、Googleドキュメントでも使用できる。
とはいえ、マイクで話したことを認識することが想定されている機能なので、Virtual Audio Cableというソフトをいれる必要があるようだ。
認識のクオリティはかなり良い。ただ、音声の途中で音声認識が止まるので、実用性は乏しいのではと思った。Googleのサービスを使用するのであれば、Cloud Speech-to-TextのAPIを使うのが良いだろう。
2. Office Online Word
認識のクオリティはGoogleより少し悪い気がするが、音声が続く限り、文字起こしをしてくれる。
誰でも簡単に使えるものとして、一番現実的な選択肢であろう。
3. Vrew
YouTube関連のツールとして知られているもの。YouTubeでテロップを入力していくのが大変なので、文字起こしをコンピューターにやってもらって、ミスがあれば人間が修正。手間がずいぶん省けるという発想のアプリだ。
もちろん使えるアプリである。ただ、認識のクオリティはGoogleやMicrosoftのエンジンよりも悪い。英語の動画の文字起こしを以前Vrewでやったことがあるが、そんなに変な感じでなかったので、日本語の文字起こし能力がさほど高くないのだろう。文字が動画と紐づけされている利点はあるが、YouTubeのテロップでない限り、これは利点ではないと思う。
4. Group Transcribe
スマホアプリ。スマホで音声を流す方法を考えなくてはならない。たぶんできるとは思うが。クオリティは良いと評判だが、自分使ったことがないのでよくわからない。オンライン版のWordも同じエンジンで動いているので、Wordでいいのではないか、という疑いがあるが、まだ確かめていない。
5. Googleの音声認識(Cloud Speech-to-Text)
ちょっとしたプログラミングの知識が必要。anaconda+pythonで動くらしい。プログラミングをやったことがない人にはややハードルは高め。Googleの音声認識を使うのであれば、API一択なのではないかと思う。
6. 音声文字変換&音検知通知
スマホアプリ。Google謹製。結果の出力ができると以前アナウンスされていたらしいが、結局現在もできていないらしい。使ってみたが、文字起こしに使うアプリという感じではなく、全く別の用途に使うものに感じた。こちらも、Cloud Speech-to-Textと同じエンジンなのではという疑念がある。
7. Texter
apps.apple.comスマホアプリ。未使用。良さそうなので一度使ってみたいと思う。