井出草平の研究ノート

課金をせずに音声データから文字起こしをする方法

研究者だとインタビュ調査、ライターさんだとインタビューの文字起こしで必要になってくる作業が音声データを文字起こしである。
昔はすべて人力でやっていたが、最近は音声認識の技術も上がってきたので、下原稿的なものとしてコンピューターに文字起こしをやってもらうという形になってきているようだ。

1. Googleドキュメント

Androidでも文字認識は使われているので、広く知られているサービスだが、Googleドキュメントでも使用できる。
とはいえ、マイクで話したことを認識することが想定されている機能なので、Virtual Audio Cableというソフトをいれる必要があるようだ。

www.cg-method.com

認識のクオリティはかなり良い。ただ、音声の途中で音声認識が止まるので、実用性は乏しいのではと思った。Googleのサービスを使用するのであれば、Cloud Speech-to-TextのAPIを使うのが良いだろう。

2. Office Online Word

support.microsoft.com

認識のクオリティはGoogleより少し悪い気がするが、音声が続く限り、文字起こしをしてくれる。
誰でも簡単に使えるものとして、一番現実的な選択肢であろう。

3. Vrew

YouTube関連のツールとして知られているもの。YouTubeでテロップを入力していくのが大変なので、文字起こしをコンピューターにやってもらって、ミスがあれば人間が修正。手間がずいぶん省けるという発想のアプリだ。
もちろん使えるアプリである。ただ、認識のクオリティはGoogleMicrosoftのエンジンよりも悪い。英語の動画の文字起こしを以前Vrewでやったことがあるが、そんなに変な感じでなかったので、日本語の文字起こし能力がさほど高くないのだろう。文字が動画と紐づけされている利点はあるが、YouTubeのテロップでない限り、これは利点ではないと思う。

www.cg-method.com

4. Group Transcribe

gigazine.net

スマホアプリ。スマホで音声を流す方法を考えなくてはならない。たぶんできるとは思うが。クオリティは良いと評判だが、自分使ったことがないのでよくわからない。オンライン版のWordも同じエンジンで動いているので、Wordでいいのではないか、という疑いがあるが、まだ確かめていない。

5. Google音声認識(Cloud Speech-to-Text)

www.techceed-inc.com

ちょっとしたプログラミングの知識が必要。anaconda+pythonで動くらしい。プログラミングをやったことがない人にはややハードルは高め。Google音声認識を使うのであれば、API一択なのではないかと思う。

tech-blog.optim.co.jp

6. 音声文字変換&音検知通知

play.google.com

スマホアプリ。Google謹製。結果の出力ができると以前アナウンスされていたらしいが、結局現在もできていないらしい。使ってみたが、文字起こしに使うアプリという感じではなく、全く別の用途に使うものに感じた。こちらも、Cloud Speech-to-Textと同じエンジンなのではという疑念がある。

7. Texter

apps.apple.com

スマホアプリ。未使用。良さそうなので一度使ってみたいと思う。