現在は会話の書き起こし作業をしていたりする。

書き起こしをして気付くのは、そのまま書き起こすだけではすごく不自然な文章になるということ。何行にも渡って長い文章が続いて論点が分かりにくくなったりすることもある。細かく区切られていて文章としてすっと読めない、なんだか「息苦しい」文章になることにもなる。書き起こし後は自然な書き言葉に編集する必要がある。

書き起こし作業は機械作業ではあるし、今後どんどん AI を活用した自動書き起こしが普通になってくるんだろう。精度もどんどん上がるだろう。でも、言葉を知らないといけないし、文脈から何の話をしているか理解していないと、漢字変換のレベルで間違った同音異義語を使ってしまう。教養がないとできない部分がある。

昨日は Google Docs による書き起こしについて書いた。

iPad で書き起こし作業 – 読書ナリ
https://dokusho.nary.cc/2020/04/28/transcription-with-ipad/

Google Docs は精度がいい。だけど、なぜか途中で途切れることがある。音声ファイルを使って自動的に書き起こしをさせていると、勝手に止まっている。理由はよく分からない。

それと、書き起こし開始時に何も音声が流れていない状態でウィンドウのフォーカスがブラウザ以外になると、ディクテーションがオフになる。ディクテーションをオンにして、その後音声をスタート、ということができない。だから、音声を流し始めた状態で、ディクテーション開始ボタンを押すことになる。

それと書き起こし後の編集作業に関しては、Google Docs での編集は少しもっさりする。スピーディーにタイプするのが難しい。私の環境だと、漢字の変換候補がウィンドウの外に表示されるのも見にくい。

試しに、writer.app という書き起こし用ウェブアプリを試してみた。最初に会員登録が必要だ。基本的なことは無料で使える。

writer.app【文字起こしアプリ】
https://writer-app.com/

最初は使い方に戸惑ったが、音声ファイルを再生しつつマイクボタンを押せば書き起こしがスタートする。

あるいは、音声ファイルをアップロードもできる。マイクボタンと再生ボタンを押せば書き起こしされる。音声ファイルはサーバーにアップされないようなので、別のパソコンで作業を継続することはできなさそう。

句読点や改行が入るのは助かる。

writer.app は悪くはないんだけど、Google Docs よりは精度が低い気がするので Google Docs を使い続けることになりそう。

Gogole Docs がディクテーション途中で途切れる問題については解決策をひらめいた。途切れるタイミングは毎回変わるっぽいので、何度か同じ音声を書き起こしをし、そのテキストの差分を調べて、統合すればいい。テキストの統合には、Mac の FileMerge アプリを使うと良さそうだ。