
おはようございます。
午前8時45分出社。9時15分頃来客。8名様。日本語と英語で企業紹介、意見交換が行われた。コンセプトの明確な会社。我が社は受注ビジネスがメイン。そう簡単に真似はできないが、ひとつの理想形だと思った。11時にも来客。札幌からのお客様。同友会活動や経済情勢の話。午後は自宅でパソコンに向かう。いよいよ締め切りが迫ってきた。その上、原稿以外に片付けねばならない仕事がたまっていた。原稿に取りかかる前に、それ以外の用件を済ませる。原稿に集中せねば……。少し途方に暮れかけたそのとき、画期的な方法があることを知る。おかげで、6時には仕事を終えようという気持ちになった。
AI恐るべし
その画期的方法とは、AI文字起こしサービス。うかつにも、僕はこんなサービスがあるとは知りませんでした。そもそも、「文字起こし」ではなく、僕は「テープ起こし」と呼んでいた。古いですね……。テープはとっくに使わなくなっているのに。
作業の名称はさておき、今まで僕は音声データを再生し、自分でマイクに向かって読み上げ、音声入力するというやり方で文字起こしを行っていました。最初はiPhoneのSiri。最近はGoogleドキュメントから音声入力。どちらも精度としては納得レベル。ですが、音声を聞きながら読み上げるというのは、なかなか大変な作業なんですね。何度もやり直さねばなりません。その上、音声入力もなぜか途中で切れてしまうことが多い。機械的に進めていきたい作業なのに、案外ストレスがたまるのです。
こんなはずはない。これではディーセント・ワークとは言えない(大袈裟かな?)。そう思って、改めてネットで検索してみたら、いいサービスが存在するではありませんか。これまで知らなかったのは、「文字起こし」というキーワードを知らなかったからでしょうか? AI文字起こしサービスが何種類かあることに気づきました。
サービス開始年は2019年とか20年となっています。最近実用化されるようになったのかもしれません。有料版のものが大部分。その中に、月2時間分の音声データまでは無料で使えるものがありました。どのようなものか、試してみたところ……。ビックリです。
ちゃんと意味の通じる文章になっている。もちろん、ところどころ変な言葉が混じっている。けれども、全体を通してみるとおおよそ意味が通じる。僕の場合は、取材の音声ですから、「おおよそ」レベルで十分。取材時の記憶と重ね合わせれば、原稿を書くことができるはず。これはいい。僕と同じように原稿執筆前に文字起こしをしている編集者にも、メールで情報を伝えました。我が社でも何人かはAI文字起こしサービスを必要としているに違いありません。
音声ファイルをドラッグ&ドロップ。あとは数分間待つだけ。僕の取材時の音声ファイルは4、5分でテキスト化されていました。
録音の精度を高めれば、さらに変換の精度も高まることでしょう。次の取材では「聞き取ることができればいい」という録音の仕方ではなく、「スタジオ収録のような音質」を目指して録音しようと思います。
ちなみに、有料版のAI文字起こしサービスもあります。こちらは1分30円とか、10分100円といった料金設定。精度に違いがあるのか、気になるところです。
AIの進歩をまざまざと見せつけられたような気がします。いつの日か、人間の認識レベルを超えるようになるのでしょうか? たとえば、支離滅裂な説明の仕方をしても、それをAIが適切に判断して意味の通る文章に置き換えてくれる……。そんなサービスがあったら、利用者は爆発的に増えるでしょうね。ただし、人間としては退化してしまうことになるでしょうが……。
