全自動テキスト起こしがついに実現!?

2018.04.19

Macの裏ワザ、隠しワザ、以外な活用方法など…大声では言えないとっておきの

音声を聞きながらテキストを入力する「文字起こし」の作業は結構重労働です。ところが、テクノロジーの力で全自動化するWEBサービスが登場しました。その実力はどのくらいか試験してみます。

全自動テキスト起こしがついに実現 !?

音声をテキストに自動変換

この連載では以前から取材などの音声ファイルをテキストに変換する「テキスト起こし」について、便利なソフトやテクニックを紹介してきました。しかし、どのツールであっても最終的には本人がテキストを手動で入力することには変わりありません。つまり、作業の負荷は軽くなることはあっても、手間がゼロになることはありませんでした。予算があれば外注したいくらい面倒なこの作業を、何とか自動化できないかというのは積年の課題でした。

そんな中、音声を自動認識してテキスト起こしできるWEBサービスが昨年末に登場しました。エンジニアのイソップ（五十川洋平）さんが開発した「ライター・アップ（Writer.app）」というこのWEBサービス、これがライターや編集者など私の同業者界隈でも大きな話題を呼んでいます。現在のところ音声認識をサポートするWEBブラウザは「グーグル・クローム」のみですが、試してみない手はありません。

実験は意外な結果に…

この音声認識機能を利用するには、いくつかの準備が要ります。音声ファイルをWEBブラウザ上で再生しても、音はMacのスピーカから出るだけでライター・アップには入力されません。そのため、音声をループバック再生する「サウンドフラワー」のインストールが必要です。これを使うとスピーカから出る音声をライター・アップに直接入力可能になるのです。

準備が整ったらライター・アップのWEBサイトに音声ファイルをアップロードし、音量や再生速度の設定を行い音声入力を開始して再生するだけです。

ループバック中なので再生している音声を聞けませんが、自動で画面のテキストエディタ部分にテキストが入力されて行くのは感動的ですらあります。

ところが、その認識結果は期待していたほどではありませんでした。確かに取材での音声は、シチュエーションによっては音が小さかったり背景のノイズが大きく認識されづらい傾向があるようです。とはいえ非常に期待できるサービスなので、なにか改善する方法がないか考えてみました。

SoundFlower

【開発】Cycling '74
【価格】無料
【URL】https://github.com/mattingalls/Soundflower/releases/tag/2.0b2

（１）GitHubより「Soundflower-2.0b2.dmg」をダウンロードしてインストールします。開発元未確認の警告が出るので、副ボタンクリックしてメニューから［開く］を選択します。

（２）システム環境設定の［サウンド］パネルで［出力］［入力］ともに［SoundFlower（2ch）］を選択します。この状態ではMac本体からは音は聞こえなくなるので、作業後は設定を元に戻してください。

（３）Google Chromeで「Writer.app」にアクセスし、中央の［＋］アイコンをクリックして音声ファイルをアップロードします。【URL】https://writer-app.com

（４）波形が表示されるので、［音量］を［100］にまで上げ、［再生速度］を［0.95×］程度に落とします。音声入力ボタン（マイクのアイコン）をクリックしたら、［Play］ボタンで再生します。

（５）すると、音声認識によるテキスト入力が開始されます。ループバック再生のため音声内容は確認できませんが、10秒前後ごとに文章が表示されたら成功です。

（６）同じ音声でも、再生速度を変更すると認識結果の精度に違いが出ることがあります。背景にノイズがある音声では認識率は低い傾向がありました。

続きを読むためにはログインが必要です。
月額720円ですべてのコンテンツの閲覧が可能になります。
下のボタンより、お申込手続きを行ってください。

ページトップへ

レクチャー Macの媚薬

全自動テキスト起こしがついに実現!?