2018.06.16
フリーライター・牧野武文氏が消費者目線でApple周りの事象を独自の視点で考察。
今や、スマホなどのデバイスに搭載されるのが当たり前となった音声アシスタント。中でも代表的なのは、アップルのシリ(Siri)、グーグルのグーグルアシスタント、アマゾンのアレクサだ。これらは俗に「人工知能」と呼ばれ、ユーザに親しまれているが、それぞれどのような特徴を持っているのだろうか? これが今回の疑問だ。
そもそもシリは人工知能なのか
スマートフォンやスマートスピーカに搭載されているアップルのシリ、グーグルのグーグルアシスタント(以下 グーグル)、アマゾンのアレクサは「人工知能」と呼ばれることが多いが、これは誤解を招きがちだ。少なくとも、アップルはシリのことを人工知能とは呼んでおらず、厳密には「機械学習テクノロジーが用いられた音声アシスタント」という言い方をしている。
機械学習とは人工知能を支える重要技術のことで、「だったらシリを人工知能と呼んでもいいんじゃない?」と思う方もいるだろう。確かにシリは音声認識などに機械学習が使われているが、肝心のユーザとの会話は人間によってプログラムされたものにすぎない。これはグーグルやアレクサも同様である。
たとえば「何か面白い話をして」と尋ねたとき、アレクサは「〇〇とかけまして…」という謎かけを答え、グーグルはダジャレに似たなぞなぞを出題してくれる。シリは「前にもお話ししませんでしたっけ」という返答で話題をそらす。さらに何度もしつこく尋ねると、シリの過去にまつわる身の上話を語り始める。
こういった応答から「アレクサは親しみやすく、グーグルは賢く、シリはクール」といったイメージを持つ人もいるが、これは各音声アシスタントの知能や性格が表れているのではなく、残念ながら制作チームの方針が反映されているだけのことなのだ。
一問一答形式の入力に対応するアレクサ
では、プログラムされたものであるのは前提として、それぞれの音声アシスタントはどのような長所を持っているのだろうか。
アレクサで特徴的なのは、複雑な事項を音声入力するときに、一問一答方式で対応してくれることだ。
たとえばスケジュールに予定を入れたいとき、入力しなければならない項目は「日付」「時間」「場所」「参加者」「内容」と多岐に渡る。シリやグーグルの場合、これらの項目を一口で伝えなければならない。「明日の5時から、渋谷駅前で鈴木さんと待ち合わせ」という具合だ。これはなかなか面倒で、途中で内容を忘れてしまったり、言葉を噛んでしまいがちである。そのため、一部の項目だけを伝えてとりあえず予定を作成し、あとでデバイス上で情報を補足するという使い方になる。
ところがアレクサなら、「5時に予定を入れて」とだけ言えば、「何日ですか?」「なんという名前にしますか?」と、一つ一つ確認して情報を補ってくれる。アレクサを搭載しているのはアマゾン・エコー(Amazon Echo)といったスマートスピーカなので、基本的には音声操作が前提となる。シリやグーグルのように、不足情報をスマホから補うことができないことからこの一問一答形式になっているのだろうが、これはたいへん便利な機能だ。