【AI導入のヒント】データサイエンティストの考え方から学ぶ 事例詳細|つなweB

今導入すべきは、「地味だけど役に立つAI」

—データを前に、AI導入の着手ポイントがわからずにいる企業や事業担当者がまず、押さえておきたいことはどのようなことでしょうか?

山本覚氏 今、世の中には大きく分けて2つのAIがあると思っています。学術的な分類法ではなく、私が感じているものなのですが、1つは、「PR目的のためのAI」。もう1つが、「地味だけど役に立つAI」です。その違いを前提として認識しておくことは必要だと思います。

—どのような違いがあるのですか?

山本氏 PR目的のAIは、たとえばチャットボットです。インターフェイスが工夫されていて、知能があるかのように話をしてくれるので、一見AIっぽく見えますよね。しかし実は、そんなに学習が進んでいないんですね。一方で、地味だけど役に立つAIは、ある与えられた数字群の中から、何かを予測するだけのものではあるのですが、こちらの方がビジネスへの導入もしやすければ、実益になりやすいですね。

—具体的に、どういうシーンで導入がしやすいのでしょうか?

山本氏 たとえば、ケーキ屋さんの需要予測をする時の例です。12月はクリスマスがあるからケーキが売れるということは、単純に予測できます。しかし、ケーキの売り上げに寄与しそうな要素はほかにもたくさんあります。人の手でそれらを分析するのは困難ですが、AIや機械学習にとりあえずデータを組み込んでおくと、単純予測より精度が高い予測をすることが可能になります。こういった地味だけど本当に役に立つAIを、当たり前のように使っていくべきなのだと思います。AIを使う真の意味は、PRではなく、社内の効率化です。そう考えると、「AIがないと猛烈に困る!」という状況で、まるでExcelを使うかのように、AIを使う。それが、次に必要なAIのレイヤーだと思っています。AIパッケージの基礎開発を行わなくても、今は世の中にたくさんAIの技術があります。それらを組み合わせて使うことも、AI導入を進めていくために必要な視点かもしれません。

 

ヒント(1)行動の属性の数値化に、妥協は禁物

—AIの導入をスムーズに進めるための、段取りというのはあるのでしょうか?

山本氏 一番重要なのが、データの準備です。AIのデータサイエンティストは、「マエショリスト」と呼ばれているほどデータの前処理は非常に大事なものです。そこにパワーも時間も費用もかけるべきだと思っています。

—データの準備といわれると、とてつもなく大変なことのように感じます。

山本氏 そうですね。でも、あまり意味のないデータに、最高レベルの分析をするよりは、誰がやってもそれなりの結果を出すデータをまずは用意することが重要なのは明白です。データの精度を上げるために、たとえば人の嗜好性が分かれるような単語がどこに出てくるのかなど、前処理を頑張ったりします。

—具体的にはどういうことですか?

山本氏 たとえば、ある商品をお客様が買うか買わないかを判断したい場合、過去にその商品のサイトを見たことがあるか、その商品以外にどんな情報を見ているのかを参考にします。そのときに、「過去にサイトに来たことがある=1」、「関連する商品を見たことがない=0」というように、すべての行動を「1、0」という数値に置き換え、「ある条件の人は買いました」、「ある条件の人は買っていません」という解を与えていきます。あとはAIが勝手に計算し、学習してくれます。もう少し高度化してくると、あるメールがスパムかどうかの判断も可能です。スパムメールによく出てくる単語を抜き出し、「その単語が入っている=1」、「入ってない=0」、その単語が何回入っているかによって、スパムメールかそうではないかを判断するという構造です。

一見複雑そうに見えることも、最後には行動の属性を数値データ化することができます。ここは各企業のAIエンジニアの腕が問われる、一番力をかけるべきところなんですね。そうやって数値化されたデータさえあれば、既に世の中にあるAIを活用することができるようになるということを、知っているといいですね。

—世にあるAIを活用できるとなると、少し手軽に導入を進められそうな気がしますね。

山本氏 そうですね。いきなり最新AIの研究開発をやろうとしても、うまくいかないケースが多いので。最先端のAIを研究することは、文明を進めるためには必要ですが、それは一企業が担うことではありません。最先端ではないけれど、役に立つAIは多々あります。まずはそこから導入をしてみるのがいいのではないでしょうか。それが結果として、AIの需要を高め、AI産業のボトムアップにつながると考えています。

 

ヒント(2)膨大な計算を補うのは、経験からくる生きた「知見」

—データの数値化をいざ行うにはハードルが高いような気がします。数値化するためのヒントはありますか?

山本氏 確かに、行動を「0、1」に直すのは、ある程度のノウハウが必要になるケースがあります。そこでポイントとなるのが、「知見を持ってデータを見る」ということです。実際に、データの専門家である僕らがAIを使って気づく知見よりも、その業種・職種の専門家が言う一言の方が、よっぽど勘所を押さえていることがあります。この一言が、実は数値化するための大きなヒントになることが多いです。

—具体的には、どういうことですか?

山本氏 たとえば、AIについて書かれた本を買うかどうかを予測したい場合。その本を買う人が普段、どういう思考で書籍を購入するのかが影響します。たとえば消費者が反応を示す技術用語が事前にわかっているとします。それを元にデータを洗い出せると、どの技術用語に何回以上接触していたら買うだろうと予測することができます。一方で、その技術用語に関する知見を入れずに、世の中にある全データの中からいきなり予測しようとすると、「精度の高い結果を導くためには、技術用語が大事」だと気付くまでに、非常に膨大な計算が必要となってしまいます。

—知見を持ってデータを判別しなければ、費用や工数が膨らむということですね。

山本氏 ディープラーニングが素晴らしいのは、本来は人間だけができる「気づき」を自動で生成してくれるところです。そのためには、非常に膨大なデータを学習している必要があります。しかし通常は、「気づき」を自動生成するに足るデータ量を持ち合わせていないケースがほとんどです。足りないデータをそのままに計算をしても有効な結果は得られません。そこで活きてくるのが、知見を活用した自分たちの切り口。知見を持ってデータを絞り込んでから従来のAIで計算した方が、より期待に近い実績が生まれるはずです。

—データの整理には手を抜くべきではない、ということですね。

山本氏 そのとおりです。ここまでやりつくしても、投じた研究開発費に対して、効果はいずれ、頭打ちになってきます。そこまでの効果で満足するのであれば、AIを止めてしまってもいいと思います。しかし、あと数%の精度を上げることが、ビジネス的に非常に意味があるという場合、望むべき精度向上は狙えると思うんです。その数%が、何百億円の利益を生むのであれば、一億円かけてもいいかもしれませんが、2,000万円の利益しか生まないのであれば、費用ばかりがかさんでしまい本末転倒です。単純にAIの精度を求めるのではなくて、精度向上によって、ビジネス貢献度がどれだけあるかという、ROI(費用対効果)を把握したうえで投資するということも忘れてはならないと思います。

 

ヒント(3)手元にあるデータから、消費者行動を予測する

—ここまでは、ユースケースが先にあって、そのために必要なデータは何かという話だったと思います。逆に、データはあるけれども、それを持て余している企業が考えるべきことは何でしょうか。

山本氏 手元にデータがあった場合、消費者の行動が、どんな意味として結び付くのかということを、逆引きで洗い出していきます。

—逆引きで、とはどういうことですか?

山本氏 たとえば、チーズケーキが売れないと悩んでいるカフェが、総売り上げが高い日はチーズケーキが売れているというデータを把握できているとします。総売り上げが高い日は、おそらく馴染みの顧客以外に観光客がたくさん来ている時だろう、と仮説を立てると、「新規の人はチーズケーキを買うようだ」という行動を予測することができます。そうすると、お祭りがある日には、お得なチーズケーキセットを設定して、チーズケーキをたくさん売ろうといったような施策ができます。このように、データについての仮説を広げていくということが、非常に大切ですね。

—データについての仮説を広げることが、AIとどのような関係があるのでしょうか?

山本氏 今、例であげたような仮説を、AIに検証させることで、AI技術を利用することにつながります。「お祭りの日=1」、「通常の日=0」といったように、さまざまな仮説の数値データを立てるんですね。そうすると、あとはAIの仕事です。仮説には間違っているものもありますし、合っているにしても、どれくらい確かなのかの判断もAIに任せるというイメージです。そこで、仮説が間違っているのであれば、「今度はこういうデータを取るべきだ」という気づきにつなげられます。

「これからAIを導入するぞ」というとき、ついAIの技術や手法のことを第一義に考えがちです。しかしこういったデータを本質的に捉えて考えていくことの方が、運用コストを抑えた実用的なAIを導入していく近道なのだと思います。

 

教えてくれた人:山本覚_Satoru Yamamoto
データアーティスト株式会社 代表取締役社長
東京大学 政策ビジョン研究センター共同研究員
東京大博士課程の在籍時に松尾豊准教授の研究室で人工知能を専攻。デジタル領域にとどまらずマス領域のマーケティング課題、さらには政治・医療・金融・都市開発などの社会課題の解決を目指す。

 

楳園麻美、八波志保(Playce)
※Web Designing 2018年10月号(2018年8月18日)掲載記事を転載

関連記事