×
最新の人気コンテンツ情報をまとめた
メールマガジンをお届けします

ページトップへ
いま、機械学習のマーケティングへの応用は、実践のステージに入った感があります。クエリーアイ株式会社は名古屋大学大学院との産学共同研究によって2014年、App Store市場予測、約70%の正答率を、2016年3月、App Storeで販売されているアプリの1時間後のランキング予測において、絶対平均誤差率(MAPE)わずか7.07%を達成。機械学習の最先端分野である「リカレント・ニューラル・ネットワーク(RNN)」を得意分野とするクエリーアイ株式会社の水野政司代表取締役にインタビューしました。

クエリーアイ株式会社の水野政司代表取締役

機械学習をビジネスに応用されていると伺いました。

私たちが産学共同研究グループで行ってきたような、ディープラーニングのマーケティングへの応用は、ほとんど事例がありません。おそらく一部金融業界では行われているのですが、一般的な情報として外にでていませんね。

今はまだ実験の段階なのでしょうか?

いいえ、もう受注に走っています。「ディープラーニングで○○予測」だとか、いろいろ始めています。最終的に足周りをIBMの『SoftLayer』にしていこうって決めたのも、その受注のお話から出てきているのです。昨年秋までは、システム構築に苦労しました。まず金額が合わなかったですし、大手のデータセンターの利用も検討しましたが、新規の設備導入のため、「コンテナでサーバー買ってほしい」とかいうお話まで出てきたりという、困った状況にありました。

コンテナとは、あまりに厳しいですね

とりあえず最低ロット5,000台とかです(笑)。昨年秋の段階で、GPUを組み込んだハードウェアが稼働しており、1台からでも利用できたのはIBMのクラウド『SoftLayer』だけだったんです。

コストの壁を突破した、SoftLayer + GPU

GPUの採用は、画像処理ではなく、計算のためだけでしょうか?

機械学習で何が問題かというと、コンピュータの処理能力なんです。GPUは画像認識ではなく、機械学習の並列分散処理のために使っています。

GPUはCPUの約10倍の処理能力でしたよね?

例えばCPUのサーバーで、70日かかっていたのが、GPUを搭載した『SoftLayer』なら、2日か3日で終わりましたっていうことになるんですね。並列で処理できる環境があれば、理論上GPUじゃなくても可能なのですが、現状はGPU+SoftLayerがコスト的にも最良の選択です

SoftLayerのベア・メタル上にGPU(NVIDIA Tesla K80)搭載。機械学習にかかる時間を大幅に短縮する

人間の脳は、アドレスのない世界

機械学習研究の最初のところから、お話ししいただけますか?

クエリーアイという会社を立ち上げた2010年、そのときから人工知能を手がける前提で始めています。私は、「ニューロ・コンピューティング」を学生時代から研究していまして、今回の「リカレント・ニューラル・ネットワーク(RNN)」の応用に関しても、ずいぶん前に論文を出しています。非常に長いスパンで、人工知能を追いかけています。

うちの会社が取り組んできたのは、『インターネット上にあふれているデータから、何かを推測することができるんじゃないか?』ということです。『そもそも基軸になる個人IDって要る?』なんです。それは今までのコンピュータ・ビジネスだったら必要なのでしょうが、機械学習の世界だと、それは邪魔なのかもしれない。そうすると、もっと違う世界が見えてくる可能性があって、そこに挑戦したいなと思っていたんですね。

また、「ニューロ・コンピューティング」に携わっている人たちには常識的な話ですが、人間の脳とコンピュータは、まったく違うものです。何が違うかっていうと、普通のコンピュータはアドレスとデータとプログラミングによって成り立っていますね。でも、人間の脳って、そうじゃない。番地があるわけじゃないんです。

コンピュータ自らが「概念」をもつ?

コンピューティングの手順を教え込まず、データだけをガンガン与えて学習させると、なぜだか「概念」らしきものが生まれる。プログラムを書いてないのに、ネコの画像をダーッと見せたことによって、これはネコと認識したGoogleの実験と同様です。*1
-----------
*1 2012年、Googleが発表。このネコ認識には1,000台のサーバー、16,000個のプロセッサを3日間稼働させ、金額にしておよそ1億円分を要した。松尾豊著『人工知能は人間を超えるか ディープラーニングの先にあるもの』p.171角川EPUB選書 021
-----------

乳児がお世話してくれる人に対し、「母」という概念をもつのに似ていますね。

データだけを与えることによって、無数のニューロン接続により形成される状態空間という名の擬似的な脳の中に何かしらの「状態」を取得できる可能性があるということは何十年も前から考えられていて、それを「概念」と捉えられるかもしれないという研究グループもあります。私はまだそれが概念だと言い切れるかはわかりませんし、乳児が取得する「母」という概念と似ているかどうかは、さすがにわかりません。ただ、その機械学習の手法から「状態」を早く習得する計算方法のブレイクスルーとして「ディープラーニング」(多層構造のニューラル・ネットワークの機械学習)が登場しました。

また、データには大きく静的なデータと動的なデータの2種類があり、静的なデータとは画像のような動きのないもの、動的なデータとは時間や前後関係で変動していくものです。時間や前後関係を取り扱うものが、「リカレント・ニューラル・ネットワーク(RNN)」。中には「カオス」という用語をご存知の方も多いと思いますが、数学的には同じ非線形力学系です。そのカオスの中で、先ほどの「状態」をアトラクタというのですが、それを今のところ最速で形成できる機械学習の手法が「LSTM(Long Short-Term Memory)」(入力、出力、記憶、忘却などを司る多層構造)です。

私が「予測」としているものは、データから機械学習により自己形成されたアトラクタの軌道の時間を未来に進めた場合にアトラクタがどうなるか、です。これが人間の「予想」や「カン」と同じかどうかは、まだまだ議論が必要でしょう。しかし、それに相当するかもしれないことがコンピュータでできそうだというところに来た、ということだと思います。

「深さ」とか「動き」という領域に踏み込んだのですね。

そういうことになります。これらは専門的で難しいんですが、理論上、機械学習のスピードが爆発的に速くなったことだけは確かなのです。ただ、これはいろいろな手法を皆さん試している段階ですね。

2014年に発表されたApp Storeランキング予測実験結果(正答率)図版:クエリーアイ株式会社

「計算量の爆発」のような状態に

クエリーアイさんの強みは何ですか?

うちの会社、クエリーアイは「時系列データ」です。2010年からのApp Storeの売上ランキングが、1分単位でわかっているわけです。それを抽出し、大量のデータを機械学習にかけることによって、例えばマーケティングの施策における「これいけるでしょう」を探したい。そうなると、今度は1000×1000×1000みたいな計算を何回もやらなきゃいけないんです。

しかも、ニューロンのネットワークはまだ未知の分野が多く、全部を把握できているわけではないんです。そうするとニューロン層に、例えば入力層と出力層があったとすると、その間に「3層入れます」とか、「4層入れます」とか、基層に対して「100×100」なのか、「150×150」なのかとか、いろんな組み合わせをバッチ・ファイルにして、検証するしかないのです。

ニューロンの接続を全部試す?

そうです。数百万とおりを繰り返し計算し、イエス、ノー、イエス、ノーっていうのをずっとやる。そのイエス1個を出すのに、何時間もかかるとなると、もう「計算量の爆発」みたいになるわけです。

高速かつ強力な「計算パワー」が絶対必要

そうすると、どうしても高速かつ強力な計算パワーが必要になってきます。欲しかったのは、GPUが搭載された物理サーバーです。これを考えていたとき、条件に合致した『SoftLayer』にタイミングよく出会えた。欲しいタイミングとコストとスピードのバランスでも決まるスペックなど、こちらの条件に柔軟対応できるクラウドとなると、『SoftLayer』しかなかったんです。

App Storeのランキングに掲載された1年間の全アプリの各種データ、Twitter、Webページなどから、1時間後のアプリのランキングを予測させるシステムをIBMのクラウド『SoftLayer』上に構築したクエリーアイ株式会社の水野氏

それが、「ディープラーニングを応用し 高精度なアプリストア市場予測を達成」というニュースにつながったわけですね。

わずか1週間、『SoftLayer』1台で誤差7.%を達成できたんです。もっと突き詰めれば、2%、3%という精度の高い予測ができるかもしれません。コンピューティング・パワーだけで「総当たり戦」をやったら、大きな組織にかないませんが、「ニューロ・コンピューティング」に長年携わってきたノウハウ、経験、判断力の部分は、私たちの価値であり、強みだと思っています

----

今までのコンピューティングは、ある特徴に注目し、それにあてはまるものを選別して、最適な解を求めるものでした。今のコンピューティングは、時系列を取り扱うことによって、人間の「カン」に相当することができそうだというところに来ています。店頭のロボットや自動運転ばかりに注目が集まっていますが、金融、創薬など、ディープラーニングの応用は今、あなたの身近で着々と進んでいます。

こちらもチェック

SoftLayer×ディープラーニング:AWSよりも低コスト!? SoftLayerが支えるディープラーニングの屋台骨|「Cloud Days Tokyo 2016」セミナー レポート