×
最新の人気コンテンツ情報をまとめた
メールマガジンをお届けします

ページトップへ
来る10月26日〜27日、日本初のApache Hadoopの国際イベント「Hadoop Summit 2016 Tokyo」が東京で開催されます。私たちCHANGE-MAKERSもメディアパートナーとして参画。今回はイベント開催を間近に控えたホスト企業、ホートンワークスジャパン株式会社のマーケティングディレクター北瀬公彦氏にお話を伺いました。

開催間近! Hadoop Summit 2016 Tokyo

▼Hadoopの名称やマークは開発者のダグ・カッティング氏のご子息所有の「黄色い象のぬいぐるみ」から


北瀬氏: 今年はアイルランドのダブリン、アメリカのサンノゼ、オーストラリアのメルボルン、そして、ここ東京でも初めてHadoop Summitが開催されます。海外に飛ばなくてもグローバルなHadoop Summitに参加できる。これは、凄くおトクなお知らせです。

▼ホートンワークスジャパン株式会社のマーケティングディレクター北瀬公彦氏

そもそもHadoopとは?

Apache Hadoopとは大規模データの蓄積、分析を「分散処理技術」によって実現するオープンソースのミドルウェア。Apacheプロジェクトのもと、Hortonworks、Yahoo!、Clouderaなどの当初から参加していた企業に加え、Intel、Microsoftなど、多くのメンバーによって開発が続けられ、現在ではペタバイトクラスのビッグデータ処理を可能にしています。
また、2016年に入ってからApache Hadoopを用いた実践的な大手クラウド事業者のサービス(Amazon EMRAzure HDInsightGoogle Cloud DataprocBigInsights for Hadoopなど)が出揃い、注目度が一段と増しています。

▼Hadoopエコシステム。最新のオープンソースプロジェクトを適宜選択して使用する

▼2013年4.4ZBだった世界のデータがモバイル、SNS、IoTなどにより2020年には44ZBに拡大する

北瀬氏:データが爆発的に増える要因はモバイルデバイスの普及、SNSにおける画像やビデオの増大、そして、これから一番拡大が予想されているのが、センサーが組み込まれた機器から送信され、蓄積されるIoTデータです。そこで、私たちが手がけるHadoopやSparkの製品やサービスに今注目が集まっています。

▼クリックストリーム(Webの行動履歴)、Webデータ、IoTなど。データが爆発するのは非構造化データという新しいタイプのデータ

静的データと動的データの一元管理

北瀬氏:今後あらゆるビジネスにおいてデータが一層重要になるのは当然のことですが、「Data at Rest」(蓄積されたデータ)と「Data in Motion」(流れているデータ)を、いかにシームレスに活用できるか? その基盤づくりが重要になってきます。

▼IoTの時代になればなるほど、リアルタイム処理能力に注目が集まる

北瀬氏:蓄積されたデータ「Data at Rest」は、アーカイブ目的などで保存されるデータを指し、主にバッチ処理されます。一方、流れている「Data in Motion」とは、リアルタイム処理でデータを利用します。
静的と動的。バッチ処理とリアルタイム処理。今、まったく違うこの2つのタイプのデータを企業がどう活用し、ビジネスにつなげていくかが問われています。

儲かるビジネスにデータ分析は必須!

北瀬氏: Hadoop Summitサンノゼで紹介されたなかで、私がいちばん興味をもったのは、アメリカの自動車損害保険会社PROGRESSIVEの事例です。この損害保険会社ではSnapshotという小型のデバイスを自動車に装着し、さまざまなセンサー・データをクラウド上に送り、ドライバーの運転傾向から契約料金を決定しているんです。
また、このセンサー・データと他のデータソースと組み合わせて、事故が起こりやすい地域を避けるようガイダンスする仕組みが取り入れられています。
そして、この結果、1年でPROGRESSIVEに2.6億米ドルの利益をもたらしています。

▼IoTデバイスのセンサー・データからの運転傾向や、車の使用状況などに基づき、柔軟な保険を提案

北瀬氏:デバイスからデータを収集してきてクラウドに集め、それだけで満足していてはダメなんです。データを分析し、機械学習して、パターンを検出して、将来の予測を行って、サービスに実装する。HadoopやSparkを用い、こういったプロジェクトを支援していこうと私たちホートンワークスジャパン株式会社は日々活動しています。

----
『Hadoop Summit 2016 Tokyo』10月26日〜27日、ヒルトン東京にて開催(参加料20%OFF)

Apache Hadoop/Spark、機械学習、データサイエンス、IoT、ビッグデータなど、データ活用の最新動向を一挙紹介します。現在、eBay、Yahoo Japan、Daimler Trucks Asia、Coca-Cola East Japan、楽天、Verizon、LinkedIn、セガ、Criteoなど、データ活用先進企業のスピーカーの登壇が決定しています。
CHANGE-MAKERSをご覧の方に参加料20%OFFプロモーションコードをお知らせしています。
「Hadoop Summit 2016 Tokyo」→「申し込み」→Promotion Codeに「CHANGE20」とご入力ください。