Photo by iStock

ヤフーの上席研究員が予言「10年後、データは個人の財産になる」

ヤフー「ビッグデータ探偵団」が語る③
いまから10年後、データは、自分で守って使う「財産」になる——データの活用によって私たちの生活が驚くほど便利になっていく時代に、私たちはデータといかに向き合えばよいのだろう? 東京大学大学院の博士号を取得し、東大で研究員を務めた後にYahoo! JAPAN研究所に入所したデータサイエンティストの坪内孝太さんに、データと私たちの関係性について語ってもらった。

位置情報から、混雑を予測する

毎朝の通勤ラッシュや、休日の人気観光スポット、イベント会場の最寄り駅……ひどい大混雑に遭遇するたび、うんざりしている人も多いのではないでしょうか。

もしその混雑に何らかの法則やパターンを見つけたり、事前に混雑を予測したりできれば、生活がとても快適で便利になると思いませんか?

果たしてそんなことは可能なのか――それを知るヒントが、皆さんが普段からスマートフォンの地図アプリなどで利用している「位置情報」のビッグデータにあります。

Photo by iStock

ヤフーが提供し、多くのユーザーが利用している「Yahoo!防災速報」アプリや「Yahoo! JAPAN」アプリでは、位置情報を含め膨大なビッグデータが生み出されています。

このビッグデータと機械学習を用いて、何曜日の何時台、どんな天候状態のときに、その場所に何人程度がいるのかを、高い精度で予測する技術を生み出すことができました。毎朝多くの利用者がいる新宿駅や、常に人々で賑わう東京ディズニーランドには、いつ、どのくらいの人がいるのか、一目瞭然です。

この技術が素晴らしいのは、常時ヤフーに蓄積され続ける位置情報のログのみを使って測定できるということです。膨大な手間と時間をかけて行われている、街の中の人の移動を把握するためのアンケート調査と同等のことを、ヤフーは自動で毎分毎秒行っているようなものです。

もちろん、ユーザーの特定が不可能な状態まで統計化することに加え、不在情報が結果的に明らかにならないようにするなど、時間や場所等の要素から複合的に検討しており、プライバシーへの配慮は徹底しています。

「災害に強い都市ランキング」も可能

この手法を応用すれば、混雑予測の他にもあらゆることがわかります。なかでも積極的に活用を進めているのは、防災に関する分野です。

たとえば2016年に熊本地震が発生した際、私がデータサイエンティストとして真っ先に取り組んだのが、「隠れ避難所」の発見です。地震の被害が生じたエリアの位置情報データの量を平常時と地震発生後とで比較したところ、公的な避難所として指定されていないにもかかわらず、人々が自然と集まって避難所となっていたエリアを見つけることができました。

赤色は、地震発生後後に人口密度が急激に上昇したエリア。指定避難所ではなかったショッピングモール「グランメッセ熊本」で、平時と異なる混雑が発生していたことが確認できる。
(資料:Yahoo!防災速報、OpenStreetMap)

出典:https://about.yahoo.co.jp/info/bigdata/special/2016/04/

他のアウトプットとして、ある都市に大雪が降ったとき、その都市の人々の量やその動きが平時と比べてどれほど変化したかを見れば、どの程度、積雪に対する耐性があるかを定量化することができます。

これらの分析の最大の価値は、「A市は災害に強そう、B市は脆そう……」と、主観的なイメージをもとに議論していたことを、「A市はB市の◯倍、雪に強い」などと客観的な数値として示せるようになる点です。

客観的データに基づけば、日本の全自治体を対象に「災害に強い都市ランキング」も作成できるでしょう。さらに理論上では、ある自治体の「災害に強い丁目(番地)ランキング」といった非常に高い解像度の解析も可能です