グーグルの新しいストリートビューは、機械学習によって現実世界を「インデックス化」する

Google ストリートビュー撮影車のカメラが、8年の歴史で初めてアップデートされた。撮影した高精細な画像を機械学習によるアルゴリズムが解析し、都市の詳細なデータを収集していくのが狙いだ。そこからは、グーグルが目指している“野望”の一端が見えてきた。
グーグルの新しいストリートビューは、機械学習によって現実世界を「インデックス化」する
IMAGE COURTESY OF GOOGLE

スティーヴ・シルヴァーマンは、火星に送り込まれた2台のNASAの探査車のカメラの開発に協力した人物である。グーグルの駐車場に停車してあるヒュンダイのハッチバック車をシルヴァーマンが見上げると、そこには彼の最新の「創造物」がボルトで装着されている。組み立てられた不格好な物体から垂直に伸びた4本の白い足は、黒い8台のカメラを支えている。これによって、クルマの高さは約2倍になっていた

「覆って隠すことも考えたのですが、わたしたちは仕事人間ですから」と、シルヴァーマンは言う。「これを自慢に思っているのです」

シルヴァーマンのチームは2007年以降、1,000マイル以上の道、建物、ときには誰かの立ち小便までオンラインで見られる「Google ストリートビュー」の画像を撮影するハードウェアを構築してきた。この8年で初めてアップグレードされた新しいカメラは、2017年8月に路上での運用が始まった。このデータによりグーグルは、いまよりもさらに「デジタル化された世界」を掌握していくだろう。

町中の「すべて」を取り込む

2009年製の携帯電話のカメラを思い返してみると予想できるように、ストリートビューの画像は格段に鮮明になってきている。自宅のカウチに座り、より高精細で色鮮やかなデジタル世界を眺めるのが楽しみになるだろう。しかしグーグルの新しいハードウェアは、人間の目だけを念頭にデザインされたわけではなかった。

この撮影セットには、クルマの両側の高画質な静止画像を捉える2台のカメラが含まれている。グーグルの画像認識アルゴリズムにデータを送り込むために、建物や道路標識にクローズアップして鮮明なショットを撮影することもできる。

このアルゴリズムにより、絶え間なく100万以上の看板や店先のデータを収集できる。世界の路地で目にする膨大な量の情報、例えば看板や企業名など、もしかしたらあなたの街角にあるデリの窓に貼ってある営業時間でさえ、データに取り込むことできる。

つまりグーグルは、デジタルマッピングのデータベースを改善しようしているのだ。アルゴリズムによってウェブに「索引」機能をつけたグーグルは、現実世界に対しても同じ戦略を立てている。

ストリートビューの基になるアイデアは、グーグルそのものと同じぐらいに古い。同社の創業から3年後の2001年、最高経営責任者(CEO)のラリー・ペイジは、ベイエリアからスタンフォードのグラフィックス研究所へと入るあたりを運転して、動画を録画した。

ペイジは同社の研究者らに、その動画を画像にまとめる方法を考え出すように頼み、そうして彼らは「物理的なウェブ(Physical Web)上の探索」という異名をもつプロジェクトを開始した。このプロジェクトのテクノロジーはストリートビューの公開に1年先立ち、その撮影車が初めて公道に出た2006年にグーグルに吸収された。

ストリートビュー撮影用の車両は、この10年で85カ国の何千という町で800億枚以上の写真を撮影した。同社の作成した地図データは、それよりもさらに広範囲にわたる。それでもグーグルは、世界に関する優れた「索引」を渇望している。

同社の地図部門を率いる副社長のジェン・フィッツパトリックは、それはわたしたちのせいなのだという。「人びとは日々、我々にさらに難しく、さらに深い質問を投げかけてきます」と彼女は話す。

ストリートビューの画像をアルゴリズムで解析

Google マップ、またはGoogle ストリートビューを初めて検索したとき、おそらくあなたは自分の住む通りの名前を打ち込んだであろう。フィッツパトリックは現在、「わたしの住所まで宅配してくれる営業中のタイ料理の店は?」といった、よりリアルタイムで詳細な「世界のデジタルモデル」が求められるような難題を投げかけられているという。

フィッツパトリックは「あの角の教会の隣にあるピンク色の店の名前は何?」というような、世界の外観的な知識を前提とする質問にも答えたいと考えている。消費者がSiriのようなヴァーチャルアシスタントと話す機会をグーグルが増やしてきたことで、こうした質問を「会話」で解決させたいというニーズも増えていいる。「これらの質問は、われわれがより豊かで深い情報を得ることができて、初めて答えられるものです」と、フィッツパトリックは言う。

グーグルの機械学習と人工知能(AI)への莫大な投資によって、その情報は自然に手に入るようになる。ある道の写真をストリートビュー撮影車が撮影するとき、アルゴリズムによってあらゆる通りの名前と番地の位置を認識・特定し、グーグルの地図データベース上に新しい住所を自動的に登録できるまでになった。ストリートビューはグーグルで初めて、同社が独自開発したカスタムAIチップ「TPU」を使用している。

これにより、システムは「アヴェニダ」という地名が「AV」と省略されていることを、周囲にあるほかの看板や、グーグルの地図データからヒントを得ながら学習できる。ソフトウェアは企業名を認識するようにも訓練されており、タイヤ店の名前を小さく見せる可能性がある巨大なブリヂストンのロゴなど、「視覚的なつまずき」を無視できるほど賢くなっている。

ストリートビュー撮影車に装備された新しいハードウェアの高画質画像は、より高精度な情報の抽出を可能にするだろう。「機械学習の観点からいえば、すべてがよくなります」と、同社エンジニアのアンドリュー・ルッキングビルは言う。機械学習によってソフトウェアは世界をさらにうまく理解できるように進化し、建物の外観や営業時間の看板などの細密な情報を読み取ることで、店舗や企業の種別なども自動認識できるようになるという。

撮影された画像をアルゴリズムを用いて自動解析することは、道路、街、そして企業が猛スピードで変化するような場所では、特に役に立つ。つまり、グーグルやライヴァル企業たちが数十億人の潜在顧客を発掘したがっているような、発展途上国である。例えばインドでは、今年平均して毎日14マイル(約22.5km)もの新しい道がつくられているという。

ストリートビューは今夏、ナイジェリアの人口2,100万人の巨大都市ラゴスにも登場した。アルゴリズムによる撮影画像の自動解析によって、地図の品質が大幅に向上する可能性があると、フィッツパトリックは話す。グーグルは地図と関連した広告を販売するので、地図の範囲拡大や情報の精度向上は、さらなる収益へとつながる可能性を秘めている。

ストリートビューは2017年夏、ナイジェリアのラゴスにも対応した

写真をアップロードすることでもらえる「仮想トロフィー」

グーグルは一般のユーザーにも、このアルゴリズムに“餌”を与える手助けをしてほしいと思っている。鍵を握るのが、低価格化が進む360度カメラである。

17年夏、グーグルはいくつかのカメラを「ストリートビュー対応」として認可し始めている。これらのカメラは、ストリートビューのモバイルアプリを通して、撮影したパノラマ画像などをアップロードできる。これらはグーグルが自ら撮影した画像と同じよう画像認識アルゴリズムによって処理され、最新の地図データに反映されていく。

グーグルは、ストリートビューのデータを現在よりもさらに新しくするために、クラウドソーシングに頼っている。「グーグルが世界に『索引』をつけることが期待されているのです」と、ストリートビューの製品マネージャーであるチャールズ・アームストロングは話す。「しかし、期待に完全に応えることはできません」

ストリートビューのモバイルアプリは、写真の提供に貢献した人に「仮想トロフィー」の報酬を与える。そしてこのアプリは、近隣にカメラをもって行くように提案する。そして今後、企業や地域の観光協会、自治体などが、地元のデータを最新のものにアップデートするために、自らがカメラを積んだクルマを走らせることになるだろうと、アームストロングは考えている。

情報を最新のものに更新していく一連の仕組みは、グーグルがデジタル地図の世界で主要な地位を守るために役立つだろう。その点で、グーグルは頭ひとつ抜けている。ライヴァルは、ドイツの自動車メーカーが共同で保有するHere、GPSユニットやカーナビで有名なTomTom、そして共同研究プロジェクトの「オープンストリートマップ」である。

「それぞれが互いの優劣を比べています」と、オープンストリートマップの米国支部長であるアリッサ・ライトは言う(アップルの最新の地図は主にTomTomなどからデータの使用権を得ている)。多くの人々がGPSを内蔵したスマートフォンをもち歩く世界で、地図のデータは単なる“道筋”にとどまらない。ライトは「マッピングは自律走行車からデートアプリまで、『デジタルな未来』を築くための礎となるのです」と話す。

ストリートビューへの新型カメラ導入とクラウドソーシングの活用は、グーグルを個人情報を巡る新たな論争へと導いていく可能性がある。かつてストリートビューは、その「瞬間」の様子をインターネット上の定着物にしてしまうとして炎上したこともあった。例えばドイツとオーストリアでは、大部分のストリートビューが見えなくなっている。ストリートビュー撮影車がWi-Fiデータのログをとっていたことが問題となったからだ。ようやく最近になって、ストリートビューの撮影部隊は両国に復帰した。

また12年にはスイスの最高裁が、ストリートビュー撮影車が人々の生活を“のぞき見”することを防ぐために、カメラの数を減らし、女性のシェルターのような特定の場所にぼかしを入れるよう命じた。フィッツパトリックは、高画質の画像がさらなるプライヴァシーの問題につながるという考えを否定する。「われわれが機密性のある場所を撮影するようなことはありません」と彼女は言う。

グーグルは今後も、自社で撮影したストリートビュー画像に写り込んだ人の顔とクルマのナンバープレートには、ぼかしを入れていくという。一方、クラウドソーシングによる画像には初期設定では適用されず、ユーザーはグーグルによるぼかし技術を使うかどうか選ぶことになる。

グーグルは画像処理アルゴリズムを使って、ストリートビューどれだけの情報を抽出することができるだろうか。それは膨大な量になるはずだ。

17年前半、グーグルのクラウド部門の主任科学者であるフェイフェイ・リ教授をはじめとするスタンフォード大学の研究者らは、ストリートビューの写真に写っているクルマのメーカー、モデル、そして製造年を記録するソフトウェアによって米国市民の収入、人種、そして投票パターンを予測できることを証明した。

そのようなことが実際に計画されているのかと問われれば、グーグルはストリートビューのデータを地図以上のものも含め、同社のプラットフォームを改善するためだけに使用すると答えるだろう。

グーグルのストリートビュー画像、そしてユーザーからのデータを処理することは、グーグルの親会社であるアルファベット傘下のWaymoウェイモ)の自律走行車が世界を理解するためにも役立つ可能性がある。フィッツパトリックは、これについて「ふたつのチームは、さまざまな面で協力しています」と語るにとどめている。だが、彼女のチームもウェイモからは見返りを得ている。

話をグーグルの駐車場に戻そう。カメラの“魔法使い”であるシルヴァーマンは、この新しいストリートビュー撮影車で高速道路を走るのはそれほど楽しくはないと告白する。「翌日には“バスの運転手”をやめて、エンジニアに戻りたくなりますから」

自律走行車の登場によって、オンデマンドのライドシェアが激変する可能性があるのと同じように、ストリートビューの撮影にも大きな恩恵があるだろう。なにしろ、運転席で退屈な時間を過ごす誰かのために、給料を支払う必要がなくなるのだから。その点では、アルゴリズムによる「現実世界のインデックス化」は、始まったばかりだといえるかもしれない。


RELATED ARTICLES

TEXT BY TOM SIMONITE