GCL情報理工学特別講義IVの9回目:AIと社会、パーソナルなビッグデータ活用の可能性

はじめに

今回は「ユーザのためのAI入門」の第9回目として、「AIと社会」について柴崎教授からお話を伺った。前回はAIと人文学だったが、今回のサブタイトルは、「ビッグデータとAI技術を用いた人間活動・社会変容のモニタリング・解析」となっていた。ほぼ全ての学生は画面もマイクもオフにしている。やはり臨場感が欲しいところなので、時々柴崎先生から学生をランダムに指名して質問したり、コメントを求めたりされていた。個人的にはこのような双方向性を取り入れる授業のやり方は好きだし、学生の集中度を高めるのに効果的だ。なお、いつも書いているけど、これは講義メモではない。講義の中で気になった部分をネットや文献で調査し、理解した範疇でまとめたものだ。なので、内容に問題があれば、文責は自分にある。逆に内容が分かりやすいとすれば、それは柴崎教授のおかげだ。

AIと社会

今回のテーマはAIと社会だ。特に、人と社会が空間を媒介にしてどのように関わるのか、その変容を見る「空間情報科学」が今回の講師である柴崎亮介教授の専門分野である。東日本大震災においてどのように人が空間を移動したのか、NYの犯罪はどのようにして減らしたのか、企業が持つデータは本来は利用者のものではないか。そんな話を色々と伺った。特に、ECではGDPRとして、データポータビリティの権利が保障され、自らのパーソナルデータを自由に扱うことも可能となっている。ビッグデータは企業が分析するものという考えではなく、これからは個人が自分のビッグデータに基づいてさまざまな分析をすることができるのだろうか。個人的にはそれは非常に興味深い世界だと思った。
(出典:東京大学柴崎研究室

東京大学空間情報研究センター 柴崎亮介 教授

今回のゲスト講師の柴崎亮介教授は、1980年3月に東京大学工学部土木工学科を卒業され、1982年3月東京大学大学院工学系研究科土木工学修士課程を修了される。その後、1982年から1988年まで建設省土木研究所で勤務され、1988年から1991年は東京大学工学部助教授、1991年から1998年は東京大学生産技術研究所助教授、そして、1998年に東京大学空間情報科学研究センター教授に就任するとともに、東京大学生産技術研究所教授を兼任される。2005年からは東京大学空間情報科学研究センターのセンター長だ。下の動画を見ると、spoofingに言及されていた。サイバーセキュリティの分野でスプーフィングというと、不正なデータでターゲットを攻撃するスプーフィング攻撃を連想するが、ここでいうスプーフィングとは自分に都合の良い位置情報に書き換えて不正な行為や行動を行うことを示す。不正利用を防ぐには、「透かし」のような証明書を活用することで、自らの正当性を証明することの重要性を説かれていた。確かに。

(出典:Location Mind

東日本大震災後の人流

講義の最初に東日本大震災の後の人流についてのデータ分析状況を見せていただけた。ネットで調べてみると、柴崎教授の動画は見つけられなかったけど、同様の視点での動画が見つかったので、参考に掲載しておきたい。

(出典:YouTube

信頼・価値・公平性

空間情報科学においては、信頼(TRUST)、価値(VALUE)、公平性(EQUITY)が重要だという。個人、企業、政府が正しく、適切にデータを活用するには、この3つが前提となる。つまり、データ悪用を防止し、すべての参加者がデータから便益を得つつ、社会全体で効率性を高めるために、社会契約を結ぶことを提唱している。お互いを裏切らない=信用、データを共有することで価値を生み出すこと=価値、誰もがその過程に参加できること=平等の3点だ。


(出典:IDE-JETRO

NYはいかにして犯罪を減らしたか

1970年台から1980年代にかけてニューヨーク(NY)の治安は悪化した。死亡者数も1970年代には1500人を超え、1990年には2245人と2000人を超えた。しかし、1990年代には犯罪が減少し、2000年には673人まで減少し、2018年には290人と300人を切る水準まで低下した。殺人だけではなく、強盗は1990年の10万件から2018年には1.2万件へと減少した。実際1980年代にNYに出張したときには、NYの地下鉄は使わないように指導されたけど、1990年代後半には普通に地下鉄を利用できたし、治安の不安を感じることもなかった。これは一体どのような政策を実施したのだろうか。犯罪をなくす上で効果的だったのは割れ窓理論だ。つまり、窓が割れた自動車が放置されていると、割れていない窓も壊されてボロボロになるという現象だ。そして、もう一つはホットスポット理論だ。

(出典:Petit New York

ホットスポット理論

ホットスポット理論とは、犯罪の起きそうな場所を集中的に改善したり、監視することが犯罪防止に有効と言う理論だ。実際、NYの地下鉄のホームや電車の落書きを何度も何度も綺麗にすると、そのうち落書きをする人はいなくなり、犯罪も減少した。同様に例えば、下の図(左)のように汚い公園だと暴行や恐喝なども起こりがちだ。男女の入口が同じトイレなども犯罪を引き起こす要因になりがちだし、下の図(右)のような死角になるような空き地も犯罪の温床になりがちだ。このような場所をなくすことや、このようなホットスポットを集中的に監視することで犯罪を減らし、治安を改善することが可能となるという。素晴らしい。

(出典:全国読売防犯協力会

技術(Technology)と社会(Society)

柴崎教授は、横軸に社会、縦軸に技術とされた。何かの技術が一直線に成長するというよりは、社会との関係の中で、技術革新が進んだり、社会での浸透が進んだり、社会の問題が生じたり、それをまた技術的な仕組みで改善したりということを繰り返すという論調だ。例えば、スマホが売り出された当時は、使い勝手が悪く、性能も低く、マニアックが趣味で使う程度だった。ガラケーの方が100倍便利だった。でも、iPhoneが売り出された頃から、性能も改善し、さまざまなコンテンツが展開され、アプリが展開されて、市場を広げた。しかし、利用が普及するとSNSの弊害や、歩きスマホや、誹謗中傷などさまざまな社会的な問題が生じた。それを改善するためにフィルタリングを通信事業者が提供したりした。自分が、ケータイのモラル教室の講師を約3年間ほど担当したが、まさにそのような社会的な問題への対応だ。技術と社会は密接に関連していることはまさにその通りだと思う。

(出典:東京工業大学

Federated Learning Architecture

日本語で言えばなんだろう。データ連携だろうか。例えば、外科病院Aと内科病院Bと産婦人科病院Cが持っている自分の医療データを統合的に利用することができれば、これは便利だろう。例えば、レントゲン写真とか、CTの映像とかの所有権は本来なら患者のはずだけど、実際はそれぞれの病院が所有している。いわゆるカルテのオンライン連携なども必要性は指摘されているが、実現にはさまざまな利権や医局の壁があったりするのかもしれない。
(出典:Federated Learning Architecture

Generative model for human mobility

日本語で言うと、いわゆる人間の移動データを生成するモデルか。人は車で移動したり、電車で移動したり、自転車で移動したり、徒歩で移動したりする。それらのデータを統合的に管理することでさまざまな処理が可能だ。例えば、津波が予想される時に、人々がどのように避難すべきか。どこにリスクがあるのか。携帯電話やスマホにはGPS機能があるので、GoogleやAppleなどは70億人のモバイルデータを分析することが可能だし、通信事業者はどの基地局と通信したかというデータ(CDR)を常に運用に活用している。これらを匿名化してモバイルビッグデータとして活用することが可能だし、個人情報の保護を条件にさまざまなトライアルが実施されている。

(出典:Research Gate

主要繁華街夜間滞留人口の推移と実効再生産数

下の図は2020年3月から2022年6月4日までの主要繁華街の夜間滞留人口、新規感染者数、実効再生産数などの推移だ。「滞留人口と新規感染者数の相関係数はどの程度なのでしょうか?グラフから見る限りあまり高くないように見えます。」とチャットで質問した。柴崎教授からは、相関の高い時期とそうでない時期がある。例えば2020年4月・5月には、夜間滞留人口の減少と実効再生産数の減少や、その後の増加などがよく一致している。狭い期間では相関係数の高い時期もあると言うのは認めるが、そうでない時期もある。また、相関係数は計算できてその値が高くても、それは相関性が高いと言えるだけであって、因果関係までは証明できない。また、偽相関もある。この分野の分析はデリケートな問題もあり、難しい。

(出典:TMIMS

モバイルビッグデータ(MBD)

柴崎教授は、学生との双方向のキャッチボールを好まれる。世界の人口は2020年時点で77億人と言われている。携帯の世界の人口カバー率はすでに100%を超えている。先進国では一人で複数のデバイスを用いている。実際、自分は業務用のスマホとPC、個人のスマホと、タブレットと、PCx2と、スマートウオッチを合わせると七台も使っていることになる。東日本大震災の発生直後の対策室に動員された。主に法人のお客様からの問合せ対応だ。ある保険会社からは、仙台市の社員と連絡が急に取れなくなった。どのような状況かを調べてほしいという内容だった。通常だと個人情報の保護の観点から慎重な対応が優先されるが、今回は人命にも直結するので対応することにした。もう時効だと思うので、少し書くと、最後の通信の数分前には海岸から2-3km離れた内陸でのログが確認された。しかし、最後の通信ログは海岸近くのログだった。断定はできないけど、状況的には津波の引き潮に流された可能性があることを営業に伝えた。利用者と移動機が一緒に流されたのか、移動機のみが流されたのかは分からない。その社員の安否もそれ以上は聞いていないが、無事であってほしいと心から願った。

(出典:運輸総合研究所

個人によるビッグデータ利用

柴崎教授からは別の学生にGDPRについて質問があった。GDPRとは、日本語で言えば、「EU一般データ保護規則」だ。General Data Protection Regulationの略だ。EU内の全ての個人情報のデータ保護を強化することを意図している。自分も知らなかったけど、柴崎教授によれば、GDPRとは、個人が企業に対して自分のデータの開示を求めることができるデータポータビリティに関する権利を規定したものだという。そうだったのか。日本の新聞やテレビではそのような解説はなかなかしてくれないが、ECならやりそうだ。GDPRの主な目的は、個人データに対する個人の管理と権利を強化し、国際ビジネスのための規制環境を簡素化することだ。EEA域内の個人の個人データの処理に関する規定と要件を含み、EEA域内の個人の個人データを処理する企業には、その所在地やデータ主体の国籍・居住地にかかわらず適用される。 GDPRは2018年5月25日に発効された。GDPRは直接拘束力を持つが、個々の加盟国は規則の特定の側面を調整する柔軟性を持っている。
(出典:GDPR

(出典:Wedge Online

ペルソナ

柴崎教授が別の学生に「ペルソナ」について質問した。ペルソナとは、ユーザー中心設計やマーケティングにおいて、サイトやブランド、製品を同じように使う可能性のあるユーザーのタイプを表すために作られた架空の人物のことだ。マーケティング担当者はペルソナを市場セグメンテーションと組み合わせて使用し、特定のセグメントを代表するような質的なペルソナを構築することもある。ペルソナという用語は、広告だけでなく、オンラインやテクノロジーのアプリケーションでも広く使われている。ペルソナは、ブランドの購買者やユーザーの目標、欲求、制限を考慮し、サービス、製品、ウェブサイトの機能性、インタラクション、ビジュアルデザインなど、インタラクション空間に関する決定を導くのに役立つ。ユーザーペルソナは、想定されるユーザーグループのゴールと行動を表す。多くの場合、ペルソナはユーザーへのインタビューから収集したデータから合成され、行動パターン、目標、スキル、態度、ペルソナを実在の人物にするための架空の個人情報を含む記述によって表現される。
(出典:Persona

Google Take Out

Google Takeoutは、2011年6月28日に始まった。日本でLINEがサービスを開始した頃だ。Google Data Liberation Frontによって、ユーザーがGoogleのほとんどのサービスから自分のデータをエクスポートできるようになった。その後、Googleは人気のあるニーズに合わせてTakeoutに多くのサービスを追加した。当初は、Googleバズ、Google連絡先、Googleプロフィール、Googleストリーム、Picasaアルバムのエクスポートのみだったが、2011年7月15日にはGoogle+1のエクスポートが追加された。2011年9月6日にGoogle Voiceをエクスポートサービスに追加した。翌年の2012年9月26日にはYouTubeビデオのエクスポートをTakeoutに追加した。全然知らなかった。その後もGoogle Takeoutは進化を続けている。一方、批判もある。Google TakeoutがGoogle検索履歴やGoogle Walletの詳細をエクスポートできなかった。2011年9月に応じた。Googleはエクスポート後にユーザーデータを自動的に削除せず、削除を実行するための別のサービスを提供している。やはりデータはユーザのデータを失いたくないのだろう。柴崎教授からはURLも教えてもらった。ぜひ試してみたい。
(出典:Sign City

まとめ

今回の講義は、東日本大震災からグーグルのTake outまで興味深い話が続いた。特に、最後のtake outは全く知らなかった。でも、ダウンロードする項目にもよるけど圧縮しても数十GBのサイズになるという。十分なデータ容量があることを確認してからダウンロードする必要があるが、Googleのデータを分析するだけでも、自らの行動についての客観的な分析が可能となる。利便性とプライバシーのトレードオフをどのようにするか慎重に検討する必要があるけど、個人的には利便性を優先してまずは使ってみたいと思った。

以上

最後まで読んで頂きありがとうございました。

 

広告
最新情報をチェックしよう!