人間とテクノロジー

人間とテクノロジーについて、取材とか思ったこととかの備忘録

「分人」を元にコミュニケーションを考える

数年前、分人コミュニケーションをテレコミュニケーションやVRで作る研究の話を聞いた。テレコミュニケーションのインターフェイスを最適化することで、分人を切り替えやすくするというそのアイデアは、なんとなくしっくりこなかった。

それ以来分人について特に考えることがなかったが、先週末、ひでまんたち北大出身研究者5人と旭岳での合宿で、「分人」の議論があったので、「私とは何か 「個人」から「分人」へ」(平野啓一郎講談社現代新書)を再読。

 

私とは何か――「個人」から「分人」へ (講談社現代新書)

私とは何か――「個人」から「分人」へ (講談社現代新書)

 

 

この本での「分人」とは、「不可分」「もうこれ以上分けられない」を意味する「個人」に対する平野さんの造語で、対人関係ごとに見せる様々な自分のことを指す。

近代は、個人の人格をこれ以上分けられない単位として捉えて社会制度が作られてきた。個人の人格が分けられないといっても、人間関係において人はいろいろな顔を持つ。それは「ペルソナ」と呼ばれ、複数のペルソナたあっても自我はひとつだ、というのが一般的な考え方だ。

一方、「分人」の考え方では、そもそも唯一無二の「本当の自分」など存在しない。一人の人間は複数の分人のネットワークであり、対人関係ごとに見せる複数の顔すべてが「本当の自分」だとする。

個人は一個体として独立して存在するのではなく、他者との関係性の中で浮かび上がる。その他者との関係性がなければ、その分人は存在しないし、その他者との関係性の比重が大きくなれば、その個人の中でのその分人の構成比率は大きくなる。

上司、同僚、家族、中学の友人、高校の友人、大学の友人・・・・。それぞれ相手の分だけ、私達は分人を持つ。さらにSNS時代ではSNSごとにまたそれらと異なる分人も存在するかもしれない。たとえ、それら同士が矛盾していたとしても、それも含めてすべてが本当の自分だ。

それは直感的には当たり前のようで、現実の社会では当たり前とはみなされない。「猫をかぶっている」とか「本当の○○さんじゃない」とか言われることもある。でも、それも含めてすべて本当の自分だ。

コミュニケーションにおいては、「分人」を基本的な考え方とすると、すっと楽になることがたくさんありそう。ただ、現在の社会制度は個人をひとつの単位としていることから、どう折り合いをつけていったらいいのかしらと考えています。

 

「VRの父」アイヴァン・サザランドとメディアとメッセージ

ツイッターを眺めていたら、現在バンクーバーで開催中のSIGGRAPHのVR50周年セッションのアイヴァン・サザランド氏の動画が流れてきて、2012年に京都賞の記念講演のために来日されたときにお会いした姿と比べてお年を召されたなあと思ったのと、記念講演でのメディアとメッセージの話を思い出しました。


VR@50: Celebrating Ivan Sutherland's 1968 Head-Mounted 3D Display System

 

まだ動画全部見ていませんが。

「VR50周年」というのは、ヘッドマウントディスプレイ(HMD)の原型をサザランド氏が1968年に開発してから50周年ということだ。サザランド氏といえば、コンピュータのインターフェイスとして直観的に操作する「スケッチパッド」を提案した博士論文の研究で知られるが、VRの系譜としてはHMDを開発している(このHMDパイロットのシミュレーターとして開発された、いわゆる「軍事研究」ともいえる)。なお、VRバーチャルリアリティー)という言葉は当時はまだなく、VRという言葉と概念が広まったのは、VPL Researchを設立してHMDを初めて商用化したジャロン・ラニアーによってだ。

サザランド氏が京都賞を受賞したのは、スケッチパッド開発の功績だが、記念講演のテーマは「メディアとメッセージを区別する」というものだった。もちろんマクルーハンの「メディアはメッセージ」に引っ掛けている。

記念講演のメモをevernoteに記録していたのを見つけたので、以下は自分メモから引用。

 

マクルーハンは「メディアはメッセージである」と言ったが、今日私は「メディアとメッセージを区別する」という話をする。メッセージを作る人は、アーティスト、エンジニア、すべての人たちだ。私はメディアを作ってきた。

 

1960年にカリフォルニア工科大学からマサチューセッツ工科大学へ移った(博士課程)。スケッチパッドのためにTX-2(MITリンカーン研究所にあった大型コンピュータ)を使いたいとウェズリー・クラーク(TX-2の開発者)のところへ行って使わせてもらった。TX-2は20センチメートル四方のスクリーンがある。スクリーンの下にあるノブを回すと、スケールなどを変えられる。図面を描くためのインプットにはライトペンを使う。最初に線を描いてみた。シャノンが「円を描け。円の方が難しい」と言った。

 

スケッチパッドはメディアだが、メッセージはない。当時は私しかスケッチパッドを使いこなせなかったし、一般のユーザには使えるものではなかった。

 

VRHMD)の研究を始めたのは、ヘリコプターからヒントを得た。カメラを付けて、カメラとパイロットの動き合わせるようにした。

 

偉大な仕事をするには取り組むべき課題がある。以下の3つだ。

この中で最も重要で代えがたいものが、リーダーシップだ。

 

今日の私の話はすべてメディアの話だ。だが、メディアを本当に役立つものにするには時間がかかる。

 

一方、映画のすばらしさはそのメッセージ、コンテクスト、ストーリーにある。私はメディアに取り組んできたが、メッセージは難しい。

 

とても偉大な「VRの父」の一方で、自分のやってきた過去の仕事をとても謙虚に話されるのが印象的でした(現役研究者なので今の研究の話をする方が楽しそうに見えた)。

記念講演の翌日、京都賞関連で行われた小学生向けワークショップも取材させていただいた。そのみちの専門家がずらりと並んだ記念講演とは打って変わって、自らヘルメットをかぶってシーソーのような板の上に乗っててこの原理を実演するなど、体を張った実験を行った。「子供の頃からモノづくりが好き、科学はただおもしろいからずっとやってきたしこれからもやっていく」と仰った。

とても楽しそうで手慣れた様子でのワークショップだったので、子供向けのワークショップはよくあるのかと聞いたら、「初めてだ。今日のために入念に準備をしてきた。科学は楽しいと子供たちに伝えたかった。自分の目で見て触って確かめられるものを伝えようとした。だから今日はあえてコンピュータの話はしなかった」。

実際ワークショップではスケッチパッドの話もHMDの話もなかった。ワークショップでのサザランド氏は「VRの父」のイメージと良い意味であまりにも違って意外で、「サザランド氏の伝える力」みたいな記事を書いたっけ。

サザランド氏はスケッチパッドやHMDなどのHCI(ヒューマン・コンピュータ・インタラクション)を開発してきた先駆者だ。HCIの研究者はいわば人とコンピュータの意思疎通を円滑にする専門家で、そういったコミュニケーションについてずっと考えてこられた方は、人と人とのコミュニケーションにもとても深い考えとそれが染み出てくる人との付き合い方があるのではと感じた。

 

 

 

 

「VRは脳をどう変えるか?仮想現実の心理学」(ジェレミー・ベレイソン)

心理学者でバーチャルリアリティVR)を使った研究に20年取り組んでいるスタンフォード大学教授のジェレミー・ベレイソン氏による著書。自身の研究に基づいて、VRの人への影響を調べる研究から、その影響を利用した医療や環境保護、教育などの社会実装の取り組みの紹介まで今のVRの現状と課題についてまとまっている。ここ数年のVRブームではテクノロジー楽観主義の視点で語られることが多いが、この本の中ではVRの限界と課題にもそれぞれ丁寧に触れてあり、そのためVRの意義付けについても説得力が感じられて特に良かった。

なお、稲見先生もツイートされていたがタイトルはミスリードで、原題は「Experience on Demand: What Virtual Reality is, How It Works, and What It Can Do」。原題の方が本の内容をよく表している。

  

VRは脳をどう変えるか? 仮想現実の心理学

VRは脳をどう変えるか? 仮想現実の心理学

 

 

90年代コンテンツが増えている気持ちの悪さ

シン・エヴァンゲリオンが2020年公開、その特報が東宝系の映画の予告編で流れるということで、「未来のミライ」を観にTOHO上野へ行ってきた。シン・エヴァの特報は最初の方にほんの一瞬だったが、いよいよおれたちの90年代も終わるのか、もう中二病とか言っていられないのかという感慨深いものがあった。同時に予告編があった「SUNNY強い気持ち強い愛」は、90年代に女子高生時代を過ごした仲間たちが30代になった今また集まるというストーリーに小室ファミリーからタイトルに入っているオザケンまで90年代J-POP満載の映画で、予告編眺めているだけでも正直痛すぎて穴があったら入りたくなった。懐かしいという感情を惹起するだけのためにこれ観たい30代ほんとにいるのか。

ここ数年、90年代コンテンツが市場に増えている。映画化にしろアニメ化にしろリバイバルにしろカバーにしろ、90年代のコンテンツ(漫画、アニメ、音楽など)の公開やリリースが増えてきた。商業的には、90年代に多感な青少年期を過ごし、それらのコンテンツを浴びて育ってきた世代が働き盛りの30-40歳代になり、コンテンツ消費者としてのターゲットになっているという理由が大きいだろう。

先週末、NHK FMでは半日小室ファミリーの曲が特集されていた。ツイッターのトレンドに入っていたのが気になってiPhoneのアプリで少し聴いて、懐かしさに悶絶した。ジャンプのアプリでは、ドラゴンボールとか幽遊白書とか、ジャンプ全盛期とも言える90年代コンテンツが読める。小学生の頃は毎週ジャンプを買っていたし単行本も買っていたし、なんならキャラのセリフも言える。今読むと、ページを繰る前に吹き出しの中のセリフが頭に流れてくる。

90年代コンテンツは、その時期を多感な10代として過ごした自分にとっては、それらに触れることが当時は血肉にはなっていたとしても、今また触れることは懐かしさに悶絶する程度の感傷の一方で、懐古趣味的な居心地の悪さの方がはるかに勝り、そこを消費者ターゲットとしてコンテンツが量産されている現状に、気持ち悪さを感じる。懐古趣味おっさんおばさんとしてマーケティング対象にされているって、おれらも舐められたものだなと。

ところで自分はエヴァはリアルタイムで見ていなくて、社会人になってから全部観た新参ものなんだが、シン・エヴァは楽しみ。

 

ブラックペアンと多体問題

「ブラックペアン観てる?あれはいいよ、観てみなさい」

ずっと借りていたガンダムのDVDとブルーレイを返しに某研究室に寄ったら、たまたま某先生が在室されていたので、ご挨拶に伺ったら、ブラックペアンを薦められた。医療関係者界隈では話題になっているが、もともとテレビを観る習慣がない私は当然観ていない。

某先生曰く、ブラックペアンでは、「科学的な知見」派の小泉孝太郎さん演じる医師と、「職人技暗黙知」派の二宮和也さん演じる医師の対比がある一方で、どちらかが正義ということではなく、それぞれがそれぞれの正義に基づいているという構図が描かれているのだという。

医療の向上のための新技術の導入と、レガシーなシステムに支配された人間。医療現場は常にこうした矛盾したシステムを抱えている。ブラックペアンでは、技術の導入に際して、そこに人間たちがどう向き合っていくか、参考になるということだった。

医療ドラマは(あんまり観ないけど)、白い巨塔の医局を支配する医師VSはぐれもの医師といった、二項対立で描かれるものが多い。二項対立はドラマとしては面白いが、人間社会の本質とは程遠い。

人間社会は複雑系であり、二項対立というよりは多体問題とどう向き合うか、というのが大きな問だ。ところでガンダムを借りたのは、「ガンダムには人生のすべてが含まれている。ファーストでは二項対立だが、ゼータでは三体問題が描かれる」と言われたからで、某先生のブラックペアンでの着目点とも近く、膝を打った。

ブラックペアン、今日なので夜観てみます。

Oculus Goを買った

 

寝転がって映画を観るためにOculus Goを買った。結論から言うと、約10分使って一晩考えて、手放すことを決めた。私がOculus Goを買ったのは、普段はMac bookで観ている動画を観るためで、つまりPCのディスプレイとオーディオの代替品としてOculus Goを位置付けて購入した。

Oculus Goで試しに観たコンテンツは、プリセットされているコンテンツでOculus room、360度動画コンテンツ、 ブラウザでYouTubeAmazonプライム(エラーで動画再生されなかったが)、FacebookTwitter

視聴について。基本的に首や自身の位置を固定して、Oculus Goをディスプレイとして使う、というのが私の想定用途だ。そのため、360度画面の必要はない。ブラウザを立ち上げると2Dの画面はVR空間上に浮かんでそれを視聴するという形だが、体感的には映画館のような没入感はある。だが、解像度が粗いため、スマホやPCの高解像度に慣れた目では見づらいという不快感が強い。音響は耳元でステレオで聞こえるので良い。

入力について。PCで言うマウスとキーボードの機能と、片手で持つコントローラーひとつでこなすわけなので、入力の操作性がとても悪い。入力インターフェースはまだまだ改善の余地がある。

ハードウェアとしてはまず重い。HMDとしては一般的な重さだが、これを2時間つけたまま映画を見続けるのは首と肩が凝って不可能だろう。ただ、それは想定内で、もともとHMDの重さを感じないように頭を固定して、寝転がって観るということを想定している。

私が手放すことを決めたのは、Oculus Goが悪いわけではない。現時点で、スタンドアロンHMDとしては2万3千円という価格も含めて、最善の選択肢だろう。ただ、「寝転がって映画を観る」という用途では、Mac bookに敗北したというだけのことだ。

ただ、敗北点の最も大きな要因は、HMDを被ったときの不快感にあり、現状のHMDの形状でこれを克服できるとは思えないため、HMDが将来スマホ並みに普及するという未来に関しては疑問を抱かざるを得ない。ただ、HMDが不快な私の身体が非常に特殊で世の中の大半の人がHMDの不快感を感じないのだとしたらありなのかも。

記者と主観と客観と

新卒で入った新聞社で、記者クラブで色々と教えてくれた他部署の師匠が、時々「語る会」を主催している。ただの飲み会だが、参加者は師匠が仕事のなかで出会った人たちで、「医療」をキーワードに業種も職種もさまざまだ。

私が「語る会」に最初に参加をしたのはまだ最初の新聞社にいるころで、最初は結構面食らった。業種も職種もさまざま(医師、医療関係者、行政関係者、メディア関係者、患者団体関係者、アカデミア、研究者、政治関係、企業の人、起業家・・・とにかく様々)。ただ「医療」に何らかの形で関わっているという共通点があるだけで、例えばひとつの事象についても複数の面から見て深い議論ができることに気がついた。

記者という仕事は、取材対象に対して客観的であり、仲間になってはいけない。

そうやって考えていた当時の私は、「語る会」がとても新鮮でおもしろかったし、取材先と師匠のあり方が、おもしろいなあと思った。記者は取材先と飲みに行くことはあるけれど、こうやって異なる複数のステークホルダーが一同に会して、議論をする飲み会は、それまで参加したことがなかったからだ。

初めて参加をしてからもう7-8年経つ。その間に、私は意図せず師匠と同じように、もともとは取材先として繋がった異なるステークホルダーの人たちと一緒にいろんな活動をするようになった。そういう活動をする中で、第三者として取材先に客観的に関わるべき記者が、当事者として取材先である人たちと一緒に活動をすることに、記者として間違っているのではないかと悩み、師匠に相談をしたこともあった。

先日の「語る会」でのこと。「記者(ジャーナリスト)って何だと思う?」と師匠。「社会のジャーナル(日記)を付ける人だ」と。その時話題に出ていたのが、清沢烈の「暗黒日記」。あくまでも客観的に事実を日記としてしるし、一方で主観として訴えたいことは、後世の人々はその文章から読み取る。それはジャーナリストの仕事だと師匠。

「記者は表面的には客観的なファクトを書き記すけれど、その内面は主観によるもの」と私が言うと、成長したな、と師匠。

記者は、主観と客観を行き来しながら、それを意識的に区別し、使い分ける必要がある。おもしろい仕事だと思う。

ワイヤレスイヤホン

少し前に有楽町のビックカメラでワイヤレスイヤホンを買った。先日発売になった、耳を塞がないタイプのフルワイヤレスイヤホンが気になっていたのだが、首からかけるタイプのワイヤレスイヤホンを購入した。

iPhoneユーザだが、ちぎれたうどんが耳から出ているようなあのワイヤレスイヤホンはいただけない。一方で、補聴器のようなフルワイヤレスイヤホンは紛失することが目に見えているので購入する気になれなかった。そもそも普通のイヤホンでさえしょっちゅう無くすし、ピアスに至っては耳に付けていてもよくなくす。

フルワイヤレスイヤホンが目指す先はヒアラブルの世界だ。コンピュータへの入出力のどちらも音声による、ウェアラブルコンピュータが、入出力いずれも視覚情報によるスマホの次の段階として普及するとする見方は多い。

視覚情報がメインのウェアラブルコンピュータと言えばメガネ型のウェアラブル機器で、20年以上前からあるにもかかわらず、なかなか普及しない。アップルウオッチなどの時計タイプのウェアラブル機器もなかなか普及しない。比較的安価でスタンドアロン型のOculus Goが話題になっているとはいえ、VRによるウェアラブルコンピュータ普及は現状のデバイスでは難しいだろう。

普及しないこれらのウェアラブルコンピュータは視覚のディスプレイだが、聴覚へのディスプレイであるイヤホンを使ったウエアラブルへの期待が高まっていると認識している。

プロジェクションマッピングレストラン

先日、Hさんに招集されてプロジェクションマッピングレストランへ行ってきた。招集された6人は私以外は研究者、クリエイターで、オーナーの休日に研究会としてコースを提供していただいた。

創作フレンチというのかしら。一皿ごと出てくるたびに、プロジェクションマッピングからテーブルの引き出しのしかけ、液体窒素や化学反応を多様したしかけ、といったエンタメ色あふれる演出があった。

食をITで拡張しようとする試みは多数あり、これまでも研究として見てきた。ただ、それが食側(レストラン)として提供しようとすると、そのハードルは格段に上がる。レストランの客が求めているのは、純粋に美味しいと感じる食体験だ。

だがこの美味しいと感じる食体験というやつがくせもので、単純に料理に依存しない。食器、店内の雰囲気、一緒に食べている人、その会話、お店の方の雰囲気、対応、会話、その日の体調・・・それらすべてが美味しいと感じることに影響をする。

プロジェクションマッピングのようなITによる食体験の拡張は、これらのパラメーターのどこかをいじってあげて、食体験の満足度を上げるというものだろう。ただし、それは、非常に繊細で難しく、体系化もされていない。

食体験をITで拡張することが目的化してしまったら、満足の行く食体験の提供は難しいのではないかなと、結局のところそう思う。

TOHO上野でレディ・プレイヤー1を観てきた

少し前に、上野に映画館ができた。上野、というより正確には御徒町だ。空いている、という理由で時々、ここにひとりで映画を観に来る。

近未来のVRがテーマだという「レディ・プレイヤー1」は、私のTwitterのTLではずいぶん前から、試写を観た方たちが推していたので、とても期待を膨らませて「これは必修科目だ!」として、公開初日のレイトで観に行った。もちろんひとりで。

一言で言うと「ゲーマーの、ゲーマ-による、ゲーマーのための映画」でした。80年代サブカル(”サブカル”っていう表現もまた80年代らしい)てんこ盛りで、配給会社などいろんな権利をまたいでここまで盛り込めるのはスピルバーグならではだし、スピルバーグにしかできない。その点、観ておいて損はない。

ただ、VRという技術が浸透した社会の物語を楽しみにしていた私は、正直がっかりした。現実の世界を楽しむことが、VRの世界を楽しむことになる。この物語は、そう説く。でも、そんなことは想定の範囲内で、言い尽くされていて、消費つくされた物語だ。原作小説は2011年ということだが、陳腐化している、すでに。

一方で、思ったのはこんなこと。VRの世界(デジタル)を成立させるには、現実の世界(物理)が必要で、デジタル化によって収益を上げるビジネスモデルは、フリーライダーとしてその大きな収益率を達成する。それは今の社会経済で当たり前のように起きていて、もううんざりしたモデルだということだ。

デジタル化、IT化は効率化(コネクティビティも含めて)をもたらすが、現実世界での物理的な創造をするものではないため、どれだけIT産業が巨大化しても、その下支えをする物理世界は、製造業などが担うことになる。物理世界がなければ、デジタル世界は成立しえない。私たち生物は、物理的な食べ物を食べ、物理的な居住空間に住み、物理的な生殖活動を行わなければ自身の存続または次世代の存続ができない。

でも時々、楽観的でイケイケなデジタル世界の人間は、それを忘れがちになる。

レディ・プレイヤー1の舞台は2045年。荒廃した世界で、スラム街で暮らす人口の大半はゲームの世界「オアシス」に入り浸っている。オアシスでは、創設者の遺言によってオアシスの所有権で5000億ドル相当の遺産が与えられるゲームが繰り広げられている。スラム街に暮らす若者がそのゲームの勝利をかけて奮闘するというストーリーだ。オアシス管理のために巨大資本を投じて主人公と戦う悪役として企業社長が登場。主人公はゲームの中で知り合った仲間と現実世界でも出会い、悪役社長との対決に勝利。やっぱ現実いいよね。というオチ。

VRが好きな人や、デジタルイケイケな人たちはしばしば、デジタルの中の世界の素晴らしさをとく。その中には、デジタルだけではなく現実世界を変えうる力を持つからだという主張も多い。それは否定しない。

でも、物理的な生産活動を辞めて日がな一日ゲームの世界で暮らす人々が人類の大半の世界は、成立しえない。

機械が生産活動を担い、人間は労働から解放されるととく人もいる。彼らのロジックでは衣食住といった生命維持のための物理的な生産活動を支えるのは機械であり、人間はそれらを行う必要がない。それならばデジタル世界に浸りきることもできる、と。

技術が理想の域に達すればそれは可能だけれど、それはまだ技術的にも社会的な実現可能性も、ともにメドが付いているものではない。妄想の域を出ていない。

ということを考えながら終電後にTOHO上野から自宅まで1時間近くかけて歩いていたのでした。

実世界AI研究のわけー人工的に作られた”問題”を”手段”に押し込めようとしたことで、AI冬の時代が引き起こされた

科学者は、「役に立つ研究」という言い方を嫌う人が多いようだ。でも、科学研究は現実の社会課題の対応になるものだ。

先月、理研AIPセンターのシンポジウムであった、カーネギーメロン大学教授の金出武雄先生の講演では、「実世界AI研究」として、現実の社会での問題に対応するAI研究の話題があった。

とても良かったので、メモを共有します。

以下、金出先生の講演メモ。

 

          ◆

 

ロボットや画像、コンピュータビジョンの分野でいろんな研究をしてきた。顔認識や自動運転、最近ではスマートヘッドライトといって、運転時に雨が降ると、雨粒に光が当たらないヘッドライトの制御をやっている。

研究は楽しくやってきたが、今日はその話はしない。「実世界AI研究」というのが今日のタイトル。

人工知能は今はやっているが、もともとはよく言われるのが、1956年のダートマス会議に集まってワークショップを行った5人が人工知能研究の元祖だと言われる。この5人の中で、ハーバート・サイモン先生とアレン・ニューウェル先生は私がいるカーネギーメロン大学の先生だ。

AIの歴史は、挫折と回帰から成り立っている。

1966年にピアス勧告が出されて、「機械翻訳は出来ない」と言われた。これに対して、1980年代に意味論が導入され、それから20年後の今ではニューラルネットワークで翻訳は急速な能力向上となった。

1968年にはMinsky-papertで、単層パーセプトロンの限界が指摘された。これによってニューラルネットワークに対する落胆があったが、その後1980年代に非線形要素を入れることで改良がなされた。さらに2000年代後半には多層のニューラルネットワークが出てきて今のブームへとつながった。

1973年に出されたライトヒル勧告では、組み合わせ爆発問題が指摘された。これに対してNPハード問題に対する現実的な「近似的」「確率的」解法が提案された。また、「知識」の書き出しと「浅い」探索によるエキスパートシステムの成功があった。

1990年頃に問題の定式化(モデル化)とプログラミングの限界が指摘された。だがそれは昨今のビッグデータとそれを活用した深層学習の登場によって克服されつつある。

「良い科学は、現実の問題に応答する」

「AI冬の時代」と言われたのが1970年代から80年代終わりのことだ。(AI研究に多額の資金を投入してきた)DARPAはそれまではAI研究の資金制限を設けていなかったが、包括的AI研究資金停止が導入されたことが冬の時代の引き金となった(AIへの"Umbrella Funding"の停止)。

では「良い」研究とは何だろうか?みんなを納得させるものだろう。

これに対して、アラン・ニューウェル先生は真摯で深い考えを持っていた。良い科学というのは、現実の現象、現実の問題に応答する、というものだ。彼はこう言っている。

Good science is in the details,Good science makes a differnce.
(良い科学はちょっとしたところにある、良い科学は差を生む)

では実世界AI研究とは何か?現実に存在する社会的、経済的、工業的・・・(あらゆる”的”)に価値のある問題に解決を与え、差を生み出すAIの研究だ。

先日話したDARPAのプログラムマネージャーが良いことを言っていた。

The objective is to "catch mice", not build a "better mouse trap."
(研究の目的は「マウスを捕まえること」であって、マウスを捕まえるワナを作ることを目的にしてはいけない)

毛沢東も、こう言った。

知識を得たいならば、現実を変革する実践に参加しなければならない。

人工的に作られた”問題”を”手段”に押し込めようとしたことで、AI冬の時代が引き起こされた

「応用をやりたい」と私は言っているのではない。これまでも、AIの強力な手法は、現実の具体的な問題と困難を追求する中で生まれてきた。

Logic Theoristから、手段の探索を組み合わせる手法になったが、これはGPSの開発につながった。化学構造式の同定と医学診断のために、エキスパートシステムにつながった。不確実性と因果(拘束)関係をもつ計算問題からグラフモデルとNPハード問題の近似的・確率的開放につながった。文字認識は、CNN深層学習によって精度が向上した。

なぜ、AI冬の時代になったのか振り返ってみると、人工的に作られた”問題”を”手段”に押し込めようとしたことで、AI冬の時代が引き起こされた。

MicroWorldのアプローチでは、問題の自己定義とその世界での開放が行われてきた。例えば、K.ForbusはAnalogical ReasoningとStructure Mappingと定義をしてしまった。そこから先は数学の問題になってしまった。日本では第五世代コンピュータは、Logic Programmingということを決めてしまった。

こうしたものが人工的に作られた問題だ。

一方、実世界IAでは、製品検査やシステムの異常検知といった実際の世界での問題に対応する。

AIでは、それ自体がどのように決定をしたのか説明ができないとよく言われる。これに対して「説明できる」AIを作ろうという研究がある。DAPRPAでもXAIプログラムを作って15くらいの機関で研究をしている。参加者の多くは大学の研究者だが、具体的問題、自律ロボット、軍事情報解析AIシステムといったインテリジェンス情報の解析のためにAIを使うとなったときに、説明ができないと使えない、となってしまうからだ。

一方で、「会議に参加して貢献できるAIシステム」というものがある。これは私が好きなものだ。例えば5人が会議に参加したときに、もうひといAIが参加する。このAIが本当に会議に貢献できるかどうか、というものだ。

これは伝統的なAIの問題で、問題と知識の表現方法が知られている。表現できればそのうえで計算ができる。ディープニューラルネットワークでは分散的に知識が表現されている。ただし、本当に”人のように有能な”システムの実現には、フレーム問題と記号接地問題が課題となってくる。

ディープラーニングは閉じた世界だ。ただし現実の会議では、これまでに計算をしたことがない問題も現れる。だから会議はおもしろいのだ。そのことを”フレーム問題”と言う。「〇〇病にかかった」と言うと、「〇〇病」というのがよくないことだと我々は感じるが、それは記号として記述されていない。我々が記号として使うことが、AIシステムには使うことができないのだ

マサチューセッツ工科大学では1970年前後にProjectMACが行われた。実問題の解をインプリメントする手法を開発し、Emacsなどを使うようになった。これと同じようにAIPセンターでAIの能力を実問題の解を得る手段になっていくといい。

他者の心の状態を推測するニューラルネットワーク

 他者の心の状態を推測する心の機能が「心の理論」だ。DeepMindの研究者らは、「心の理論」を再現するニューラルネットワークのモデルを作ったと論文をarXivで公開している。このモデルで、他者の心の状態を推測の可否を判別する「サリーとアン課題」を解くことができたという。

Machine Theory of Mind

Neil C. Rabinowitz, Frank Perbet, H. Francis Song, Chiyuan Zhang, S.M. Ali Eslami, Matthew Botvinick (Submitted on 21 Feb 2018)

 

ひでまんさんのTLに流れてきたのを見て気になりました。

ツールを使うことによる人の変化を設計する

Googleホームとかamazonエコーとかを使い出すと、機械が認識しやすいように話すようになる。Google翻訳を多用する友人は、Google翻訳が翻訳しやすいように日本語を書くようになると言っていた。

音声認識も自動翻訳も、便利なツールだ。でも、ツールは融通がきかない。プログラムで決められたこと以外のことはできない。音声認識も自動翻訳も、最近になってやっと精度がよくなってきたから実用レベルになってきたとはいっても、プログラムに決められたこと以外ができないのは相変わらずだ。だから、機械が認識しやすいように、人間側が行動を機械に合わせて最適化するようになる、というのは別に最近に限ったことじゃなくて機械といったツールを使うようになってから人類がずっと通ってきたことだ。

人が自分にとって便利にするために道具を生み出すが、その道具を使いこなすためには人はその道具に合うように自身の行動を変化させ道具に最適化する必要がある。程度の差はあれど、これは変わらない。

ITは人が使うツールだけれど、使ううちに人そのものが変わっていく。行動が変わる。行動が変わることで、身体が変わる。考え方や認知、認識、思考、感じ方も変わるかもしれない。

ツールを使ううちに人が変わる。でも通常は、ツールそのものの目的は設計されるけれど、副次的な、ツールを使うことによる人の変化までは設計されていない。

一方で最近は心理学、認知科学行動経済学での知見も増えてきて、またその共有も進み、ツールを設計する側にもこれらの知見を積極的に活用していこうというのが広まっている。そこで、ツールを使うことによる、人の変化も設計する、という向きも少しずつ出てきている。

こわい?でも、意図してもしなくても、ツールの利用によって人は変わる。どこまで設計できるのかは未知だけれど、望むとも望まぬとも、そちらの方向へ向かっていくんだと思っている。

そういうことに関心を持ったのは、数年前からこういった研究をしている研究者の話を聞いていたから。正確にはもやもやと感じていたことを、研究者の言葉によって言語化されて、ああそういうことだったのか、と腑に落ちた。だから、ひとつひとつの研究じゃなくて、ストーリー全体を見せたいなあと、結構長いインタビュー記事を2年以上前に書いた。

ただそれから2年以上経っても、ちゃんと体系化はされていない、ように思う。もやもやするんだよなー。もう少しこのあたり整理したい。

人工知能(AI)の射程とブームのゆくえ

人工知能(AI)ブームももう4−5年経っていますがそろそろ失速するんでしょうか。以前、日経・読売・朝日・毎日のそれぞれについて「人工知能」でキーワード検索(見出し、本文)をして引っかかった記事数の2010〜17年の推移を調べたことがあります。4紙中、日経の記事数のここ数年の増え方が凄まじいです。経済・ビジネスで特に注目されているということ。

月ごとではなく年ごとに集計しているので傾きは適当ですが、2014-5年に傾きが急になっています。2017年は年間2092本なので、1日5〜6本は「人工知能」と書かれた記事が紙面に掲載されていることになります。

で、ここでいう「人工知能」ってなんやねんというのは、議論しはじめると永遠に終わりませんが、少なくとも実務上(企業のビジネスであれアカデミアの研究であれ)は今何を指して「人工知能」と言っているのか、明確になっているといいんじゃないかなあと思います。

人工知能(AI)」ってなんやねん、というのは、目的次第で便宜上は定義をすることはできます。

まず、おそらく上記の日経の記事でももっとも多いと思われる、社会経済的に重要という点でのAIの定義(というか射程)は、次の3分類がリーズナブルだと思っています。AIといったときにIT全般、機械学習、深層学習のどれかに含まれる、という分類です。これら3点は、以下のようにそれぞれの部分集合で表せます。図は自分で適当に作りました。面積比に意味はありません。

 

誰が言い出したのかは知らないけれど、私が聞いたのは杉山先生だったか松尾先生だったか?覚えていないけれど、リーズナブルだなあとよく使っています。

一方でエマちゃんが以前プレゼンで使っていたAIの射程は、主にアカデミア研究者にとってのAIと、社会(企業)が期待するAIを明確に切り分けて考えましょうというのが問題意識だと認識しています。AIといったときに、既存のICTの延長にあるもの、深層学習に焦点をあてたもの、汎用人工知能など「まだ見ぬ技術」の3点があるということ。

図は私が適当につくったので面積比や円の位置には意味はありません。ポイントは、オレンジの丸は今の技術の延長線上にあるものではないということ。隣接はしていて、いつか既存の技術からそっちへ移行するかもしれないが、その目処や具体的な道筋は明らかではなく実現には不確実性があるというもの。AI研究者と非AI研究者がAIについて話す時、同じAIといってもこれらがごっちゃになっていることがよくある気がします。

いろんな方たちと話していて体感的にですが、ブームで注目を浴び十分に人口に膾炙したAIですがそろそろ具体的な「成果」が求められてきているように感じます。開発投資をしているお金を出す側からね。AI導入はどう役に立ったのか、どう儲けたのか、どう便利になったのか、どういう価値が生み出されたのか、という具体的な「成果」が求められている。「期待」ではなく。AIというバズワードによるPR効果でもなく。

今年来年くらいに具体的な成果が出てこないと今の機械学習・深層学習を中心としたAIブームは一気にしぼむ(人とお金が逃げ出す)んじゃないかなあと思ってます。囲碁をするAIとかじゃなくて。投資するからにはちゃんと役に立って稼いでなんぼなので。

一方で、AIは自動化・自律化のためのツールでありその意義付けとしての効率化・最適化は常に変わらず必要なものなので、ブームのゆくえに踊らされず着実に地道に継続的に開発投資をする体力と辛抱強さがあるところが最終的には勝つんじゃないかなあと思っています。

人工知能に関わるISO/IEC JTC 1国際標準化が始まるそうで

人工知能に関わる国際標準化がスタートするけど日本から意見をインプットするので検討メンバーを募集します、というプレスリリースが情報処理学会から1/10にありました。

人工知能に関わる国際標準化がスタート-情報処理学会

ISOの中でもITの関わる国際標準化を担っているISO/IEC JTC1内に人工知能に関する分科会を設置することが昨年10月に決まりました。で何をするのかというと以下の通りです。

最初に開発する規格は、人工知能に関連する用語と基本概念を記述する「人工知能の概念と用語」、機械学習技術を用いて構成するAIシステムや機械学習フレームワークを記述する「機械学習を用いた人工知能システムのフレームワーク」の二つです。まずは、これらの人工知能に関わる基本となる規格を開発し、JTC 1内外の標準化委員会に対して人工知能の利活用に関する規格開発の基盤を提供することを目指すとともに、人工知能に関する新たな標準化テーマの探索が進められます。

 で、情処では日本から意見をこの分科会にインプットしたいということ。情処の検討会の活動内容は以下の通りです。

・新しい作業項目、規格案等のレビューと日本としての意見発信
・ISO/IEC JTC 1/SC 42へのコメント提出と会議参加
・当該分野での新しい規格項目の洗い出しとISO/IEC JTC 1への提案活動

メンバー公募でプレスリリース??とかいろいろツッコミどころがありますがまあいいや。

なお、ISO/IEC JTC 1/SC 42(人工知能にかかる分科会)には日本からのメンバーは入っていないのよね。

ISO/IEC JTC 1/SC 42 - Artificial intelligence

ISO/IEC JTC 1/SC 42の情報はあんまりないけれど、昨年10月の分科会設置のときの議事メモみたいなのと、今年4月に会議するよーというのはここでわかります。

ところで、人工知能の国際標準化としては、主に通信規格で有名なIEEEでは、AIなどの自律的な機械の設計において倫理的に配慮した設計を検討する委員会を作っていて報告書を作成中です。

ethicsinaction.ieee.org

これが直接IEEEでの標準化になるというのではなく、標準化活動に参照されるという形で活用されます。今のところ昨年末に出たバージョン2が最新版。

こっちの方は日本ではエマちゃんの個人活動からのなぜか公式になったワークショップシリーズをやっていて、ここでファクトや意見を集約してIEEEにインプットしています。これ私も手伝っていて、前のバージョン1については以下の通り。

kaetn.hatenablog.com

バージョン2では1の8分野に5分野が加わって13分野に検討されています。こっちに関しては2〜3月にワークショップシリーズをします。

サマリーの日本語訳はIEEE日本事務局の方で作っていてここからDLできます。