コグニティブ・コンピューティングとデータサイエンス授業とのいい関係
文系大学の理数系教育への思い
成城大学は、文科系大学の中では早期にデータサイエンス科目群の授業を開始し、今年(2018年)ですでに4年目になります。
今年度は概論、統計学を中心とした入門、応用など6科目群全体で、前・後期合わせて延べ300名近い受講生があり、人気の科目群のひとつになっています。特に、日本IBMの社員がリードして実施してきた講義「データサイエンス概論」は、開始当初の2015年度から始めました。
これは、学校法人成城学園と日本IBM東京基礎研究所が “国際社会で活躍できる地球市民” の育成などを目指した当時の包括協定(2014年3月12日締結)に基づく事業であったと同時に、第2世紀の成城教育改革の柱の一つに掲げた「論理的思考を養う理数系教育」の実践でもありました。
「人間とコンピューターの新たな関係を築くビッグデータの活用」と副題がつけられたこの「データサイエンス概論」の講義は、成城大生全学部全学年を受講対象とした全15回の前期開講科目として始まりました。
当初は各回の講師をIBMの社員が務めるオムニバス形式で、ビッグデータに関する様々な技術や適用事例が授業で紹介されました。
私は、開始前からIBM側のリーダーとして、この授業のプロデュースとコーディネーションを担当するとともに、自ら教壇に立ってIBM Watson をデータサイエンスの授業の中で様々な形で紹介してきました。
私のIBMにおける定年にともない、今年の4月からデータサイエンス科目群の特任教授として成城大学に着任しました。
成城大学は理系学部を持たない文系大学ですが、論理的な思考、科学的な思考を身につける教育の場としてこの講義「データサイエンス概論」を開講しました。
SNSやスマートフォンという身近な話題からその背後にあるビッグデータの存在や価値を知ることで、自分たちの生活と社会の関わりを改めて認識し、また、ビッグデータの利用技術や適用技術を広範囲に学び、それらの利点や問題点を理解して初歩のデータサイエンス知識を身に付けることで、文系の視点で科学を考えられる人材、あるいは科学的視点で文系の専門分野を考えられる人材の育成を目指しています。
データサイエンスは理科系の分野と思われがちですが、実は社会科学のためにとても役に立ちます。
次世代の学生に、経済・文芸・教育・法学などの多岐にわたる重要で複雑な社会問題を解決するにあたって、データサイエンスがいかに強力なツールとなるかに気付いてほしいという願いもあります。
次の図は、私が考えるデータサイエンスの要素です。「データサイエンス概論」の授業では、コンピューター・サイエンスを中心に、エンジニアリング、コラボレーションの領域のトピックも扱います。
IBM Watsonが解放するデータ分析の制約
文系の学生にとって、これまで特に難しいと感じていたのが、自然言語で記載されたデータの活用だったと思います。
例えば、フィールドワークで得た多くの評判コメント、それぞれの地域の強み・弱み、パフォーマンス評価などは、金額のような数値ではなく、テキストで記載されていることがほとんどです。
これらの情報は、今までは学生が読み、理解して分析されてきました。したがって、学生自身が扱い切れる分量のデータのみで我慢していたようです。
大量の自然言語のデータをひと纏めにして、コンピューターが整理できるということは、以前は夢にも思っていなかったようです。
IBM Watsonが自然言語の理解を代行し、まとめ、エッセンスを簡単に抽出してくれるとしたらどうでしょうか?
IBM Watsonはデジタル化された自然言語を人間よりも早く整理することができるので、今まで諦めていたデータ分析の制約から解放されることになります。
IBM Watsonは人を助ける拡張知能
Watsonの名前自体はすでに多くの人にビジネス向けのAIとしてよく知られていると思います。
Watsonという人名のような名称や、数年前に世界的な俳優や著名人とのCMの共演もあって、Watsonはいわゆる「強いAI」と言われる「汎用人工知能」と思ってくださる人も少なくありません。
汎用人工知能とは、短く言えば人間のように受け答えでき、高度な課題解決を実現する「人間のような知性」を実現する人工知能だと思います。
しかし、実際のWatsonは、汎用人工知能ではなく、IBMが持つさまざまなAI関連技術全体に付けられたブランド名で、その技術の中心にあるのが自然言語処理です。
IBMでは30年以上にわたって自然言語処理を研究してきており、その拠点は日本にもあります。
つまりWatsonは、日本IBMの自然言語処理技術の流れをくんでいます。
また、IBMではWatsonを「コグニティブ・コンピューティング」と称しており、人工知能やAIとは表現していません。
その理由のひとつは、Watsonはあくまでも「人間の専門性を拡張する技術」であり、知性を持った汎用人工知能を目指すものではないからです。
そうした理由もあって、IBMのジニー・ロメッティ会長・社長兼CEOは以前、Watsonを「Artificial Intelligence」ではなく「Augmented Intelligence」(拡張知能)を省略した「AI」だと語っています。
IBM は創業から100年を越えますが、2代目社長であり、初代社長トーマス・ジョン・ワトソン・シニア(Thomas John Watson, Sr.)の長男であるThomas Watson Jr. も、“IBMのマシンは、使用する人間が持つ能力を拡張するツールに過ぎません( Our machines should be nothing more than tools for extending the powers of the human beings who use them.)”とはるか昔に語っています。
IBM Watson をデータサイエンスの授業で体感させたい
コグニティブ・コンピューティングもデータサイエンスも、人を助けるツールという点で共通点があり、「データサイエンス概論」の授業の中における親和性も良いと考えています。
授業のトピックは多岐に渡りますが、最初の4回くらいは私が IBM Watson の誕生の歴史から応用までをハンズオンも含めて展開しています。
「社会やビジネスを大きく変える第3世代のコンピューティング」と題してIBM Watsonを位置付けることで、受講生の興味を引き出すとともに15回分の学習の動機付けも行っています。
授業はPCルームを使用し、多い時は60名を越える受講生がありますが、講義に加えて一斉にPCを使うハンズオンも行います。Watson サービスは本来 API (Application Programming Interface; アプリケーションをプログラミングする段階で便利に使えるツール群)として提供されるため、通常は自分でプログラムを書いて、その中で 必要なWatson API を呼び出すことになります。
しかし、プログラミングに縁のない学生にとっては、いきなりクラウドに繋げて Watson API を使うのは意識的にハードルが高いので、先ずは簡単に使えるWatson のデモ用Webアプリを使って、テキストで書かれた情報を分析したり、ツイッターの内容を分析したりします。
これらの経験により、ビッグデータに直に触れ、AIによる分析が簡単にできることを体感させます。
たとえば、テキストから著者の性格を推定するPersonality Insightsは、言語学的分析とパーソナリティー理論を応用し、テキストデータからその著者の特徴を推測します。
文系の学生にとっては、テキストの内容が定性的ではなく、定量的にも評価できることを知るだけでも大きな収穫のようです。
また、授業の中では最近のAIに関する記事も紹介しているので、企業の採用にAIを活用してエントリーシートを分析しているなどの身近な話題には興味津々で、その技術の一部を自分でも操作できることが自信につながるようです。
4年生の受講生は、自分の就活エントリーシートを Personality Insights にかけて、その結果をもとにもっと積極的に見えるようになど自分のテキストに改良を加えています。
何といっても、分析に30秒とかからない速さなので何度でも改良がしやすい点と、この速さを体感することで企業もこの技術を積極的に活用したいだろうなと学生も納得できる点が教育効果です。
4回程のIBM Watson の理解とデモ用Webアプリを使ったハンズオンの授業の後は、IBM Cloud に実際にユーザー登録して、Watson API を使って自分でWebアプリを作る体験を3回程続けます。
無料で実施したいため、IBMのAcademia向けのプログラムを使っています。
授業では、コーディングなしで進めたいため、ビジュアル・プログラミングのNode-REDを使って、地図アプリなどを作成してみます。
これらのハンズオンは、昨年の10月までは IBM Bluemixという名称のプラットフォーム上で実行していました。
その後、IBM Cloud にブランド名が統一されましたので、旧Bluemixと言った方が読者の方々にはわかりやすいかもしれません。
ハンズオン資料ももちろん作成するのですが、IBM Cloudへの登録を授業の事前に済ませるのではなく、教室から皆で一斉に行います。
そうすることで、登録時のトラブルを少なくするとともに、たとえうまくいかなくてもひとりではないので、途中で諦めることがなくなります。
また、デモ用Webアプリですでに練習しているので、Cloud 使用への意識的ハードルが下がっているのも利点です。
受講生が多いので、ハンズオン中は前後左右の学生同士で助け合って進めていく体制を取っています。
昨年までは社員を増員して、教室内を巡回して困った時は個別にサポートしていたのですが、かえって進行が遅くなることがわかり、今年前期は私ひとりでリードしました。
近所で解決しない時は、その問題を皆の問題として汲み上げて、教壇上から示す方法を取っています。
また、授業中にGitHub、Qiita、IBM developerWorks、Kaggleなどのコミュニティーも随時紹介しているので、受講生は授業中のみならず、将来も先行例や問題解決の方法を探すことができます。
毎回、授業の最後に200~400字程の感想文を受講生に書いてもらっていますが、実際にAIを体感することで新たな気付きが生まれるようです。
代表的な感想文をふたつ、次にご紹介させていただきます。
・「よくメディアなどでAIに仕事を奪われると言っているのを聞いて少し将来が不安だったのですが、この授業を受けて、まだまだAIは人間には追いつかないということがわかり、安心しました。また、メディアなどの情報はすべてが正しい訳ではなく、自分でその情報が正しいものか正しくないものかを見分ける必要があるということを再認識できました。授業の中で紹介されるアプリをこれから活用していき、便利な暮らしをしていきたいとも思いました。」
・「今回までのAIについての授業で、AIによって人間の仕事がすべて取って代わられてしまうといったことがないことを知った。人間では時間がかかり過ぎてしまう作業を、データを学習したAIが手助けし、効率よく作業を進めていくといった利用法が多い。あくまで手助けするものであって、最終的な判断は人間がするものである。両方の力でより良いものにすることができるなら、それが一番だと思う。」
上記の一連のWatson関係の授業の後は、AIやビッグデータとの接点があるサイバーセキュリティー、ソーシャルメディア、画像認識、音声認識などの活用の拡がりに加えて、
・医療分野における最新AI技術の活用
・震災時におけるソーシャル・ネットワーク(SNS)の効果と脅威 ― 評判・風評分析の重要性
・社会インフラ(金融・交通など)のシステムを支え続けるメインフレーム(汎用大型コンピューター)
・革新的な技術 ― ブロックチェーン
・IBM Watson Analytics (Watsonのガイド付きデータ分析と自動データ可視化機能)の世界
などのスペシャル・トピックも都合により展開しています。また、デザイン思考、プロジェクトマネジメント、アイデアソン・ハッカソンなどの紹介も時間の許す限り盛り込んでいます。
これらの後続授業でもWatsonに関連する内容が多く含まれるので、前半の授業でWatsonを体感しておくことは、後半の授業内容を理解する上でも役に立っています。
これからも
この4月から大学で生活するようになって、日々学生と接しているうちに自分の気持ちがだいぶ若返ったと感じています。
それで、自分が学生であった40年程前のことをよく思い出すようになりました。
私が学生だった頃は、「情報」という言葉がまだあまり一般的ではなく、先生も何となく胡散臭いとおっしゃっていました。また、大学院の人工知能に関する授業でも、ひたすらブール代数がお相手でした。
人工知能とブール代数というダブルの聞き慣れない単語に加えて、いったい何の役に立つのだろうかと自分はいつも不安であったことを思い出しました。
今の学生はスマホの操作が得意なのに、AIと聞くと二の足を踏むようです。
私の授業の初回でいつも学生に聞くのですが、高校でも「AIに人間の仕事は将来奪われる」とだけ教わってきた学生がとても多いと感じます。
実体がわからないものに漠然とした不安を感じ、スマホ操作は得意なのに、AIの利便性を活用できていないのはもったいないと思います。
考えてみれば、私が学生の頃は、今のスマホの溢れる社会を全く想像できませんでした。また、今もスマホに自分の仕事を奪われていると感じたこともありません。
AIのせいではなく、コンピューターの性能の進歩とともに、人間の生活も徐々に進化していきます。ただそれだけのことと私は思います。
コグニティブ・システムは、徐々に人間の脳の動きの多くをシミュレートして、複雑なビッグデータを読み解いて、世の中の極めて複雑な問題の解決を支援できるようになっていくでしょう。
そういう進歩・進化の中で、漠然とした不安に駆られて踊らされる人間ではなく、自分の力で分析・判断して行動できる学生を育てていきたいと強く思います。
今年は教え始めた最初の1年生が4年生となり、就活しています。
うれしいことに、その中にはICT業界への就職にチャレンジしている学生が何名か出ました。
また、今年の学生の中にも、この授業を受けてICT業界など自分の将来の就職先の選択肢が広がった気がすると述べたり、将来プログラマーになりたくなったのでプログラミングも勉強したいなどの要望を出す人もいます。
大切なのは、学生が自らやってみたいという気が起きるように、実体がわかるような授業を工夫することと思います。
ありがたいことに、授業で学んだアプリを友人や家族にデモしてくれる学生もいます。
これからはコーディングを含めたプログラミングの時間や、ロボットを動かす時間も作って、さらなる学生の興味と動機を引き出していきたいと考えています。
以下に、文中の用語に関する情報とWatson デモ用 Webアプリの例を記載させていただきました。お時間のある時に覗いていただけましたら幸いです。
【文中の用語に関する情報】
・IBM Cloud: https://www.ibm.com/cloud-computing/jp/ja/
・IBM Academic Initiative : https://developer.ibm.com/academic/
・Node-RED: https://nodered.org/
・GitHub: The world’s leading software development platform. : https://github.com/
・Qiita( A social knowledge sharing for software engineers) : https://qiita.com/
・IBM developerWorks( IBM’s official developer program offers tutorials and training, trials and downloads, and access to expert answers on IBM and open standards technologies) : https://www.ibm.com/developerworks/jp/index.html
・Kaggle( Your Home for Data Science. Kaggle is the place to do data science projects): https://www.kaggle.com/
【Watson デモ用 Webアプリの例】
いずれもマニュアルなしで、簡単にお使いいただけると思います。IBM が一般の方に公開しているデモ用Webアプリで、もちろん無料です。いずれも IBM Cloud を起動しないで、Web 上でそのまま試すことができます。これらのデモを動かすWebブラウザは、Google Chrome もしくは Firefox をお使いください。また、スマホやパッドでは動かないことが多いですので、ノートブックPC以上の能力のPCにてお試しください。
Personality Insights: https://personality-insights-demo.ng.bluemix.net/
Tweets on the Map: https://totem.mybluemix.net/
Text to Speech: https://text-to-speech-demo.ng.bluemix.net/
Speech to Text: https://speech-to-text-demo.ng.bluemix.net/
Visual Recognition: https://www.ibm.com/watson/services/visual-recognition/demo/#demo
Conversation: https://conversation-demo.ng.bluemix.net/
Tone Analyzer: https://tone-analyzer-demo.ng.bluemix.net/
Natural Language Classifier: https://natural-language-classifier-demo.ng.bluemix.net/
Natural Language Understanding: https://natural-language-understanding-demo.ng.bluemix.net/
Discovery: https://discovery-news-demo.ng.bluemix.net/
【免責】
・本稿は、筆者の独自の見解を反映したものです。記載内容は情報提供の目的のみで提供されており、いかなる読者に対しても法律的またはその他の指導や助言を意図したものではなく、またそのような結果を生むものでもありません。
・本稿に含まれる情報については、正確性を期するように努力しましたが、「現状のまま」提供され、明示または暗示に関わらずいかなる保証も伴わないものとします。
・本稿の記載内容は、執筆時点である2018年7月1日現在において知り得る範囲の情報です。本稿に記載されたURLやソフトウェアの内容は、将来予告なしに変更される場合があります。
・本稿に記載されているデモ用Webアプリは、特定のPC環境設定において再現される一例です。
・IBM、IBM Watson、Watson は、世界の多くの国で登録された International Business Machines Corporation の商標です。