Webディレクターtsushan’s blog

都内で大手アパレルのWebディレクターとして勤めているTsushanです。興味関心がある分野のアウトプットを増やすためブログを書いています。 当分はAIについて書いていきます。

【人工知能】AI事例 報道・AI記者(海外事例)

AI事例を調べるのが面白くなってきたTsushanです。

 

さて、今回はAI記者の海外事例についてです。

国内事例についてはこちらからご覧ください。

【人工知能】AI AI記者(国内事例) - Webディレクターtsushan’s blog

 

目次

 

事例①AP通信 さまざまな記事を自動生成

AP通信は2014年からAI記者を導入しています。AI記者の老舗メディアです。

2014年7月1日(火)に公開されたニュースウィーク日本の記事では、AP通信のAI記者について以下のように書かれています。

同社は7月から、企業の四半期決算のニュースはコンピューターが自動で執筆した記事で配信するという計画を発表した。(中略)

ビジネスニュースを人間の記者が書く必要がなくなり、「ワードスミス」が自動で執筆できるようになる。さらには配信する四半期決算関連の記事の本数も、現在の300本から4000本以上に増やすことが可能になるという。(中略)

これによって記者は、関連するフィーチャー記事の質の向上に集中できるようになる。AP通信は、この技術の導入で記者は「自らの担当分野の記事を書いたり、ネタ元を発掘したりすることに多くの時間が割けるようになる」とする。「顧客に向けた企業の決算報告書関連の分析記事も今までの10倍に増やせる」

 

詳細記事がみたい人は、以下のサイトを確認ください。

AP通信が手に入れた世界最速の記者 | ワールド | 最新記事 | ニューズウィーク日本版 オフィシャルサイト

AP通信「野球マイナーリーグの報道にもロボットを導入します」 | ROBOTEER

 

この内容、日経のAI記事の発表の約3年前の内容になっています。しかも、さらに驚いたことに、記事によるとAP通信はすでに数年前から、ローカルスポーツカテゴリでのAI自動化を始めていたそうです。*1さすがアメリカですね、技術とビジネスの組み合わせがうまい。

 

そして、2017年にAP通信はAI記者(wordsmith)を導入してからの結果を以下のように発表した。*2

このように記事を“自動化”する最大の利点は、記者を反復的で時間のかかる作業から開放し、分析や新たなニュースソースの開拓など、より高度で創造的な業務に時間をさけるようになることです。これによって記者の可処分時間を20%ほど増やすことができた

 利点は他にもある。数字の書き間違いを劇的に減らせたこと、また出稿量を圧倒的に増やせたことだ。AIを導入する以前、AP通信が配信していた企業の決算記事は四半期ごとに300本程度だったが、現在はその12倍に達する。さらに、人的資源の制約からこれまでカバーできなかったニッチな分野の出来事も記事にすることができ、例えば2016年から配信が開始された野球のマイナーリーグの試合結果は今やAP通信の新たなブランドになっている

 

結果がちゃんと出ていて、AI記者の優良事例ですね。また同社は、同じAIにSNS投稿を分析させ、それを元に記事を書かせているという。※ソース同上

 

事例②ワシントン・ポスト

ワシントン・ポストは2016年のリオ・オリンピックのタイミングから、AI記者の導入を進めています。実際リオ・オリンピックでAI記者が書いた記事は、300本以上と言われています。

米紙ワシントン・ポスト、リオ五輪に「AI記者」投入 :日本経済新聞

ワシントン・ポストが使用しているAIエンジンは、自社開発のヘリオグラフ(Heliograf)と呼ばれるもので、現在ではさらに幅広い記事の作成に使われています。具体的には、選挙結果やマイナースポーツを記事にし、50万のアクセスを獲得しています。(2016年11月時点、単月の数値)

ワシントンポストがこのAIを導入しているには、明確な目的を2つ掲けています。

1つ目が、同誌の読者数を増やすこと。ニッチの記事で、数少ないが多くの読者数を手に入れることができるから。

2つ目が、記者を単純作業から開放して、より価値の高い記事作成に時間を割いてもらうこと。

単純明快ですね。

ワシントンポストの戦略部分についてとても詳しく書かれている記事があったので、興味ある方は見てください。

「AI記者」の進化が、読者を増やし、ニュースルームを効率化する:『ワシントン・ポスト』|WIRED.jp

 

事例③ニューヨーク・タイムズ

2014年より結婚記事を自動化しているそうです。(すみません、ソースがちゃんとみつかりませんでした)

またニューヨーク・タイムズはEditorというツールを開発し、コンピュータが学習しながらも、編集業務の流れの中で、人がAIの学習インプットを行うというアプローチを取っています。

http://nytlabs.com/projects/editor.html

NEW YORK TIMES LAB | EDITOR (2015)

このツールによって、記者の編集作業がそのまま機械学習のインプットとなり、一方で、ツールがタグの自動修正や注釈の提示など、業務負荷を下げるサポートを行うそうです。これまで記事単位でしか設定されていなかったタグが段落単位で設定され、複数の記事の一部の段落を構造化して組み合わせ、記事作成のサポートをするなど、これまでは出来なかったCMS機能の強化につながる可能性があります。

 

事例④LAタイムズ

ロサンゼルス・タイムズは2014年から地震速報を自動で行っています。地震が起きてから記事を配送するまで2~3分という、圧倒的な短い時間で行っているそうです。

ロサンゼルス・タイムズ紙で地震速報に使われているのは、「クウェークボット」という社内ソフト。米地質調査所(USGS)から提供されたデータを分析し、アルゴリズムに従って自動的に記事を生成する。震動が記録されてからわずか3分で記事を作成、同紙のウェブサイトに掲載する。*3

 

こうしたAI記者による自動化取り組みが、近年活発に海外で行われています。対して日本は、ようやく去年から色々動き出して来ている感じでやや遅れを取っている印象をうけます。 

今後、報道のAI記者から目が離せませんね。

また随時記事を更新していきます。

よろしくお願いします。

 

関連記事:

tsushan.hatenadiary.jp

【人工知能】AI事例 報道・AI記者(国内事例)

束の間の休みも終わろうとしている中、今日から事例も溜めるようにしていきます。

 

第一弾はAI記者の国内事例についてです!

 

目次

 

事例①中部経済新聞 70周年を祝う記事

初の国内事例なので知っている方も、多いのではないでしょうか。(知らなかった、という方は心配要りません。自分も恥ずかしながら最近知りました 笑)

2016年11月1中部経済新聞に「この記事、AI記者が書きました。」*1という記事が掲載され、多くの人に衝撃を与えました。

 

該当記事内容をフルで読みたい方は、以下のリンクからご覧になってください。

データセクション、日本初のAI記者による新聞記事の執筆に技術提供 | データセクション株式会社

 

このプロジェクトが発足された経緯として、70周年を迎えた中部ブロックの経済紙としてより新しく面白い情報提供にチャレンジしていくその第一歩に、経済紙、新聞という歴史ある媒体に最新のテクノロジーであるAI(人工知能)を採用して新聞記事生成を行おうというものでした。

そのためこの記事の内容は、中部経済新聞が創刊され70年、その歴史の振返りと、これから中部経済新聞はどういう風に進んでいくのかを、中部経済新聞記者風にしたものです。

記事の生成方法は、中部経済新聞の記事ページ(以下リンク)に記載されていましたので引用。

本プロジェクトは、株式会社ビットエーがコーディネートを担当、データセクション株式会社が設計・開発したアーティクル生成AIへ、中部経済新聞社が自社の過去記事データをAIの学習データとして提供しています。

本プロジェクトの実施に関して、AIに過去の大量の新聞記事を読み込ませ、中部経済新聞の記者の文体等を学習。そして、そのAIに冒頭の何文字かを指定し(例えば、「70年代」など)、過去の新聞記事データを使い、その後につづく文章を生成しました。 

この記事を読んでいくと、文末表現ですます調の混在や、誤字などが所々目にすることがありました。でもあえてそのまま残すことでAIの課題点を明らかにしつつも、人工知能の可能性を感じさせる内容となっているようです。正直ですます調以外、そんなに気になる所は、あまりありませんでした。それよりも、もう技術の進歩がここまで来てるのかと言う驚きが自分の中に強く残りました。

 

このAI記事に関する詳細のレポート記事もたくさん出ているので、興味ある方はまた自分で調べてみてください。

  

事例②日本経済新聞 決算サマリー記事

2016年11月1日に、中部経済新聞のAI記事が公開され、その2ヶ月後の2017年1月に、日経新聞からこんな驚く発表がありました。

 

「決算サマリー記事は、AIに書かせる」

AIを活用した「決算サマリー」配信スタート : 最新情報 | 日本経済新聞社

 

印象としては、WTF。ついに、日本もここまで来たか!!!というような感じですね。

企業が実際に決算を公開してからわずか数分で、AIがそれに関する記事を生成。さらに人の目を通さず決算記事は公開されるようです。とうとう人がAIに仕事奪われ始めたのか〜、と記者たちが悲観しているかと思うと、蓋を開けてみるとそんなことはないようです。以下の記事に、実際に日経記者の声が載っていますが、それらによると、社内からは仕事をサポートしてくれて、大いに助かっているし、これからも期待したいという声が多かったようです。実際、決算サマリーは、ほぼ定型文でかけるし、退屈なので、人がやらなくてもいいねって、言われてみればそう感じてしまいますね。

“AI記者”による省力化と効率化の行く先は――日本経済新聞社の働き方改革 (1/3) - ITmedia エンタープライズ

 

ちなみに、このAI記者は、2017年1月25日から5月26日までの期間に発表されたほぼすべての国内上場企業の決算発表(計6787本)を記事化したそうです。また一日最大の記事生成数を1000件と、恐ろしいですね。(一人の人間が頑張って15記事/日、みたいです。)また、サーバーが落ちないように、AWSを使用しているみたいです。うん、納得です。

ASCII.jp:1日1000本の記事を書いた日経の“AI記者”、その基盤にAWS|事例に厚みが増したAWS Summit 2017レポート

 

さらに調べて行くと、詳しい記事生成プロセス画像が出ていたので、引用。*2 興味ある方は別タブで開いてみてください。

https://techcrunchjp.files.wordpress.com/2017/01/e4babae5b7a5e79fa5e883bde68abde587bae38395e383ade383bc.png

 

この日経のプロジェクトはもともとは、2015年3月に、米国のAP通信社が記事を自動作成するサービスを開始に当って、それに危機感を覚えた社内若手エンジニア同士の雑談をきかっけに、決算サマリーの開発プロジェクトが始動したとされいます。2年遅れではありますが、もっともっとこれからもAIを活用した事例を作ってほしいですね。

 

事例③西日本新聞 天気記事

天気予報って、大抵いつも似たようなこと言っているよね、って言われてみると、「確かに」と頷いてしまいそうですよね。

はい、実はそうなんです。

天気予報記事やアナウンスには、似たようなテンプレが存在しています。今回は、西日本新聞がそこに目をつけました。

2017年1月西日本新聞は、「ロボットに新聞記事を書いてもらおう」と題して、AIを記事執筆に活用した試みを公開しました。同社が利用したのは、米国のAutomated Insightsが開発したAIです。

細かい句読点などの設定は、西日本新聞側で行ったそうですが、エンジン自体は既存の海外のものを使用しているので、なんだかもったいない気が私はしています。(日本のスマートスピーカー勢を思い出します。。)

ただ、この記事生成なんと1秒でできるそうです。

もうこれから使わない手はないですね。

ちなみにこちらが、AIが作成した記事内容です。(2017年1月10日の福岡県福岡地方)

 おはようございます。今日から新学期がスタートする学校が多いと思います。1月10日の九州北部(福岡県福岡地方)の天気予報は、晴れ時々くもりでしょう。降水確率は午前、午後ともに10%でしょう。傘は持たなくても大丈夫です。

 日中の最高気温は11度、最低気温は6度となる見込みです。前日より最高気温は1度低く、最低気温は4度低いでしょう。平年と比べて最低気温は2度上回り、最高気温は平年並みでしょう。

 風は北西の風後北の風、海上では後北西の風やや強くなるでしょう。日の出は午前7時23分。日の入りは午後5時29分です。

 今日のお出かけには、コートを着ないと寒いでしょう。今夜の夜空は、よく見れば星が現れるかもしれません。

ちょっと変なところもありますが、初見の大抵の人は、この作者日本語ちょっと下手やな、と思うだけで、AIが書いたなんて思わないでしょうか。 

AIが新聞記事を書いてみた 執筆1秒、でも設定は人間|【西日本新聞】

これからもAI記者にはもっと、活躍して記者たちを助けてほしいですね。

 

さて、国内編は一旦ここまで、次回はAI記者海外編について書きます。

最後まで読んでいただきありがとうございました。

 

関連記事:

tsushan.hatenadiary.jp

 

【人工知能】AI 演算装置 CPUについて

先程G検定申し込んだTsushanです。合格するぞ〜

 

今日は少し寄り道して、CPUについて。過去の記事でも書いたが、CPUはPCを司る演算装置で、パソコンでもっとも重要なパーツです。

 

実は今まであまりCPUをちゃんと調べたことがなかったですが、量子コンピューターの勉強をきっかけに少し知識がついたので、CPUの特徴、その中でもコア、スレッド、クロックについてまとめます。

 

ではまず特徴からです。

価格コムでCPUについて具体的な説明を見てみると以下のように書かれています。*1

いわばパソコンにおける頭脳の役割を果たします。具体的には、パソコン内部における、メモリーに記憶されたプログラムの実行です。マウスやキーボードなどの入力装置や、ハードディスクやメモリーなどの記憶装置からデータを受け取り、演算・加工したうえで表示装置や周辺機器などに出力します。このため、CPU自体は小さいチップですが、パソコンの性能を大きく左右します。近年は、4Kなどの高解像度映像や3Dゲームといった高度な演算処理を必要とするソフトウェアが多く開発されたことにより、クロック周波数の向上だけでは対応できなくなってきたため、1つのボードに2つのCPUが乗った2コア(デュアルコア)、同じく4つの4コア(クワッドコア)などのマルチコアを採用する傾向にあります。

 

CPUは基本的に「複雑で連続したif~else~構文」が得意です。そのため、上記のハードディスクやメモリーなどの記憶装置からデータを受け取り、演算・加工したうえで表示装置や周辺機器などに出力が簡単にできます。

 

PCとの相性もありますが、基本的にはCPUの性能が高ければ高いほど、複雑な計算が処理でき、引用先にも書いたように、4Kや3Dゲームが読み込みのスピードなどが気にならないようになります。

 

次にコアについて。

またほど説明しますが、windowXPまでのCPUは基本1コアで一つの頭脳しか持ちえませんでした(シングルコア)。そのため、なるべく1コアになるべく速い処理速度をもたせて、たくさんのタスクを行ってもらおうとして、開発に力を入れた部分がクロック周波数です。これについてもまた後ほど説明します。

 

Windowが必要とする処理タスクが重くなるにつれて、シングルコアでは、CPUへの負担が重くかかり過ぎました。そのため、デュアルコアというものが開発されるようになります(2005年)。イメージは、今まで一人で作業をやっていたのが、二人で別々の作業を行っているということです。つまりスピードは2倍になります。それは、例えば1つのコアがchromeをコントロールしていて、片方がエクセルを使っている感じです。これは、いままでシングルコアでもできていたことですが、デュアルになるとよりスムーズにアプリの切り替えや、一つのアプリでも読み込み時間がはやくなったりします。

 

現在このコアは、デュアルだけではなく、クワッドコア(4コア)、オクタコア(8コア)なども開発されています。オクタコアについて詳しく知りたい方h、こちらの参照先にの記事を見てくださいね。*2

 

次は、スレッドについて。

現在CPUのスペック表示では必ずと言っていいほど、スレッドが記載されています。

例えばこんな感じです。

 

2コア/4スレッド

 

ここでのスレッドの意味は、同時にいくかの仕事をできるのかということです。

2コアは二人と先ほど言いましたが、スレッドはその人達が同時にいくつの仕事ができるのかという指標です。

例えば上記の例だと、2人で同時に4つの仕事ができます。

では、以下のはスペックは何個仕事を同時にできることを意味しますか?

 

2コア/2スレッド

 

はい、これはそれぞれ一つの仕事しかできません。

つまり、同じコア数なら、スレッドが多ければ多いほど同時にできる仕事が多くなり、メモリなどに負担をかけないでできるということを意味します。

 

次は、クロック周波数について

現在のこのクロック周波数も、CPUのスペック見る際に見られるものですが、優先順位は上記の2つコア数とスレッド数に負けます。

優先順位のイメージとしては、こんな感じです。

 

コア数>スレッド数>クロック周波数

 

2つのCPUがあり、コア数とスレッド数が引き分けならクロック周波数の高いものがスペックが高いということになります。

クロック周波数は、1秒間に処理する回数のことをいいます。

 

1Hz:1秒あたり1回
1Khz:1秒あたり1000回
1Mhz:1秒あたり100万回
1Ghz:1秒あたり10億回
1Thz:1秒あたり1兆回


2017年現在、もっとも主流なのは「Ghz」(ギガヘルツ)です。20年くらい前は「Mhz」(メガヘルツ)が主流だったのですが、AMDIntelが熾烈な競争を繰り広げ、CPUのクロック周波数が1Ghzを突破した結果、「Ghz」が一般的になりました。

 

今までは、10年単位で見るとクロック周波数すごい進化をして来ましたが、しかし近年その進化も頭打ちになりつつあり、クロック周波数よりもできるだけコアをたくさん載せたほうが開発効率はいいし、実際に使用する際のスペックも高いということになり、現在開発優先度はそんなに高くないというのが、実情です。

 

一旦ここまでが、CPUについての簡単な説明でした。

CPU開発で争っているのは、インテルAMDという会社です。

価格コムの説明が分かりやすかったので、そのまま引用します。

インテル

初心者からプロまでフォローする、世界シェアNo.1メーカー
世界シェアNo.1の半導体メーカー。WindowsMac関わらず、多くの製品にインテル製のCPUが搭載されています。家庭でネットを楽しむだけのライトユーザーから、グラフィッカーやプログラマーを満足させるスペックのCPUをブランドに分けて幅広く展開しています。いつの時代も安定した製品をリリースしており、迷ったときはインテル製品を選べば問題ありません。

 

AMD

優秀なグラフィック性能とコストパフォーマンスが強み
シェアではインテルに劣るものの、グラフィック処理性能に高い評価を得ており、4Kなどの高解像度の映像や、3D映像をCPUに負荷をかけることなく滑らかに再生できます。また、価格が安いという特徴があり、コストパフォーマンスではAMDに軍配。そのため、コスパ重視の自作派やオーバークロックで運用する玄人たちに絶大な人気を誇っています。 

 

これらの会社についてさらに詳しく知りたい方は、自分で調べてみてください。

 

ただ、過去の記事でも伝えましたが、CPUはあくまでPCを司る演算装置で、計算に特化にはしてない。人工知能で必要とする計算量をCPUは満たすことができません。

そのため、現在GPUやTPUなどが、機械学習などに広く使われています。

 

次回は、さらにGPUについて深く見ていきます。

最後に、自分がCPUを調べるに当って参考になったサイトを複数添付します。

興味ある方は、見てみてくださいね。

 

ではまた。

 

CPU参考:

【CPUの基本】図解で分かりやすい「クロック周波数」の意味とは? | ちもろぐ

【CPUの基本】図解でよくわかる「マルチコア / スレッド」の意味 | ちもろぐ

価格.com - CPUの選び方

 

過去の記事:

tsushan.hatenadiary.jp

【人工知能】AI 演算装置の変化

最近仕事でGWが潰れてしまったTsushanです。

AIの勉強が全然思うように進められてない。

 

今日は、演算装置の変化について。

 

過去の記事の中で、AIの技術的な進化は、ディバイスやインターネットが普及してきたからということを述べました。そしてそのディバイス(演算装置)のところがこの量子コンピュータに当たる。

 

最初にざっくり言うと、AIに使われる処理装置は以下のように変わってきました。

 

①汎用演算装置→②画像処理用演算装置→③深層学習用演算装置

 

演算装置が上記の変化で、機械学習、その中でも深層学習の計算が格段に速くなりました。ではそれぞれ一つずつ見ていきましょう。

 

①汎用演算装置

CPU

みなさん、CPUはご存知ですよね。Central Processing Unitの略で、中央処理装置と呼ばれ、コンピュータにおける中心的な処理装置です。みなさんのPCにも入っています。

このCPUの特徴として、「複雑で連続したif~else~構文」が得意ということがあげられます。*1例えば、windowを閉じてから、シャットダウン。ブラウザを立ち上げたら、動画を再生。というような、AしたらBする、BしたらCするという考え方がCPUには得意とされています。

ただCPUの問題点は基本と1CPUには1コアしかないので、できる同時でできるタスク量がすごく限られていました。(windowXPまでは基本1コア1タスクという認識で大丈夫かと思います)

現在のこのCPUの性能も大分上がってきました。1ノートパソコンに、マルチコアといって、複数のCPUが入るようになりました。今まで1CPU(1コア) で1タスクしかできなかったのが、6CPUで6倍の仕事を同時にさばくことが可能になりました。(厳密にはもっとですが)ただ、まだまだ機械学習や深層学習の計算量に追いつかないため、GPUが台頭することになります。

CPUについて詳しく知りたいという方は、また別の記事を書きますので、そちらを参照ください。

 

②画像処理用演算装置

GPU

GPUはもともとグラフィックコントローラの分野で使われていたもので、コンピュータが画面に表示する映像を描画するための処理を行うICから発展したものです。本来は、3DグラフィックなどをPCで描画するために主に使われていたが、現在は、必ずしもグラフィック用ではなく、汎用をもった演算装置としても使われてるようになっています。

CPUと性能上なにが違うかというと、CPUは「if文」が得意だけど、GPUは「For文」が得意です。ひたすら、同じような計算をすごく速くできます。速くできる理由としては、CPUがコアを大体1~12個持っていますが、GPUは数千個コア持っています。1コアあたり1処理ができると考えた場合、GPUの処理速度はCPUの数千倍になります。

機械学習では、何万、何兆ものパターンを計算しなければ行けないため、GPUの方が好まれます。

 

FPGA

これは簡単にいうと、プログラミングができる半導体です。今までのCPUやGPUは、一度工場で作られると、もうその形を変えることはできませんよね。壊れて割れたりする場合は別として。でもこのFPGAは、形を変えることができるんです、しかも工場ではなくで、出荷された現場でです!

FPGAの処理速度は、GPUに勝ります。また、GPUより省エネです。みなさんご存知かもしれないですが、機械学習するために、超巨大なコンピューターを想像できない様な電力を消費しています。それは企業にとって馬鹿にならないコストになっています。この点から、近年は、FPGAの開発に取り掛かる企業が増えてきています。

 

③深層学習用演算装置

TPU

これはGoogleが開発した、演算装置です。

GPUの10倍の性能を有している公表されています。

なおこのプロセッサーは、初めて深層学習専用のプロセッサーです。

それだけに、世界は大いに驚きました。

詳しい内容は、また別記事で紹介しますが、Googleがやはりこの分野をリードしています。

 

 

本当は他にも紹介したい深層学習用の演算装置がありますが、話が逸れてしまいそうなので、今日のところは先に進みます。

 

量子コンピューター

上記の演算装置でもなお、パターンの計算が遅いということで、いよいよ量子の世界に人は進んでしまいます。

今まで0-1と出していたものを、0と1の中間値的なものを設けて、絶えず値を変化させながら計算することが可能になります。(すっごい雑な説明ですみません、また詳しくかきます)

 

それにより、どういうことが起きるか。

 

極端な話をするとGPUで一生たっても計算しきれなかった問題を、量子コンピューターはわずか1日で計算しきってしまいます。わお。

 

ただ今量子コンピューターはまだ、普及されていません。

なぜならば、量子コンピューターが動けれる環境が途轍もなく厳しいからです。

今ITの巨人と呼ばれるAmazonFacebookGoogleはここの土俵で戦っています。

 

量子コンピューター

でも量子コンピューターを超える話がここにまた存在します。光量子コンピューターです。これは、去年9月(2017年)東京大学で完成が発表されました。これは、量子コンピューターの100万倍の計算速くになります。しかも、一般の量子コンピューターとは違い通常の日常環境で使えるというものです。やっぱ東京大学はすごいですね。

 

 

もはやここまでくるとなにがなんだか、、、という方もいると思いますが、

以上が簡単にAI分野における演算装置の変化でした。

 

もう少し時間を作ってそれぞれの項目を詳細に書き記した記事を作りますね。

あと、今まだこの記事にちゃんとした注釈を入れられていないですが、

きちんと入れるようにします。

 

でも今日は一旦ここまで。

ありがとうございました。

 

 

関連記事:

tsushan.hatenadiary.jp

 

【人工知能】AI Mycin(エキスパートシステム)

量子コンピューターの理屈全然意味わからんわってなってるTsushanです。

 

今日は、軽めの内容かつて、1970年代に作られたエキスパートシステムのMycinについてご紹介しようと思います。

 

過去の記事にも書きましたが、エキスパートシステムと呼ばれるものは、簡単に説明すると、人間のあらゆる知識をシステムに書き込んで、システムを人間同様な判断などをしてもらうシステムであり、考え方でした。

【人工知能】AIの歴史:AIの三大ブーム - Webディレクターtsushan’s blog

 

そしてその考え方が盛んだった時期は、1970~1980年です。

 

その間に、一つ注目に値するエキスパートシステムが開発されました。

Mycinです。

 

Mycinとは、システムは伝染性の血液疾患を診断し、抗生物質を推奨するようにデザインされたシステムである。スタンフォード大学で1970年代初めに5、6年の歳月をかけて開発された。Mycinの名称の由来は、抗生物質の多くはサフィックス(接尾辞)「-mycin」がつくためである。

 

(なんで抗生物質には「mycin」がつくか、という風に疑問に思う方もいるかもしれないので、一応調べた結果を共有すると、「mycin」はさらに、「myco」「-in」という2つ語源に別れている。「myco」は「真菌」を意味し、「-in」は、もうすでにみなさん推測できているかもしれないが「入っている」などを意味している。mycinという言葉で「真菌が入っている」という状態を表す。*1

 

Mycinは、第1次AIブームで開発されていた推論エンジンを使い、予め与えられた知識ベースを元に、患者の疾患を判断していく。最終的に原因と思われる細菌名のリスト(確率の高い順)とそれぞれの信頼度、なぜそう推論したかという理由、推奨される薬物療法のコースを示す。

 

イメージは以下。(※M=Mycin、医師=医)*2

M:培地(微生物や生物組織の培養において、培養対象に生育環境を提供するもの(場所))はどこ?

医:血液

M:細菌のグラム染色による分類の結果は?

医:ネガティブ

M:細菌の形は?

医:棒状

M:患者の痛みはひどいか、ひどくないか?

医:ひどい

M:病原は緑膿菌です。

 

 

スタンフォード医学部での調査によると、Mycin の診断結果は 69%*3の正しさであり、細菌感染の専門でない医師よりはよい結果だが、専門医の診断結果(80%)よりも悪かった。

 

また実のところ、Mycinは現場では決して使われなかった。これは性能が悪かったせいではない。理由は、倫理や法律の面で、コンピュータを医療に使って間違った診断を下した場合、誰が責任を取るのかという問題であった。(実際、今は医者をサポートするアシスタントシステムとして申請を行えば、責任問題は医者が取るので、この点はクラリアできるようになっているとされいる。*4)また、人間の専門家がそのようなものを受け入れることへの抵抗もあったとされている。(これは、システムの精度を上げること、専門家が自ら育てやすい、親しみやすいものであれば採用され安くなるとされている。*5*6

 

Mycinはエキスパートシステムとしては優秀だったため、もっとたくさんの知識をシステムに詰め込めれば、もっともっと優秀なエキスパートシステムができるのではないかということで、その後知識工学という分野が確立されることになる。

 

以上、簡単ですが、エキスパートシステムMycinについてのご紹介でした。

また次回!!

【人工知能】AI 機械学習とその定義

ようやく「MI GENTE」の振り付けを音楽に合わせて踊れるようになりました。そろそろ次の曲をマスターに入るTsushanです。

 

今日は、機械学習について、その中でも機械学習の定義について勉強していきます。この定義をわかりやすく解説しているCourseraのAndrew Ng先生の授業を元に、さらに調べ、この記事を書いていきます。

 

復習だが、まず機械学習の立ち位置は以下である。

 

AI *1

∋ 4つのレベル*2

機械学習(レベル3)

ニューラルネットワーク *3

ディープラーニング

※ 「∋」 は「含む」の意味

※AIとは、AIのレベルと事例、ニューラルネットワークについてはすでにそれぞれ記事を書いたので、気になる方は脚注より、合わせてお読み下さい。

 

ただ機械学習の定義もAIの定義と同様定まっていないのが現状である。

今日は諸定義ある中でももっとも有名な2つの定義を紹介します。

アーサー・サミュエルによる機械学習の定義

コンピュータに明示的にプログラムすることなく学習する能力を与える研究分野  *4

これ、なんかなんとなく理解できるよね。

特に人間がプログラミングをせずとも、プログラム自身があるテーマについて学習できるようになること。

彼のこの定義は、非形式で、やや古いと言われている。*5

彼が有名な理由は、1950 年代に、世界で初めてチェッカーゲームのプログラム、つまり世界初の学習型プログラムであり、人工知能の基本概念をいち早く世界に示したからである。*6

彼のチェッカーゲームのプログラムの驚くべき点は、アーサー・サミュエル自身はあまり上手なチェッカープレーヤーではなかったが、彼のプログラムが、プログラム自身を相手に数万回ものゲームを行わせた。そこにあるボードの配置を学び続けた結果、1970年代中ごろには、腕の立つアマチュアと互角に戦えるレベルになっていた。*7

その彼が言う定義だから、ということでこの定義は有名になったと理解している。が、これは1950~80年代に提唱されたものである。だから、ちょっと古い。。

 

この定義よりも最近提示された定義がトム・ ミッチェルによる定義である。

トム・ミッチェルによる機械学習の定義

適切に提起された学習問題は以下のように定義される。 コンピュータ・プログラムは、ある課題Tについて、ある性能基準Pに基づき、もしTについての性能が基準Pで測定して、経験Eと共に改善している場合に、経験Eから学習したと言うことが出来る。*8

 

ぶっちゃけ、この文の途中で思考が停止した。。笑

性能基準P?基準Pを元に測定??なに???

 

これをすげーわかりやすく解説してくれたのがアンドリュー先生。まじで神。

 

チェスに例えて考えてみよう。

チェスプレイのプログラムがあり、1000回のチェスのプレイで、相手に勝つ確率を高めさせたいと考えている。

これを上記のトムさんの定義に当てはめてみると、以下になる。

タスクT:チェスのプレイ

基準P:相手に勝つ確率

経験E:1000回のチェスプレイ

 

あれ?めちゃめちゃシンプルやん。

チェスのプレイに置いて(タスクT)、相手に勝つ確率(基準P)が1000回のチェスプレイ(経験E)によって高まれば、このプログラムは、1000回のチェスプレイの経験によって学習したことになる。ということが、証明できる。

 

個人的にこういう例えのほうが圧倒的わかりやすい。

では、次は質問です。

以下の例において、どれがタスクT、基準P、経験Eでしょうか。

 

電子メールプログラムが、どの電子メールをユーザーがスパムとしてフラグを立てるかどうかを見ているとする。このようユーザーは、スパムボタンをクリックして特定の電子メールをスパムとして報告しそれ以外は報告しません。そして、どの電子メールをスパムとして報告するかにより、 電子メールプログラムがスパム電子メールをより正確にフィルターするように学習する。

 

・・・いかがですか?以下答え合わせ。

 

課題T:電子メールをスパムと非スパムに仕分ける

経験E:ユーザーがスパムと非スパムにラベル分けするのを見る

基準P:正しく分類された電子メールの比率

 

みなさん正解できましたか?

 

ちょっと長くなってしまいましたが、上記が、アーサー・サミュエルとエド・ミッチェルの機械学習に対する定義でした。

ぶっちゃけ、定義がわからなくても困ることはないですが、でもそこまで説明できると説明に深みができると思いますので、ぜひ皆さん各自で深めてみてください。

 

▼関連記事▼

tsushan.hatenadiary.jp

【人工知能】AI ニューラルネットワークとは

今年で提案書100書いて5件以上受注したいと最近考えているTsushanです。

 

さて、今まで人工ニューロンや形式ニューロンモデルについて勉強してきました。今日からは、ニューラルネットワークについて勉強していきます。

 

過去の記事でも言いましたが、人間の脳の中は、数千万億個のニューロンが互いにつながり、 巨大なシステムを構成しています。*1

 

ニューラルネットワークは、この脳機能に見られるいくつかの特性を計算機上のシミュレーションによって表現することを目指した数学モデルで、機械学習の一つである。略称:NN(人工ニューラルネットワークANNとも呼ぶこともある。)  

 

私達が最近良く耳にする「ディープラーニング」は、このニューラルネットワークの分野の中に含まれています。下図参考ください。

 

f:id:tsushan:20180319144645p:plain

図:AI>機械学習ニューラルネットワークディープラーニング *2

 

その人間の脳神経のようにコンピューターをプログラムして学習させよう、というアプローチがコネクショニズムと呼ばれる考え方です。1950~1990年代ではこの考え方はあまり実りがなかったのだが、ようやく、近年になってビックデータやハイスペックのコンピューターの登場により大きな発展が遂げました。*3

 

ニューラルネットワークが最も得意とするのはパターン認識・分類、ノイズが混在しているデータ処理、関数の近似です。ニューラルネットワークが最も早く応用されたのは、手書き文字の識別を含む画像のパターン認識音声認識などの情報工学に関連する分野です。その後医学の病気の診断、財務分析、経済分析、市場分析などにも応用されています。最近では、人文科学の領域の研究への応用も見られるようになっています。*4

 

ニューラルネットワークは、その構造によって大きく分けて2つの種類に分けられる。階層型ネットワーク相互結合型ネットワークです。

 

①階層型ネットワーク

これはニューロンを層状にならべ、前の層から次の層へ一方向にのみ信号が伝わるというネットワークです。入力層、出力層、隠れ層から構成され、層と層の間には、ニューロン同士のつながりの強さを示す重み「W」があります。この「W」について詳しく知りたい方は過去の記事の「結合荷重」を参考ください。

【人工知能】AI 形式ニューロンモデル(人工ニューロン) - Webディレクターtsushan’s blog

 

このタイプのネットワークは入力層のニューロンに加えた信号(入力信号) に対して出力層のニューロンの出力(出力信号)が一意的に定まります。下図参考。

 

 

f:id:tsushan:20180319151637p:plain

1: 階層型ネットワーク((ニューラルネットワークの種類))

 

この図は3階層で表現されているが、この階層の数によって解ける問題が異なってきます。

 

②相互結合型ネットワーク

このタイプでは信号の流れる方向は1方向でなく、フィードバックをします。 下の図2のような構造をもつものを、特にフィードバック付き相互結合型ネットワークとも呼んでいます。

 

f:id:tsushan:20180319152513g:plain

 

2: 相互結合型ネットワーク*5

f:id:tsushan:20180319153413g:plain



3:  フィードバック付き相互結合型ネットワーク *6

 

非階層型ネットワークは連想記憶モデルや音声合成音声認識の分野につかわれています。

 

これらの2つの型のネットワークについては、別の機会を設けて更に詳しく説明していきたいと思います。またニューラルネットワークの上の概念、機械学習についても別の機会で説明をしていきたいと思います。

 

ではまた!