世界一のわかりやすさを目指す

世界一暇なデータサイエンティストが簡単に統計や数学を解説するらしいよ

超簡単にわかる!機械学習4種類!

超簡単にわかる!機械学習4種類!

 

機械学習(マシーンラーニング)なるものが流行っているらしいぞ!

なんか魔法みたいにすごい成果でるんでしょ?

うちでもなんかやってよ!

という誤解を起こさないために!

 何でもできる魔法ではないのです。

 

 

4種類紹介させていただくので

自社ではどの学習方法を使えば利益が出るのか?

を考えながら是非読んでみてくださいね。

 

 

 

 

その前に人工知能(AI)、機械学習(ML)、深層学習(DL)の違いは?という方は

以前書いた記事を読んでいただけたらと思います。

 

statisticsworld.hatenadiary.com

人工知能機械学習と深層学習の違いが

多分ご理解いただけたかと思います!

 

その前提で今日の話は進めていきます。

 

少し機械学習だけ復習すると

簡単に言うと

「人間と同じような認知・判断を機械に行わせる人工知能の手法の一つ」ってことです。

 特にwikipediaでは「学習の仕組みを機械で実現する」と書いてあり、その側面が強いです。

また、学習とは「過去の結果を用いて未来の結果を予測すること」だと考えてください。

 

ではこのような

 

過去の結果を用いて未来の結果を予測する認知・判断の学習方法は大別すると4種類です。

 

 

機械学習4つの種類とは?

 

1.教師あり学習

 

そもそも教師ありとは?

 教師ありとはデータにラベル、つまりこれは犬の画像ですよ!と

人間が前もって学習させるデータが「何なのか」をシステムが判断できるよう教師のように教えているわけです。

 

 

この学習法は最も一般的で脚光を浴びている深層学習(ディープラーニング)はほぼこれです。

 

具体的には光学文字認識画像分類、言語の翻訳、音声認識などです。

 

例えば、

数字の0~9を分類するもの、画像が犬か猫は判定する、

翻訳機、アレクサなどの音声認識

これらの教師あり学習法を使っているとみていいでしょう。

 

 

もうちょっとかっこいい具体例を出すと

 

・シーケンス生成

 ⇒例えば食事の画像をアップするとそれぞれの食べ物が説明されて何キロカロリーとか説明がでる。

 

・物体検出

 ⇒例えば監視カメラで人を認識した時だけ録画機能をONにする

などがあります。

 

 

 

 

2.教師なし学習

 

教師あり学習」があれば「教師なし学習」もある!ということで

2つめは教師なし学習です。

これはよくクラスタリング、次元削減(下で説明しますね)で使われます。

 

クラスタリングはいろんな種類の花があったときに

例えば3種類に分類したい!と指定して

画像をとりあえず認識させます。

 

機械が自動で分類して

 

1グループ目は赤っぽい花たち

2グループ目は黒っぽい花たち

3グループ目は青っぽい花たち

 

というようにラベルがなくても(つまりどんな種類の花かわからなくても)

画像のRGB(色)を認識して

 

指定したグループにいい感じにわけてくれます。

これは機械グループ化した後

人間がこのクラスタリング赤、黒、青に分けた感じかな?と判断が必要です。

 

これは何に応用できるか?というと

主に顧客分類などです。

 

例えば、自社の顧客を5つのカテゴリにわけます。

性別?年齢?人数?購入頻度?滞在時間?それとも購入金額?

機械がもしかしたら我々には思いつかなかった分類をするかもしれません。

 

1つ目のグループは30代女性、結婚している、日中に来る人のグループ

2つ目のグループは人数が2人で男性と女性、年齢は20代、購入金額は控えめ

などです。

 

これを人間が見て

1つ目はどうやら主婦層かな?

2つ目は若いカップルっぽいな

などと分類名を決めます。

 

それぞれグループに対して商品群が弱いところに新商品を打つのか?

それとも自社が強いグループへのアプローチをより強化してシェアを狙いに行くのか?

など戦略立案の手助けとなってくれるでしょう。

 

 

続いて、同じ教師なし学習

次元削減です!

 

これで3次元の世界から2次元の世界にいけるぜー!と思った方は残念でした。

 

次元削減というのは簡単に言うと特徴を減らすってことです。

 

例えばZack氏は、

 

かっこよくて、統計に強くて、頭もよい、説明もうまい

スマート、読書家、かつデータサイエンティスト・・・

 

正直ごちゃごちゃしててわかりにくいですよね。

 

それを簡単に

 

Zack氏は天才!

 

みたいに特徴をわかりやすくしてくれます。

 

覚えやすいですね。

 

はい。調子に乗りすぎました。

 

 

もう少し具体例を出すと

 

とある食べ物の商品アンケート調査から

 

味が良い、香りがよい、見栄えが良い、食べ応えがある

 

などを総称して「おいしい」みたいな特徴を抽出してくれます。

色々書いてあるよりもわかりやすいですよね。

 

 

 

 

3.自己学習

 

これは特殊な教師あり学習とも言えますが、

最近発展が著しく、別カテゴリとして扱ってもよいのでは?

との思いからあえて分けさせていただきました。

 

具体的に例を挙げると

実在しないモデルの顔を作成ができます。

大量のモデルの画像を学習させて、

似たような実在しないモデルの顔を生成するということです。

 

他にも名画を大量に学習させて似たような絵を描かせるとかも

この自己学習になりますね。

 

 

 

4.強化学習

 

これはみなさんも聞いたことがあるかもしれません。

 

AlphaGoみたいな世界トップクラスの囲碁が打てるとニュースにもなりました。

 

この強化学習ではある環境における情報を集め、

何らかの報酬が最大になるような行動を学習していきます。

 

囲碁であれば、盤面という環境を見て、最終的なゲームの勝利率が最大となるように

どこに石を置けばいいのか?という行動を学習するということになります。

 

おそらく自動運転、ロボット工学、などのアプリケーションで今後著しい成果が出てくる学習方法ではないかと考えています。

 

 

今回は大まかに機械学習の方法を4種類説明させていただきました。

 

自社はどの機械学習を行えば利益に繋がりそうでしたか?

少しでも興味がわいたのならば幸いです。

 

 

次回は

「自社でもできる!?機械学習の一般的な手順」

について書きたいと思います!

お楽しみに。

 

(面白かったらTwitterで気軽に「オモローw」とか絡んでいただけたらと思います。FF外とか全く気にしないので。)

書いてほしい記事みたいなのもTwitterで随時募集しています。

突然晩ご飯!みたいに突撃いきなり記事リクエスト!大歓迎です。

Twitter:@zack32319636

お仕事の相談などはDMください。

(スポット相談は60分2万円になります。)

 

※補足

 超簡単に説明したので厳密にはここが異なる!みたいなところもあるかと思いますし、

人によって定義や分類が異なる部分でもあります。

今回はわかりやすさを優先とさせていただいたのでご理解いただけたら幸いです。