波動と機械学習

人間の声を色相の変化を利用して3次元プロットした図に美しさを感じて、そのまま音声解析の道を進んでいます。自分なりに調べて実装できたものから更新していきます。アドバイス、アイデアなどあれば是非お願いします。

機械学習とは?

前回記事では数学的な知識を使わずに人工知能機械学習の違いについて書かせていただきました。

抽象的になりすぎて分かりずらかったかもしれません。(すみません…)

 

今回の記事では機械学習についてもっと詳しく解説します。

 

機械学習とは?

さて、前回記事でも解説しましたが一応確認します。

f:id:araitbs007:20190213023105p:plain

繰り返しになりますが、重要なのはデータから特徴や判断基準を「数学的に」発見することです。

人間が全てのパターンについて詳細な条件分岐プログラムをしなくても、機械学習では多量のデータから行動指針を見つけることができるのです。

 

例として、実際に10人の人達の身長と体重のデータを図にしてみました。(左図)

f:id:araitbs007:20190213023119p:plain

 このデータから、11人目の身長をもとに11人目の体重を予測するシステムを考えてみましょう。

 

 アイデアは簡単です。

左図に右図のようなそれっぽい直線を引くと、およそ身長と体重の関係が視覚的に分かりやすくなります。11人目の身長と体重の関係も青い直線と同様であるならば、身長・体重のどちらかが分かるだけでもう一方の値も求めることができます。

(※数学的にそれっぽい直線の引きかたを知りたい方は後に投稿される回帰:最小二乗法の記事を参照してください。)

 

また、こんなパターンもあります。

下図は身長から性別を推測する問題を図にしたものです。1を男性、0を女性と番号を割り振って考えていきます。

f:id:araitbs007:20190213024900p:plain

この例は確率の知識が必要なため前述の例よりも理解に苦しむかもしれませんが、やはりこちらも右図のような曲がった線を推定できれば、あとは目盛りを読んで1に近いか0に近いかで性別の分類をしてやれば良いのです。

(※数学的にそれっぽい曲線の引きかたを知りたい方は後に投稿される分類:確率の導入の記事を参照してください。)

 

このようにデータ群の中に直線、または曲線のモデル、はたまた確率や統計の知識を導入することによって機械学習は作られます。

魔法のような摩訶不思議なものではないのです。

 

機械学習の概観

機械学習には前回記事でもお話ししたようにいくつか種類があります。

中でも教師あり学習教師なし学習については確実に記事・動画にしていくつもりなのでご紹介します。

f:id:araitbs007:20190213023127p:plain

前述した具体例2つは教師あり学習の回帰・分類と呼ばれるものにカテゴライズされます。

 

教師あり学習では「身長と体重」や「身長と性別」のような「予測の材料実際の結果」が1セットになったデータを扱います。これらのデータのことを教師データと呼びます。一般に教師データは1つの分類器(システム)を作成するにあたって、数千〜万ほど用意するのは当たり前で、教師データ集めに苦労する場合があるかもしれません。

 

それに対し、教師なし学習では与えられたデータを複数のグループに分ける問題を解きます。教師なし学習で用いるデータは正解値が分かっていないので、根本的に与えられたデータがどのようなものなのか分析することが重要となります。よって教師なし学習が得意なのは与えられたデータの構造を分析することと言えます。

 

今回の記事はここまでです。

次回から実際に教師あり学習の「回帰:最小二乗法」の解説をしていきます。

数学的な知識が満載なので、数式だらけになると思いますが、ご了承ください。