あ。

完全なる趣味ブログ

クラスタリング

 

どーも

 

この世には

「頭のいいやつ」と「頭の悪いやつ」がいる

当たり前のことなんだけど

 

 

でも一概には見分けがつかん

 

学歴?就職先?資格の数?

他国語を話せるか?

 

全部違うと思っている

 

個人的には「視野の広さ」と思ってる

 

あ、あとおもしろいやつは頭いい

まあ視野広くないと人笑わせるのは無理な話やで 

 

って前置きは終わりにして

 

こっから勉強の話やからおもんないで

 

頭いい組と頭悪い組をわけるのは

人間には簡単だろうが

じゃそれ、機械にそれができるの?

 

A君 数学 90 点 国語 80 点  頭いい

B君 数学   5 点 国語 30 点  頭悪い

 

たまにおるよな、数学の点数が一桁のやつ

 

このデータを元に

 

C君 数学 80 点 国語 60点

 

この人はどっちだ

まあ,頭いいに入れてもいいでしょうたぶん

 

これくらいなら機械にもできる

A君とB君のデータがあるからね

これを「教師あり学習」っていうの

 

ABの点数とそれに対する答え(頭いい or 頭悪い)がわかってる場合

未知のデータ(C君)はどっち?

 

こういうのを「判別分析」っていうんだわ

おい、なめんなよ

判別分析があるからデジカメは顔認識が出来るんだからな

 

これに対して

「教師なし学習」ってのがある

 

A君 数学 90 点 国語 80 点

B君 数学   5 点 国語 30 点

C君 数学 80 点 国語 60点

 

頭いいか悪いかは学習としてあたえずに

適当にグループ化してくれってやつ

 

そんなことできんの?って思ったでしょ

できるんだなこれが

 

この例だと,点数が近い方をまとめようぜってことで

A と B は合計で 125点の違いがある

A と C は合計で   30点の違い

B と C は合計で 105点の差

 

A と C 近いじゃん、似てるなお前ら、くっつけ

ってなるわけよでグループ化

 

話は雑だしかなりはしょってるけど

教師なし学習ってのはこんな感じ

 

これを「クラスタリング」とか「クラスター分析」って言ったりする

ちょっとかっこいいでしょ

 

「多変量解析」っていう

多くのデータを解析することに役立つ手法の中のひとつなの

こういうのマスターして分析のプロみたいなのかっこいいよな

 

実際海外ではこういう人がスーパーで雇われてて

売上をあげるために過去のデータを分析するっていう例もあるのよ

ほんとかっこいいよなそれ

 

俺はこれを勉強しなきゃなんないの

眠いし疲れたし疲れた

 

あ、興味がある人はこれを見たら教師なし学習がわかるかも?(笑)

 

tech.nitoyon.com

 

おもしろいしわかりやすい

これ作った人はあたまいいはず

視野300℃ くらいあるたぶん

 

つかれた、ばいばい