クラスタリング
どーも
この世には
「頭のいいやつ」と「頭の悪いやつ」がいる
当たり前のことなんだけど
でも一概には見分けがつかん
学歴?就職先?資格の数?
他国語を話せるか?
全部違うと思っている
個人的には「視野の広さ」と思ってる
あ、あとおもしろいやつは頭いい
まあ視野広くないと人笑わせるのは無理な話やで
って前置きは終わりにして
こっから勉強の話やからおもんないで
頭いい組と頭悪い組をわけるのは
人間には簡単だろうが
じゃそれ、機械にそれができるの?
A君 数学 90 点 国語 80 点 頭いい
B君 数学 5 点 国語 30 点 頭悪い
たまにおるよな、数学の点数が一桁のやつ
このデータを元に
C君 数学 80 点 国語 60点
この人はどっちだ
まあ,頭いいに入れてもいいでしょうたぶん
これくらいなら機械にもできる
A君とB君のデータがあるからね
これを「教師あり学習」っていうの
ABの点数とそれに対する答え(頭いい or 頭悪い)がわかってる場合
未知のデータ(C君)はどっち?
こういうのを「判別分析」っていうんだわ
おい、なめんなよ
判別分析があるからデジカメは顔認識が出来るんだからな
これに対して
「教師なし学習」ってのがある
A君 数学 90 点 国語 80 点
B君 数学 5 点 国語 30 点
C君 数学 80 点 国語 60点
頭いいか悪いかは学習としてあたえずに
適当にグループ化してくれってやつ
そんなことできんの?って思ったでしょ
できるんだなこれが
この例だと,点数が近い方をまとめようぜってことで
A と B は合計で 125点の違いがある
A と C は合計で 30点の違い
B と C は合計で 105点の差
A と C 近いじゃん、似てるなお前ら、くっつけ
ってなるわけよでグループ化
話は雑だしかなりはしょってるけど
教師なし学習ってのはこんな感じ
これを「クラスタリング」とか「クラスター分析」って言ったりする
ちょっとかっこいいでしょ
「多変量解析」っていう
多くのデータを解析することに役立つ手法の中のひとつなの
こういうのマスターして分析のプロみたいなのかっこいいよな
実際海外ではこういう人がスーパーで雇われてて
売上をあげるために過去のデータを分析するっていう例もあるのよ
ほんとかっこいいよなそれ
俺はこれを勉強しなきゃなんないの
眠いし疲れたし疲れた
あ、興味がある人はこれを見たら教師なし学習がわかるかも?(笑)
おもしろいしわかりやすい
これ作った人はあたまいいはず
視野300℃ くらいあるたぶん
つかれた、ばいばい