2019-03-05から1日間の記事一覧

2019-03-05

機械学習記14日目　～　強化学習（Reinforcement learning）

▶強化学習とは強化学習(Reinforcement learning）とは機械学習の手法の1つです。囲碁の人工知能である「alpha go zero」などに使われている手法でもあります。alpha go zeroは、たったの40日でこれまで開発されたalpha goのどのバージョンよりも強くなりま…

2019-03-05

機械学習記13日目続き　～　k-平均法アルゴリズム

機械学習

ここまで、scikit-learnで試してきた機械学習の手法は、正解ラベルが学習データに付いている「教師あり学習」と呼ばれるものです。もう1つの機械学習である「教師なし学習」です。教師なし学習とは、回帰や分類による「予想」とは異なり、ラベルなし学習デ…

2019-03-05から1日間の記事一覧

機械学習記14日目 ～ 強化学習（Reinforcement learning）

機械学習記13日目続き ～ k-平均法アルゴリズム

機械学習記14日目　～　強化学習（Reinforcement learning）

機械学習記13日目続き　～　k-平均法アルゴリズム