2019-03-05から1日間の記事一覧

機械学習記14日目 ~ 強化学習(Reinforcement learning)

▶強化学習とは 強化学習(Reinforcement learning)とは機械学習の手法の1つです。囲碁の人工知能である「alpha go zero」などに使われている手法でもあります。alpha go zeroは、たったの40日でこれまで開発されたalpha goのどのバージョンよりも強くなりま…

機械学習記13日目続き ~ k-平均法アルゴリズム

ここまで、scikit-learnで試してきた機械学習の手法は、正解ラベルが学習データに付いている「教師あり学習」と呼ばれるものです。もう1つの機械学習である「教師なし学習」です。 教師なし学習とは、回帰や分類による「予想」とは異なり、ラベルなし学習デ…