2019-02-27から1日間の記事一覧

機械学習記8日目続き ~ データの分割

まず最初に、irisデータセットを訓練用のデータと評価用のデータに分割します。これは、生成した学習モデルの正解率を正しく判断するためです。訓練用のデータを評価用にも使ってしまうと、既に知っているデータなので、当然、正解率は高くなります。そこで…

機械学習記8日目 ~ k近傍法

今日は機械学習アルゴルズムを使って、初めての「機械学習」に挑戦します。利用するアルゴリズムは、「k近傍法」です。 k近傍法(k-Nearist Neighbor algorithm)は、機械学習において「教師あり学習」で、分類問題を解くためのアルゴリズムです。 分類問題と…

機械学習記7日目つづき ~ 機械学習用データ

▶手書き数字のデータセット 図4の学習用データは、「digits」という手書き数字の画像データと、各画像に付けられたラベルデータです。 オリジナルのデータは、「MNIST」という名前で、下のサイトから入手できますが、scikit-learnに付属しているdigitsデータ…