2019-02-01から1ヶ月間の記事一覧

機械学習記9日目 ~ 機械学習モデルの構築

準備が整ったので、k近傍法でクラス分類を行う学習モデルを構築します。k近傍法のアルゴリズムは、scikit-learnのKNeighborsClassifierクラスに実装されています。書式は図1のようになります。 図1.KNeighborsClassifierの書式 図2.引数とその説明 それで…

機械学習記9日目 ~ 散布図をプロットしてみる

ここで、k近傍法のデータセットを散布図でプロットして、可視化してみます。irisデータセットの4つの特徴量(がく片の長さと幅、花弁の長さと幅)から、品種の分類ができそうか目視で確認します。 ここで、irisデータセットの散布図をプロットするコードを…

機械学習記8日目続き ~ データの分割

まず最初に、irisデータセットを訓練用のデータと評価用のデータに分割します。これは、生成した学習モデルの正解率を正しく判断するためです。訓練用のデータを評価用にも使ってしまうと、既に知っているデータなので、当然、正解率は高くなります。そこで…

機械学習記8日目 ~ k近傍法

今日は機械学習アルゴルズムを使って、初めての「機械学習」に挑戦します。利用するアルゴリズムは、「k近傍法」です。 k近傍法(k-Nearist Neighbor algorithm)は、機械学習において「教師あり学習」で、分類問題を解くためのアルゴリズムです。 分類問題と…

機械学習記7日目つづき ~ 機械学習用データ

▶手書き数字のデータセット 図4の学習用データは、「digits」という手書き数字の画像データと、各画像に付けられたラベルデータです。 オリジナルのデータは、「MNIST」という名前で、下のサイトから入手できますが、scikit-learnに付属しているdigitsデータ…

機械学習記7日目 ~ 機械学習用データ

〇ひとこと 機械学習の勉強をはじめてから、今日で1週間が経過しました。早いものです。。。 「進捗が........やばい!」 ▶機械学習用データ 本格的な機械学習の実験を行うためには、それなりのデータが必要になります。 ネット上には、機械学習用のサンプル…

機械学習記6日目つづき ~ 回帰の実装

回帰分析は、「結果データ」と「結果に影響を及ぼすデータ」の関係性を統計的に求める手法です。結果データを「目的変数」、結果に影響を及ぼすデータを「説明変数」と呼びます。 scikit-learnには、この回帰分析を行うモデルとして「線形回帰モデル」が搭載…

機械学習記6日目 ~ 機械学習ライブラリ(scikit-learn)

〇ひとこと 今日は引っ越し(部屋替え)があり、早朝から大忙しでした。なんと、午後9時の段階で進捗0(ゼロ)。 「もう、今日は機械学習の勉強できないかな~」 しかし、勉強は毎日続けないと意味がない!(「継続は力なり」とも言いますし.....) 今日から機械…

機械学習記5日目 ~ matplotlib

科学技術計算などで、結果をグラフで表示できるとわかりやすいですよね?、ということで、matplotlibというライブラリを使いたいと思います。matplotlibを使えば、データを図にプロットできるようになります。matplotlibも、Anacondaに含まれています。 ▶mat…

ODYK君がアルゴリズムを学ぶ話 ~No.0~

● アルゴリズムの3大処理 〇順序処理 〇分岐処理 〇繰り返し処理 ●アルゴリズムとは ある問題を解くための手順を数学的に定式化したものです。競技プログラミングなんかやっている人だと良く耳にするワードだと思います。 ●アルゴリズムの正当性とは? 簡単…

機械学習記4日目 ~ Pandas

Pandasは、Pythonでデータの分析、解析を支援するライブラリです。機械学習では、データをPandasの「Dara Frame」に変換して、操作したり表示したりすることが多いようなので、ここではDataFrameを少し調べておきたいと思います。 DataFrameは、RDB(関係デー…

機械学習記3日目 ~ NumPyの統計関数

▶NumPyの統計関数 配列の要素の平均は、mean関数を使うと簡単に計算できます。 例えば、0~9までのランダムな整数の配列を生成して、その平均を計算してみましょう。ランダムな値の配列は、random.randint関数を使って作ります。第1引数は下限、第2引数は上限…

機械学習記2日目続き ~ 内積の計算

以下は、2日目の続きからとなります。 dot関数を使うと、ベクトルの内積や行列の積を求めることができます。書式は以下のようになります。 numpy.dot( a, b, out = None ) ベクトルの内積とは、各要素の積をすべて足し合わせた値です。 例えば、次のarr1とar…

機械学習記2日目 ~ NumPyで配列を操作

昨晩、ロビー(wi-fi環境)で作業しようとしたら4,5、(6)年生の先輩方がフルーチェの立食パーティー(謎)をしていたため、ブログを投稿できませんでした。 これから何日かかけて、機械学習で利用するライブラリの使い方を調べたいと思います。 実行はJu…

機械学習記1日目 ~ 環境構築と動作確認

今回、私が機械学習のプログラミングに利用する言語はPythonです。Pythonの公式サイトから環境をダウンロードしようと思いましたが、Anacondaをインストールした方がもっと簡単に環境構築を行えるようなので、そちらの方を採用したいと思います。 まず、最初…

0日目 ~ はじまり

こんにちは、ODYKです。 唐突ですが、日々の機械学習奮闘記を始めることにしました。 毎日1時間機械学習を勉強し、学んだことをブログに投稿していきたいと思います。 これを1か月ほど続け、機械学習に関してはド素人の私が1か月(30時間)勉強すれば、どれく…

第3回学内セキュリティ勉強会を企画・運営した話

第3回学内セキュリティ勉強会を開催しました。 今回は、新たに1年生の子が来てくれました。 この調子でセキュリティに興味を持ってくれる学生さんが 増えてくれれば嬉しいです。 この日は、競技用サーバーにSSH接続して、FLAGを抜き 取るところまでやる予定…