親です。

子ども産まれたんで育児とかについて書きます。映画とか心理学とかITとかの趣味についても書きます。

【Python】sk-learn - ロジスティック回帰(LogisticRegression)

おつです。かく。

ロジスティック回帰(LogisticRegression)

難しいことは全くわからんが、ロジスティック回帰ってのは分類したい対象の持っているいくつかの特徴をヒントに、対象を0 or 1で分類するやつだ。特徴を見て分類させるってのを人力でやろうとするとき、まあグラフに書いてみてあ〜〜こんな感じで分けられそうだなあみたいなことをするんだが、特徴が10個とかになると普通に人智を超えた話になる。が、機械学習ならそれが可能。
パーセプトロンとは違って線形分り不可能な問題も解決できる...みたいなお話も聞いたが全く意味がわからん。

コーディング

だいたいの流れとしては、 1. データの読み込み 1. 学習用データとテスト用データを分ける 1. ロジスティック回帰で分類 って感じ。

コード

# データの読み込み
import pandas as pd
df = pd.read_csv('sample.csv')

# 学習用データとテスト用データを分ける
from sklearn.model_selection import train_test_split
(X_train, X_test,
 y_train, y_test) = train_test_split(
    X, y, test_size=0.3, random_state=0,
)

#  ロジスティック回帰で分類
from sklearn.linear_model import LogisticRegression
lr = LogisticRegression(C=1000)
lr.fit(X_train, y_train)

# テスト
lr.score(X_test, y_test)

めっちゃ簡単にかけてしまうなあ。

理論

理論的なところはおいおい勉強する。

以上!!!