ウィリアムのいたずらの、まちあるき、たべあるきーPART2

gooブログ「ウィリアムのいたずらの、まちあるき、たべあるき」がお引越ししてきました

Scikit-learnでランダムフォレストをやるには!クロスバリデーションも!!

みんな大好きアイリスデータを使って・・・


from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier

iris=load_iris()
X_train, X_test, y_train, y_test = train_test_split(iris.data, iris.target, random_state=0)

rnd_clf=RandomForestClassifier(n_estimators=5,max_leaf_nodes=3)
rnd_clf.fit(X_train,y_train)
print(rnd_clf.score(X_test,y_test))


ついでにクロスバリデーションすると・・・

from sklearn.datasets import load_iris
from sklearn.model_selection import cross_val_score
from sklearn.ensemble import RandomForestClassifier
import numpy as np

iris=load_iris()

rnd_clf=RandomForestClassifier(n_estimators=5,max_leaf_nodes=3)

scores = cross_val_score(rnd_clf, iris.data, iris.target)

print(format(np.mean(scores)))


【参考サイト】
scikit-learn を用いた交差検証(Cross-validation)とハイパーパラメータのチューニング(grid search)
https://qiita.com/tomov3/items/039d4271ed30490edf7b