Linux 拨号vps windows公众号手机端

Scikit-learn中怎么分割数据集为训练集和测试集

lewis 1年前 (2024-03-25) 阅读数 12 #程序编程
文章标签 Scikit-learn

可以使用train_test_split函数来分割数据集为训练集和测试集。具体操作如下:

from sklearn.model_selection import train_test_split

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

其中,X为特征数据集,y为标签数据集,test_size为测试集所占比例(通常取0.2表示20%的数据作为测试集),random_state为随机种子,可以保证每次运行时划分的训练集和测试集是一样的。分割后,X_trainy_train为训练集的特征和标签,X_testy_test为测试集的特征和标签。

版权声明

本文仅代表作者观点,不代表米安网络立场。

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

热门