机器学习之建模,导入数据集,划分数据集

2025-10-05 15:18:57

1、机器学习建模3大流程:

1.    实例化,建立评估模型对象

2.   通过模型接口训练数据

3.  通过模型接口提取需要的信息 (给模型打分)

机器学习之建模,导入数据集,划分数据集

2、 数据集的实例化(以葡萄酒数据集为例):

1.    数据集模块sklearn.datasets.数据

以导入葡萄酒数据集为例:

from sklearn.datasets import load_wine

3、  数据集的实例化

Win = load_wine()

机器学习之建模,导入数据集,划分数据集

4、    数据集常用数据

      1.   data (数据集的特征数据)

      2.    target ( 数据集的标签 )

      3.    feature_names(特征的名字)

机器学习之建模,导入数据集,划分数据集

5、数据集的 划分:

1.    划分数据集模块

from sklearn.model_selection import train_test_split

6、实例化对象

train_test_split()

7、 train_test_split()所需参数及其返回值

1.    数据集的特征数据

2.    数据集的标签

3.    test_size 划分数据集

例:test_size =0.4 表示将40%的数据集划分为测试集,用于测试训练好的模型,将剩下60%的数据集划分为训练集,用于训练模型

4.    返回值(注意:返回值顺序)

返回4个数据集依次为:特征数据的训练数据,特征数据的测试数据,标签的训练数据,标签的测试数据

机器学习之建模,导入数据集,划分数据集

声明:本网站引用、摘录或转载内容仅供网站访问者交流或参考,不代表本站立场,如存在版权或非法内容,请联系站长删除,联系邮箱:site.kefu@qq.com。
猜你喜欢