sklearn中train_test_split参数的详细介绍

sklearn中train_test_split()函数可以把数据集切分为随机的训练数据集和测试数据集。下面是源代码中的举例：X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.33, random_state=42)参数信息如下：参数含义x数据集中特征的集合y数据集中标签的集合test_size如果数值在0-

永不落后于人

4945人浏览 · 2020-11-25 15:31:18

永不落后于人 · 2020-11-25 15:31:18 发布

sklearn中train_test_split()函数可以把数据集切分为随机的训练数据集和测试数据集。

下面是源代码中的举例：

X_train, X_test, y_train, y_test = train_test_split(
  X, y, test_size=0.33, random_state=42)

参数信息如下：

参数	含义
x	数据集中特征的集合
y	数据集中标签的集合
test_size	如果数值在0-1之间，代表测试数据集合所占比例。如果数值大于1，代表测试数据集的条数。默认为0.25
random_state	随机数种子。不指定每次运行代码切分的数据集都不一样，反之，切分的数据集是一致的

返回值

返回值	含义
X_train	切分后的训练用特征集合
X_test	切分后的测试用特征集合
y_train	切分后的训练用标签集合
y_test	切分后的测试用标签集合

技术共进，成长同行——讯飞AI开发者社区

更多推荐

机器学习与人工智能

python# 创建基类# 定义一对多关系# 定义多对一关系# 定义多对多关系（通过关联表）# 关联表（用于多对多关系）SQLAlchemy ORM提供了强大而灵活的数据库操作方式，通过本文的介绍，您应该能够：安装和配置SQLAlchemy定义数据模型和关系执行基本的CRUD操作构建复杂查询管理数据库事务遵循最佳实践SQLAlchemy还有更多高级特性，如混合属性、事件监听、自定义查询等，值得进一

讯飞AI开发者社区

587章:汽车制造的主要流程

设计团队使用CAD软件进行三维建模，确保车辆的外观、结构和性能满足要求。总装工艺总装是将发动机、底盘、内饰和电子系统等组装到车身上的过程。智能制造工业4.0技术应用于汽车制造，包括物联网、大数据分析和人工智能。智能工厂实现生产过程的实时监控和优化，提高生产效率和产品质量。路试与台架测试成品车辆需经过多种路况测试和实验室台架测试，确保性能和安全达标。在线检测生产线上安装多种传感器和视觉系统，

讯飞AI开发者社区

AI革新药物研发：基因组大数据新突破

基因组大数据分析已成为药物研发的核心环节，人工智能（AI）技术通过高效处理海量数据，显著加速了靶点发现、药物筛选和个性化治疗等流程。来源网站：pyklqwq.cn/article/25jNXMc/39830.html。来源网站：pyklqwq.cn/article/25KljJd/61632.html。来源网站：pyklqwq.cn/article/25AECkl/15960.html。来源网站：