回归任务
回归任务
回归任务基于输入特征与目标变量之间的关系,使用机器学习算法来预测连续的数值数据。常见的应用案例包括房价预测、天气预报和股票价格预测。通过训练模型,回归分析可以帮助识别趋势和模式,从而提供精确的数值预测。
数据准备
示例使用了红葡萄酒质量数据集 winequality-red
(winequality-red.csv)。该数据集来自 UCI 机器学习库,可用于回归任务。winequality-red
数据集一共有 1599 个样本,12 个特征。其中 11 个为红酒的理化性质,quality 列为红酒的品质(10 分制),具体信息如下:

创建回归任务
- 选择回归任务

- 选择集群以及训练数据
- 选择集群以及数据库中的数据表
AutoML
任务中只能选择ML
类型的集群。

选择训练目标
该示例中选择quality
作为训练目标,除目标列之外至少需要选择一列才可以训练选择具体的训练列

- 数据为空时的填充方式
默认为自动填充,选择常量
填充时需要给定具体的填充值

- 设置训练指标、训练模型以及超时时间
实验超过设置的超时时间后会自动结束

- 其他选项
时间列用于划分训练、验证以及测试数据,可以不设置

- 训练
点击新增并训练
开始训练

训练过程会生成可执行的 worksheet

训练记录
- 训练完成后会在实验中生成若干条记录

- 在数据挖掘笔记本中查看训练数据分析,包含数据统计信息等


- 记录所有实验中效果最好的模型


- 实验会记录训练过程中的警告
