概览
概览
本文介绍如何快速上手并使用 算场 Data+AI 平台 进行常用的 AI 开发流程。
进入 算场平台 后,在左侧导航栏的一级菜单 模型 中可以看到全部 AI 子产品模块,您可以根据实际开发场景进行机器学习全生命周期的开发与管理。
AI 开发流程
您可以按照下列流程引导,使用各子产品进行 AI 流程开发:
步骤 | 任务 | 描述 | 相关文档 |
---|---|---|---|
前期准备 | 上传数据集(可选) | 通过多种方式上传数据集文件,导入为数据表。 | |
准备训练数据 | 对原始数据进行处理、标注,构建可供训练的高质量数据集。 | ||
创建 CPU/GPU 集群 | 在 算力 模块创建灵活、稳定、高效的 CPU/GPU 集群用于机器学习训练。 | ||
模型训练 | 创建 Notebook | Notebook 通过交互式形式进行机器学习任务开发,包括读取数据、开发和训练模型。 | |
记录 MLflow 实验 | 通过 MLflow 记录训练过程中的参数、指标和模型文件,在实验中对比、分析不同运行的训练效果。 | ||
模型管理 | 注册模型 | 使用 MLflow API 将训练过程中产生的模型注册至 AI模型 中,用以管理模型的完整生命周期。 | |
模型部署 | 模型在线服务 | 将已注册模型部署为在线服务,支持大规模复杂模型的一键部署和高效的模型推理功能。 |