模型 (Model)
管理使用 MLflow 打包的机器学习模型,在打包的过程中需要指定数据库。关于使用 MLflow 注册及管理模型请参阅 注册及管理模型。
在网页可以通过以下操作查看数据库下的模型:
- 选择导航栏 数据 » 数据库, 查看当前数据库的列表。
- 选择数据库, 进入数据库详情页。
- 选择 模型 部分,实现数据库下的模型列表。
也可以通过"模型"功能区查看所有的模型:
- 选择导航栏 模型 » AI模型, 查看所有的模型。
MLflow 是一个开源的机器学习生命周期管理平台,使用 MLflow 打包的机器学习模型具有以下特点和优势,这些特性使得模型的管理、部署和复用变得更加便捷和高效:
统一的格式与结构:MLflow 打包的模型遵循特定的目录结构,通常包含模型文件(如 Python 中 scikit-learn 模型的.pkl 文件)、用于模型加载和推理的代码(如 Python 模型的加载脚本)以及描述模型依赖项的文件(如 conda 环境配置文件)。这种统一的结构使得模型在不同环境中能够被一致地识别和加载,提高了模型的可移植性。
依赖管理:在打包模型时,MLflow 会记录模型的所有依赖项,包括 Python 库及其版本号。这确保了模型在不同环境中运行时,所依赖的软件包版本一致,避免了因依赖冲突导致的模型运行错误。通过记录的依赖信息,其他开发者可以轻松地复现模型的运行环境。
模型版本管理:MLflow 提供了强大的模型版本管理功能。每次保存模型时,MLflow 会为其分配一个版本号。用户可以方便地查看、比较和回滚不同版本的模型。这对于模型的迭代开发非常重要,能够帮助开发者追踪模型的性能变化,选择最优的模型版本用于生产环境。
实验与记录:在模型训练过程中,MLflow 可以记录实验的各种参数、指标和 artifacts(如模型文件)。这些记录与打包的模型相关联,方便开发者回顾模型的训练过程,分析模型性能与训练参数之间的关系,为进一步优化模型提供依据。
部署便捷:使用 MLflow 打包的模型可以方便地部署到多种环境中,如本地服务器、云平台等。MLflow 提供了多种部署工具和接口,简化了模型部署的流程,使得模型能够快速投入生产使用。