码迷,mamicode.com
首页 > 其他好文 > 详细

阿里云机器学习PAI介绍

时间:2020-11-16 13:20:47      阅读:4      评论:0      收藏:0      [点我收藏+]

标签:img   类型   归一化   增强   交互   名称   架构   页签   code   

阿里云机器学习PAI介绍

技术图片

Summer
久石譲 - 「菊次郎の夏」 オリジナル?サウンドトラック

机器学习大致可以分三类:
有监督学习:指每个样本都有对应的期望值,通过模型搭建,完成从输入的特征向量到目标值的映射,典型的例子是回归和分类问题,例如:逻辑回归、随机森林、决策树。
无监督学习:指在所有的样本中没有任何目标值,期望从数据本身发现一些潜在的规律,例如一些简单的聚类K-means、DBSCAN等。
增强学习:相对来说比较复杂,是指一个系统和外界环境不断交互,获得外界反馈,然后决定自身的行为,达到长期目标的最优化。其中典型的案例就是Alpha Go围棋,或者无人驾驶。
广告
机器学习
作者:周志华

当当
阿里云机器学习平台是构建在阿里云是构建在阿里云Maxcompute计算平台之上,集数据处理,建模,离线预测,在线预测为一体的机器学习平台。阿里云机器学习封装了阿里巴巴集团内成熟的算法,向机器学习用户提供了更简易的操作体验。

该智能平台主要分为三层:
第一层:web UI界层;
第二层:机器学习算法层;
第三层:Maxcompute平台层。

Web UI界面主要由下区域组成:
主要功能区:展示了个各组件名称
画布区:使用者可以用鼠标相应的组件拖拉到画布上,形成一个有向的工作流,完成从数据到数据处理,再到建模等一系列的数据挖掘工作。
属性区:该区域可以设置组建内参数的信息。
技术图片

阿里云机器学习的基础架构:
基础设施层:CPU计算集群
计算框架层:包括MaxReduce,SQL,MPI等计算方式,分布式计算框架主要执行并行化计算分发任务。
技术图片

机器学习PAI的优点:1.算法丰富 2.深度学习(GPU) 3.可视化操作界面
4.一站式服务
同时,PAI的深度学习支持算法框架:1.Tensorflow 2.Caffe 3.MXNet

在机器学习平台上完成以下基本任务:
开通机器学习服务
数据准备
数据预处理
数据可视化
算法建模
模型评估
其中数据准备阶段,机器学习平台底层支持两种数据源,一种是MaxCompute存储数据,另一种是OSS存储数据。
注意:使用MaxCompute作为存储,建议当数据小于20MB时使用机器学习IDE环境上传,当数据大于20MB时使用命令行工具上传。

开通机器学习PAI,并且创建项目,开通时注意自己选择的地域。
技术图片

2.数据准备,进入机器学习平台,单击数据源,创建表。
IDE端上传数据到Maxcompute
技术图片

OSS上传数据创建新空白数据
技术图片

  1. 数据准备完成后,单击组件,在工具和数据预处理文件夹下将SQL脚本、类型转换、归一化组件拖到画布中,并拼接成如下实验。
    技术图片
  2. 数据可视化
    技术图片
  3. 在机器学习->二分类文件夹下,将逻辑回归二分类组件拖入画布。
    在右侧的字段设置页签,将目标列设置为ifhealth,训练特征列选择除目标列以外的全部列,并拼接运行,如下图所示。
    技术图片
    6.模型评估
    在机器学习->评估文件夹下,将二分类评估组件拖入画布。在画布右侧的字段设置页签,将原始标签列列名设置为ifhealth,并连接对应的组件流和数据流。
    单击运行。完成后右键单击二分类评估组件,选择查看评估报告,单击图表页签,得到不同参数下训练的LR模型的ROC曲线,如下图所示。
    技术图片
    技术图片
    技术图片

喜欢记得来一个
技术图片
技术图片
“哪吒头”—玩转小潮流

阿里云机器学习PAI介绍

标签:img   类型   归一化   增强   交互   名称   架构   页签   code   

原文地址:https://blog.51cto.com/14993422/2548627

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!