一:问题规划 这一章中将讨论推荐系统的有关内容,它是在机器学习中的一个重要应用。 机器学习领域的一个伟大思想:对于某些问题,有一些算法可以自动地学习一系列合适的特征,比起手动设计或编写特征更有效率。这是目前做的比较多的研究,有一些环境能让你开发某个算法来学习使用那些特征。 接下里让我们通过推荐系统的 ...
分类:
其他好文 时间:
2020-05-25 00:05:59
阅读次数:
117
1.读取 2.数据预处理 3.数据划分—训练集和测试集数据划分 from sklearn.model_selection import train_test_split x_train,x_test, y_train, y_test = train_test_split(data, target, ...
分类:
其他好文 时间:
2020-05-24 16:48:39
阅读次数:
72
[toc] 遗传 选择,交叉,变异 模拟退火 假设前一个状态为$x(n)$,系统根据某一规则(比如梯度下降)使状态变为$x(n+1)$时,系统的能量(通过损失函数算得)由$E(n)$变为E(n+1),定义由$x(n)$到$x(n+1)$的状态转化的接受概率为: $P=\left\{\begin{ma ...
分类:
其他好文 时间:
2020-05-24 11:37:03
阅读次数:
75
决策树的定义 决策树是我本人非常喜欢的机器学习模型,非常直观容易理解,并且和数据结构的结合很紧密。我们学习的门槛也很低,相比于那些动辄一堆公式的模型来说,实在是简单得多。 其实我们生活当中经常在用决策树,只是我们自己没有发现。决策树的本质就是一堆if else的组合,举个经典的例子,比如我们去小摊子 ...
分类:
编程语言 时间:
2020-05-24 10:01:31
阅读次数:
52
第十二章 如何锻炼数据科学技能 (资深数据科学家 & 创新领袖) 数据科学是一个结合了应用数学,计算机科学,商业资讯和新产品研发的综合职位。统计学,机器学习,sql,hadoop,java(数据科学家应该像瑞士军刀一样多才多艺,能够在诸多领域多才多艺,并且在一两个领域内拥有深邃的真知灼见。)商业资讯 ...
分类:
其他好文 时间:
2020-05-24 09:17:20
阅读次数:
65
人工智能理解常识的数十年挑战,如何让 AI 不再“智障”? 最新一波 AI 进步浪潮,结合了机器学习与大数据,已为我们提供能够对口头命令做出响应的工具,以及可以识别道路前方物体的自动驾驶汽车。 但不得不说,这些所谓“智能”产品的常识基本为零。 亚马逊智能助理 Alexa 与苹果智能助理 Siri 可 ...
分类:
其他好文 时间:
2020-05-23 18:06:26
阅读次数:
65
1、最大熵模型 最大熵模型描述的是这么一种情况,即在有约束条件的情况下,如何得到最好的模型。我们先来考虑如果没有约束的条件下,如何获得最好的模型,举个栗子,比如一个骰子,有6个面,转一次,求每个面的概率,根据经验,每个面的概率是1/6,这其实就是我们让整个系统熵最大。 那么什么是在有约束条件下概率最 ...
分类:
其他好文 时间:
2020-05-23 13:16:03
阅读次数:
54
[TOC] 我有一点点机器学习的基础,这一章阅读起来还是比较轻松。 1 统计学习 1.1 背景 这里首先要介绍一下 贝叶斯派 和 频率派 。举个栗子:一个病毒检测试剂,如果受检者为阳性,误检率为1%,如果受检者为阴性,误检率为2%;若人群中某个人的检测结果为阳性,则此人携带病毒的概率是多少。概率派观 ...
分类:
其他好文 时间:
2020-05-23 10:03:51
阅读次数:
86
Alink 是阿里巴巴基于实时计算引擎 Flink 研发的新一代机器学习算法平台,是业界首个同时支持批式算法、流式算法的机器学习平台。本文将从模型角度入手带领大家来再次深入Alink。 ...
分类:
其他好文 时间:
2020-05-23 09:58:18
阅读次数:
99
模型有很多参数,如何找到最佳的参数组合? 调整参数何时为止:应该遵循偏差和方差协调的原则。 本章将介绍: 调整参数对机器学习的重要性 如何使用网格搜索优化参数 如何使用随机搜索优化参数 机器学习算法调参 调整算法参数是采用机器学习解决问题的最后一个步骤,有时也被称为超参数优化。 参数可以分为两种:一 ...
分类:
编程语言 时间:
2020-05-23 09:19:48
阅读次数:
52