机器学习领域有个很重要的假设:独立同分布假设,就是假设训练数据和测试数据是满足相同分布的,这是通过训练数据获得的模型能够在测试集获得好的效果的一个基本保障。神经网络学习过程本质上是为了学习数据的分布,一旦训练数据与测试数据的分布不同,那么网络的泛化能力也大大降低;另一方面,一旦在mini-batch ...
分类:
其他好文 时间:
2020-07-10 11:32:44
阅读次数:
57
回顾梯度下降和正规方程:https://www.cnblogs.com/ssyfj/p/12788147.html 一:正规方程解法 (一)加载数据 import numpy as np import matplotlib.pyplot as plt def loadDataSet(filename ...
分类:
其他好文 时间:
2020-07-10 00:42:42
阅读次数:
227
一个模型,两个假设,三个问题。 思路:HMM=>在机器学习大框架中的位置=>模型参数(示意图及定义)=>模型假设=>模型的应用:三个问题(及其数值求解算法)=>各个问题的具体应用场景(看文献) (来源:B站up主,shuhuai008,板书) 参考资料: 1.https://www.bilibili ...
分类:
其他好文 时间:
2020-07-09 22:30:15
阅读次数:
77
SparkSQL在机器学习场景中应用第四范式已经在很多行业落地了上万个AI应用,比如在金融行业的反欺诈,媒体行业的新闻推荐,能源行业管道检测,而SparkSQL在这些AI应用中快速实现特征变换发挥着重要的作用SparkSQL在特征变换主要有一下几类1.多表场景,用于表之间拼接操作,比如交易信息表去拼接账户表2.使用udf进行简单的特征变换,比如对时间戳进行hour函数处理3.使用时间窗口和udaf
分类:
数据库 时间:
2020-07-09 17:54:20
阅读次数:
99
模拟内存计算如何解决边缘人工智能推理的功耗挑战 How analog in-memory computing can solve power challenges of edge AI inference 机器学习和深度学习已经成为生活中不可或缺的一部分。人工智能(AI)应用通过自然语言处理(NLP ...
分类:
其他好文 时间:
2020-07-09 13:51:53
阅读次数:
76
心得体会 1.计算每一个特征值在不同结果占比,例特征值c在结果A的所有特征的“占比”rA ,在结果B的所有特征“占比”rB,rB>rA使说明B结果可能性大 2.得到一条数据,将该数据转换成特征向量,计算所有特征值生成的不同结果的概率,选择其中概率最大的结果,例PA>PB,则该数据结果为PA 3.通过 ...
分类:
其他好文 时间:
2020-07-09 12:39:33
阅读次数:
74
心得体会 1交叉验证:从训练的数据里随机抽取作为测试集 # 4-6朴素贝叶斯过滤垃圾邮件 #朴素贝叶斯交叉验证 def textParse(bigString): import re listOfTokens=re.split('\\W+',bigString) return [tok.lower( ...
分类:
其他好文 时间:
2020-07-09 11:59:40
阅读次数:
68
1. from Arthur Samuel:Field of study that gives computers the ability to learn without being explicitly programmed. 即:不直接针对问题进行编程的情况下,赋予机器学习的能力。 2. fr ...
分类:
其他好文 时间:
2020-07-08 19:52:57
阅读次数:
80
为什么edge AI是一个无需大脑的人 Why edge AI is a no-brainer 德勤预计,到2020年,将售出超过7.5亿个edge AI芯片,即在设备上而不是在远程数据中心执行或加速机器学习任务的全芯片或芯片的一部分,收入将达到26亿美元。此外,边缘人工智能芯片市场的增长速度将远远 ...
分类:
其他好文 时间:
2020-07-08 11:44:30
阅读次数:
145
熟练《机器学习实战》和《花书》中的所有知识点 熟练《剑指Offer》中的所有知识点 熟练Pytorch操作 经常参加和复现Kaggle竞赛 数据降维:复现PCA、LE、LLE、LBP 集成学习:复现Kaggle竞赛前5名 强化学习:复现Kaggle竞赛前5名 深度学习:复现ImageNet竞赛上的一 ...
分类:
其他好文 时间:
2020-07-07 10:25:01
阅读次数:
85