什么是大数据? 大数据(big data,mega data),或称巨量资料,指的是需要新处理模式才能具有更强的决策力、洞察力和流程优化能力的海量、高增长率和多样化的信息资产。 在维克托·迈尔-舍恩伯格及肯尼斯·库克耶编写的《大数据时代》中大数据指不用随机分析法(抽样调查)这样的捷径,而采用所有数据 ...
分类:
其他好文 时间:
2018-06-10 00:33:52
阅读次数:
192
需要结合 http://anony3721.blog.163.com/blog/static/51197420111129503233/ 或者 https://blog.csdn.net/xiaoyanwin/article/details/15420707 食用。 ...
分类:
其他好文 时间:
2018-06-04 14:07:17
阅读次数:
803
一、基本思想 “模型已定,参数未知” 假如有一个罐子,里面有黑白两种颜色的球,数目多少不知,两种颜色的比例也不知。我们想知道罐中白球和黑球的比例,但我们不能把罐中的球全部拿出来数。现在我们可以每次任意从已经摇匀的罐中拿一个球出来,记录球的颜色,然后再放回罐中。这个过程可以重复,我们可以用记录的球的颜 ...
分类:
其他好文 时间:
2018-06-03 23:38:46
阅读次数:
210
简介 作用: 水塘抽样算法是一种抽样算法,对于一个很大的集合,抽取的样本值能够保证随机. 特点: 其复杂度并不很高 ,并且能够很大程度地节省内存. 问题导入 很多大公司的面试题都考察过这个算法,以谷歌为例,有一道关于水塘抽样的例题 我有一个长度为N的链表,N的值非常大,我不清楚N的确切值.我怎样能写 ...
分类:
编程语言 时间:
2018-06-01 15:35:43
阅读次数:
234
0 引言 模拟退火算法是用来解决TSP问题被提出的,用于组合优化。 1 原理 一种通用的概率算法,用来在一个打的搜索空间内寻找命题的最优解。它的原理就是通过迭代更新当前值来得到最优解。模拟退火通常使用均匀抽样的方式,得到区间上的N个状态,以各个状态点目标值的方差作为初始温度。 2 程序包 GenSA ...
分类:
编程语言 时间:
2018-05-28 22:49:28
阅读次数:
1559
Introduction to RBM 总结 标签(空格分隔): pgm Abstract: Restricted Boltzmann Machines(RMBs): RBM是一种概率图模型,也可以看作是随机神经网络的一种。 它可以作为Deep Belief Network的一个构成成分。 文章脉络 ...
分类:
其他好文 时间:
2018-05-26 20:26:59
阅读次数:
232
水塘抽样是一系列的随机算法,其目的在于从包含n个项目的集合S中选取k个样本,其中n为一很大或未知的数量,尤其适用于不能把所有n个项目都存放到主内存的情况。 在高德纳的计算机程序设计艺术中,有如下问题:可否在一未知大小的集合中,随机取出一元素?。或者是Google面试题: I have a linke ...
分类:
其他好文 时间:
2018-05-20 23:56:51
阅读次数:
183
七种常用的面向对象设计原则 单一职责原则(Single Responsibility Principle,SRP): 一个类只负责一个功能领域中的相应职责。 开闭原则(Open-Close Principle,OCP): 软件实体应对外扩展开放,而对修改关闭。 里氏代换原则(Liskov Subst ...
分类:
其他好文 时间:
2018-05-18 20:12:06
阅读次数:
182
嗨,我是伊曼纽尔。在本课中,我将教你关于连续轨迹规划。更具体地说,如何生成可拖动的轨迹。 在我们开始之前,让我简要介绍一下本课程。 首先,我们将定义运动规划问题,并讨论关于运动规划算法的一些重要概念和优先级。 然后,我们将快速回顾A * 为了让您为第一个新算法做好准备,我们将介绍称为Hybrid A ...
分类:
其他好文 时间:
2018-05-07 13:26:25
阅读次数:
164
1、boosting与bagging的区别: (1)bagging:从原始数据中随机抽样得到S个同样大小的数据集,来训练S个基学习器,各学习器之间互不依赖。是一种并行的方法。 各分类器的权重都是相等的。分类结果是用这S个分类器进行分类,选择分类器投票结果中最多的类别作为最后的分类结果。 (抽样方法为 ...
分类:
其他好文 时间:
2018-05-04 14:04:17
阅读次数:
240