信息的度量 信息熵 entropy 用h表示信息的作用在于消除不确定性 互信息两件事相关性的度量,在了解其中一个的前提下,对消除另一个不确定性提供的信息量 香农第一定理 一个信息,任何编码的长度都不小于它的信息熵 pagerank算法核心思想: 如果一个网页被很多其他网页所链接,说明它受到普遍的承认 ...
分类:
其他好文 时间:
2018-05-23 20:27:02
阅读次数:
183
我们把按照时间次序排列的随机变量序列 $$Y_0,\, Y_1,\, Y_2, \cdots $$ 称为时间序列(Time Series)。比如网站的PV、DAU,国家的GDP,股票的价格等。 这种特别的次序给模型提出了特别的挑战,包含数据内的自相关性、不可交换性、以及数据和参数的不平稳性等。 时间 ...
分类:
其他好文 时间:
2018-05-19 15:44:44
阅读次数:
291
背景 大家有没有考虑过,工作(编程)一段时间之后,我们都会出现技术上的瓶颈,怎么去突破? 我自身领悟到的是,除了抽象问题能力的提升外,如对问题宏观角度理解,还有很多是逻辑上的推理能力! 在日常工作中,我们有没有把系统功能往数学相关性上考虑呢?马克思一生也不断的在探索数学知识,在写资本论的时候,经常会 ...
分类:
其他好文 时间:
2018-05-16 22:44:24
阅读次数:
228
一、递归 算法:计算一些比较复杂的问题,所采用的在空间上(内存里)或者时间(执行时间)上更有优势的方法 排序: 递归求解二分查找算法:有序的数字集合的查找问题 二、常用模块 模块:py文件,模块是写好了但不直接使用的功能 常用的和某个操作相关的,根据相关性分类分成不同的模块 模块分为三种: 内置模块 ...
分类:
其他好文 时间:
2018-05-12 00:06:13
阅读次数:
153
设计模式六大基本原则 1.单一职责原则 英文:Single Responsibility Principles,缩写SRP 定义:就一个类而言,应该仅有一个引起它变化的原因。 理解:例如两个完全不一样的功能就不应该放在一个类中。一个类总应该是一组相关性很高的函数,数据的封装。 对应一个类,不求功能面 ...
分类:
其他好文 时间:
2018-05-10 17:25:59
阅读次数:
176
注:该部分参考kaggle房价模型的大神Pedro Marcelino提供的kernel 在我们拿到数据后,应该预先分析一下数据。 1、总览数据 通过以上可以对数据有大体的了解,会发现既有数值型数据,也有类别型数据。注意区别。 2、对特定列进行分析 and 偏度(skewness)也称为偏态、偏态系 ...
分类:
其他好文 时间:
2018-05-09 01:16:46
阅读次数:
249
前言 这篇文章的开头,笔者想多说两句,不过也是为了以后再也不多嘴这样的话。 在日常工作中,笔者接触得最多的开发工作仍然是在 .NET Core 平台上,当然因为团队领导的开放性和团队风格的多样性(这和 CTO 以及主管的个人能力也是分不开的),业界前沿的技术概念也都能在上手的项目中出现。所以虽然现在 ...
分类:
Web程序 时间:
2018-05-07 14:49:26
阅读次数:
387
搜索 概念 映射(Mapping) 数据在每个字段中国的解释说明 分析(Analysis) 全文是如何处理可以被搜索的 领域的特定查询语言(Query DSL) Elasticsearch,强大的查询语言 返回参数 hits 包含匹配到的文档的总数 _score 相关性得分,衡量了文档与查询的匹配程 ...
分类:
其他好文 时间:
2018-05-06 23:30:53
阅读次数:
322
很久没有写Spring Boot的内容了,正好最近在写Spring Cloud Bus的内容,因为内容会有一些相关性,所以先补一篇关于AMQP的整合。 http://www.ljhseo.com/http://www.xyrjkf.net/http://www.xyrjkf.cn/http://ww ...
分类:
编程语言 时间:
2018-05-06 21:26:46
阅读次数:
302
# 过滤式特征选择法的原理 使用发散性或相关性指标对各个特征进行评分,选择分数大于阈值的特征或者选择前K个分数最大的特征。 # 过滤式特征选择法的特点 特征选择过程与学习器无关,相当于先对初始特征进行过滤,再用过滤后的特征训练学习器。过滤式特征选择法简单、易于运行、易于理解,通常对于理解数据有较好的... ...
分类:
其他好文 时间:
2018-04-30 16:34:55
阅读次数:
318