1. 读邮件数据集文件,提取邮件本身与标签。 列表 numpy数组 2.邮件预处理 邮件分句 句子分词 大小写,标点符号,去掉过短的单词 词性还原:复数、时态、比较级 连接成字符串 2.1 传统方法来实现 2.2 nltk库的安装与使用 pip install nltk import nltk nl ...
分类:
其他好文 时间:
2020-06-07 14:56:00
阅读次数:
66
贝叶斯 贝叶斯(约1701-1761) Thomas Bayes,英国数学家。约1701年出生于伦敦,做过神甫。1742年成为英国皇家学会会员。1761年4月7日逝世。贝叶斯在数学方面主要研究概率论。他首先将归纳推理法用于概率论基础理论,并创立了贝叶斯统计理论,对于统计决策函数、统计推断、统计的估算 ...
分类:
其他好文 时间:
2020-06-06 21:57:18
阅读次数:
78
文章迁移说明:此文已由lightinglei于2019-02-18发布,是本人的另外一个账号,现同步迁移至本账号 一、朴素贝叶斯原理介绍 书籍上对概念的介绍,因引入了很多数学符号,看起来比较晦涩难懂,下面我们以案例的形式先带大家回顾下概率的一些基本知识点,下表为互联网行业不同岗位、不同体重是否会被女 ...
分类:
编程语言 时间:
2020-06-06 12:46:14
阅读次数:
71
朱迪亚·珀尔(JudeaPearl)——以色列裔美籍计算机科学家、哲学家,以倡导人工智能的概率方法和贝叶斯网络而闻名。他还因在结构模型的基础上发展出因果和反事实推论而受到广泛称赞。2011年,ACM授予JudeaPearl图灵奖,以表彰他“通过发展概率和因果推理演算对人工智能做出的基础性贡献”。JudeaPearl在2018年出版了一本新著《为什么:关于因果关系的新科学》系统总结了自己近25年关于
分类:
其他好文 时间:
2020-06-06 09:27:12
阅读次数:
200
概率图模型(PGM)是一种对现实情况进行描述的模型。其核心是条件概率,本质上是利用先验知识,确立一个随机变量之间的关联约束关系,最终达成方便求取条件概率的目的。 1.从现象出发 这个世界都是随机变量 这个世界都是随机变量。 第一,世界是未知的,是有多种可能性的。 第二,世界上一切都是相互联系的。 第 ...
分类:
其他好文 时间:
2020-06-04 00:54:47
阅读次数:
133
EM算法(Expectation-maximization),又称最大期望算法,是一种迭代算法,用于含有隐变量的概率模型参数的极大似然估计(或极大后验概率估计) 从定义可知,该算法是用来估计参数的,这里约定参数为 。既然是迭代算法,那么肯定有一个初始值,记为 ,然后再通过算法计算 通常,当模型的变量 ...
分类:
编程语言 时间:
2020-06-03 23:28:33
阅读次数:
88
本福特定律 概率公式 贝叶斯公式 重要分布 Beta分布 事件的独立性 期望与方差 协方差 Pearson相关系数 切比雪夫不等式 大数定律 中心极限定理 最大似然估计 ...
分类:
其他好文 时间:
2020-06-03 23:10:13
阅读次数:
66
本篇文章将从贝叶斯公式出发,探究贝叶斯到底是啥,以及其在认知层面的巨大作用。不过据说每出现 1 个公式,文章阅读将下降 1/3。 华为大佬说:人工智能就是统计学。在我眼中,贝叶斯公式就是统计学走向机器学习的起点。 贝叶斯公式 贝叶斯定理(Bayes’s Rule):如果有k个相互独立事件 A1,A2 ...
分类:
其他好文 时间:
2020-06-03 20:08:55
阅读次数:
57
一,古典概型: 1,事件的关系 2,事件的独立及乘法公式 3,全概率公式 :P(B)=E(1-n)P(Ai)*P(B|Ai) 完备事件组:任意2个为空集,全部事件为全集 4,贝叶斯公式:已知完备事件组,B 求B发生条件Ai代表的全概率事件组发生的概率 二、随机概率分布的数字特征:期望及方差 ...
分类:
其他好文 时间:
2020-05-25 09:47:04
阅读次数:
172