在之前的文章当中,我们介绍过了简单的朴素贝叶斯分类模型,介绍过最小二乘法,所以这期文章我们顺水推舟,来讲讲 线性回归 模型。 线性回归的本质其实是一种 统计学 当中的回归分析方法,考察的是 自变量和因变量之间的线性关联 。后来也许是建模的过程和模型训练的方式和机器学习的理念比较接近,所以近年来,这个 ...
分类:
其他好文 时间:
2020-02-05 10:16:34
阅读次数:
71
除了线性代数,概率论(Probability theory)和统计学(Statistics)也是机器学习中常用的数学工具。陈希孺老先生的《概率论与数理统计》在知乎上的评价很高,我在上学期花时间读了一遍,读完的感觉是,本书的概率论部分可读性较强,举了很多例子帮助理解,通俗易懂,阐明了很多原理和联系,如 ...
分类:
其他好文 时间:
2020-02-04 10:43:04
阅读次数:
489
scala统计学生成绩 学生的成绩清单格式如下所示,第一行为表头,各字段意思分别为学号、性别、课程名 1、课程名 2 等,后面每一行代表一个学生的信息,各字段之间用空白符隔开 Id gender Math English Physics 301610 male 80 64 78 301611 fem ...
分类:
其他好文 时间:
2020-02-03 20:50:30
阅读次数:
834
统计学生成绩 学生的成绩清单格式如下所示,第一行为表头,各字段意思分别为学号、性别、课程名 1、课程名 2 等,后面每一行代表一个学生的信息,各字段之间用空白符隔开 Id gender Math English Physics 301610 male 80 64 78 301611 female 6 ...
分类:
其他好文 时间:
2020-02-03 18:45:13
阅读次数:
312
专业书籍 1. 《人工智能 马少平》188 / 322 2. 《深度学习入门之Pytorch》110 / 221 3. 《剑指offer》114 / 334 4. 《统计学习方法》 非专业书籍 1. 《活着》完 2. 《许三观卖血记》完 3. 《步履不停》完 4. 《庆余年》完 5. 《魔女霓裳》完 ...
分类:
其他好文 时间:
2020-02-02 23:48:56
阅读次数:
72
机器学习介绍 机器学习是实现人工智能的手段,其主要研究内容是如何利用数据或经验进行学习,改善具体算法的性能。 多领域交叉,涉及概率论、统计学、算法复杂度等多门学科。 分类:监督学习、无监督学习、强化学习(增强学习)、半监督学习、深度学习。 scikit-learn库介绍(sklearn) 依赖Num ...
分类:
其他好文 时间:
2020-02-02 20:03:57
阅读次数:
83
pandas从0.15版开始提供分类数据类型,用于表示统计学里有限且唯一性数据集,例如描述个人信息的性别一般就男和女两个数据常用'm'和'f'来描述,有时也能对应编码映射为0和1。血型A、B、O和AB型等选择可以映射为0、1、2、3这四个数字分别代表各个血型。pandas里直接就有categoric ...
分类:
其他好文 时间:
2020-02-01 16:08:27
阅读次数:
82
图书简介 实用性是本书的第一个基本出发点,书中介绍了近年来在工业界被广泛应 用的机器学习算法,这些算法经受了时间的考验,不但效果好而且使用方便。此 外作者也十分注意理论的深度和完整性,组织各章节的内容时力求由浅入深、推 理完整、先后连贯、自成体系,先讲统计学、矩阵、优化方法这些基础知识,再 由简到繁 ...
分类:
编程语言 时间:
2020-02-01 12:34:19
阅读次数:
79
1、写出自己寒假前3周的具体技术学习收获,所花时间及完成代码量。如在某些技术上所学习的哪些知识点,所花费的总小时,代码总行数。 花费20小时在pandas库学习,写技术博客,完成400行代码,涉及较多概率统计学知识还需重温和学习。 20小时在阅读软测教研论文大约5篇,及时处理院系寒假通知各项事宜,天 ...
分类:
其他好文 时间:
2020-01-31 12:26:47
阅读次数:
84
数据分析涉及统计学、线性代数、图形分析绘制、数据挖掘等知识,推荐系统学习电子资料《利用Python进行数据分析第2版》、《Python数据分析与挖掘实战》、《从零开始学Python数据分析与挖掘》电子书和代码测试。 《利用Python进行数据分析第2版》电子书代码,每一章之间有递进关系,适合在Pyt ...
分类:
编程语言 时间:
2020-01-29 01:18:02
阅读次数:
135