## **文档说明**本文档主要记录模型融合的有关问题:为了使项目在模型预测有更好的表现,综合机器学习方面的模型融合技术,以提升算法在解决问题的能力。 ## **使用背景** 业务情节:接单阶段; 时间段:2020 数据量:160W 特征数(本篇不对特征处理做说明):20 ## **数据处理**综合 ...
分类:
其他好文 时间:
2020-07-03 19:51:48
阅读次数:
68
1.数据分析概要 基础概念,matplotlib,numpy,pandas 2.为什么要学习数据分析? 对大量的数据进行统计分析,总结我们感兴趣的规律,用于生产。 从一堆数据中寻找经验规律 岗位需求,python数据科学的基础,机器学习课程的基础 3.什么是数据分析 数据分析是用适当的方法对手机来的 ...
分类:
其他好文 时间:
2020-07-03 10:54:36
阅读次数:
82
作者|Mauro Di Pietro 编译|VK 来源|Towards Data Science 摘要 在本文中,我将使用NLP和Python解释如何为机器学习模型分析文本数据和提取特征。 自然语言处理(NLP)是人工智能的一个研究领域,它研究计算机与人类语言之间的相互作用,特别是如何对计算机进行编 ...
分类:
其他好文 时间:
2020-07-02 16:19:36
阅读次数:
51
本文始发于个人公众号:TechFlow,原创不易,求个关注 今天是spark专题的第七篇文章,我们一起看看spark的数据分析和处理。 过滤去重 在机器学习和数据分析当中,对于数据的了解和熟悉都是最基础的。所谓巧妇难为无米之炊,如果说把用数据构建一个模型或者是支撑一个复杂的上层业务比喻成做饭的话。那 ...
分类:
其他好文 时间:
2020-07-02 13:20:51
阅读次数:
67
半监督学习 在有标签数据+无标签数据混合成的训练数据中使用的机器学习算法。一般假设,无标签数据比有标签数据多,甚至多得多。 要求: 无标签数据一般是有标签数据中的某一个类别的(不要不属于的,也不要属于多个类别的); 有标签数据的标签应该都是对的; 无标签数据一般是类别平衡的(即每一类的样本数差不多) ...
分类:
其他好文 时间:
2020-07-02 13:18:26
阅读次数:
60
k临近算法(解决分类问题): 已知数据集,以及该数据对应类型 给出一个数据x,在已知数据集中选择最接近x的k条数据,根据这k条数据的类型判断x的类型 具体实现: from numpy import * import operator def createDataSet(): group = arra ...
分类:
编程语言 时间:
2020-07-01 23:41:49
阅读次数:
60
原文:http://blog.chinaunix.net/uid-10289334-id-3758310.html 基于划分聚类算法(partition clustering) k-means: 是一种典型的划分聚类算法,它用一个聚类的中心来代表一个簇,即在迭代过程中选择的聚点不一定是聚类中的一个点 ...
分类:
编程语言 时间:
2020-07-01 16:16:44
阅读次数:
76
1. 工程界的恐慌 无论我自己亲眼所见还是道听途说,虽然国内兴起了一段人工智能的浪潮,但是在企业内部对这个领域的了解还是比较局限的。一般来说就是两个态度: 第一种是隔岸观火,这些人认为这个东西太遥远了,都是理论公式,和实际的应用没啥关系,等他们搞的差不多了,出了一些开源库(如tensorflow)我 ...
分类:
其他好文 时间:
2020-07-01 16:10:52
阅读次数:
94
机器人软件平台平台名称所属类型EvolutionRoboticsERSP平台商用MicrosoftRoboticsStudio平台非商业用途免费OROCOS控件库开源且免费Skilligent机器学习插件商用URBI平台商用Webots仿真环境商用Player,Stage,Gazebo平台开源且免费iRobotAWARE平台商用OpenJAUS平台开源CLARAty平台开源为什么要使用机器人软件开
分类:
其他好文 时间:
2020-07-01 15:53:14
阅读次数:
82
大数据的时代,网络爬虫已经成为了获取数据的一个重要手段。 但要学习好爬虫并没有那么简单。首先知识点和方向实在是太多了,它关系到了计算机网络、编程基础、前端开发、后端开发、App 开发与逆向、网络安全、数据库、运维、机器学习、数据分析等各个方向的内容,它像一张大网一样把现在一些主流的技术栈都连接在了一 ...
分类:
编程语言 时间:
2020-06-30 14:26:14
阅读次数:
46