https://blog.csdn.net/baristas/article/details/78974090 在ElasticSearch中默认fielddata默认是false的,因为开启Text的fielddata后对内存的占用很高index:megacorptype:employee 如果进 ...
分类:
其他好文 时间:
2020-02-20 11:42:38
阅读次数:
927
1 sklearn简介 Scikit learn(sklearn)是机器学习中的第三方模块,封装了常用的机器学习算法,涉及回归、降维、分类以及聚类等,提供python接口。 虽然sklearn容纳的算法众多,但使用其中大多数算法的模式(套路)都是一样的,一般流程如下: 1 引入相关数据(包括训练集与 ...
分类:
其他好文 时间:
2020-02-19 21:14:14
阅读次数:
78
Anaconda详细安装及使用教程(带图文)原创代码帮 最后发布于2018-08-15 17:48:52 阅读数 440437 收藏展开Anacond的介绍Anaconda指的是一个开源的Python发行版本,其包含了conda、Python等180多个科学包及其依赖项。 因为包含了大量的科学包,A ...
分类:
其他好文 时间:
2020-02-15 18:19:37
阅读次数:
73
Java的封装(数据的隐藏) 高内聚,低耦合: 1.1. 高内聚:类的内部数据操作细节自己完成。 1.2. 低耦合:仅留出少量方法给外部使用。 封装(数据的隐藏):通常,因禁止直接访问一个对象中数据的实际表示,而是通过接口来访问。 总而言之:属性私有(希望属性尽量private),get/set。 ...
分类:
编程语言 时间:
2020-02-13 00:10:05
阅读次数:
75
(一) 数据处理 ① 插值拟合 主要用于对数据的补全和基本的趋势分析 ② 小波分析,聚类分析(高斯混合聚类,K-均值聚类等等) 主要用于诊断数据异常值并进行剔除 ③ 主成成分分析、线性判别分析、局部保留投影等 主要用于多维数据的降维处理,减少数据冗余 ④ 均值、方差分析、协方差分析等统计方法 主要用 ...
分类:
其他好文 时间:
2020-02-12 16:28:34
阅读次数:
117
前言:人工智能机器学习有关算法内容,请参见公众号“科技优化生活”之前相关文章。人工智能之机器学习主要有三大类:1)分类;2)回归;3)聚类。今天我们重点探讨一下卷积神经网络(CNN)算法。 ^_^ 20世纪60年代,Hubel和Wiesel在研究猫脑皮层中用于局部敏感和方向选择的神经元时发现其独特的 ...
分类:
其他好文 时间:
2020-02-11 16:22:43
阅读次数:
210
把像素扔进K-Means函数里,然后给像素添加不同的灰度并输出。 图像分割常用方法: 1. 阈值分割:对图像灰度值进行度量,设置不同类别的阈值,达到分割的目的。 2. 边缘分割:对图像边缘进行检测,即检测图像中灰度值发生跳变的地方,则为一片 区域的边缘。 3. 直方图法:对图像的颜色建立直方图,而直 ...
分类:
其他好文 时间:
2020-02-08 00:20:11
阅读次数:
51
介绍 为训练营课程 《Python 数据分析入门与进阶》的第八节,在该章节中我们将利用提供的课程数据来进行一次实战性质的时间序列和聚类分析。 知识点 数据处理 数据可视化 中文分词 文本聚类 数据概览 本次课程的数据来源于运行过程中产生的真实数据,我们对部分数据进行了脱敏处理。 首先,我们需要下载课 ...
分类:
编程语言 时间:
2020-02-07 15:14:00
阅读次数:
128
目标: 1)创建图的表征矩阵2)分解:计算矩阵的特征值和特征向量;基于一个或多个特征值,将每个点表示成低维的表征3)分组:基于新的表征,进行聚类例如,二分图中如何确定好的分类?类间差异大,类内差异小最小割集考虑:1)团外的连接性2)团内的连接性评价方式:团间的连接性与每个团的密度相关spectral... ...
分类:
其他好文 时间:
2020-02-07 01:18:17
阅读次数:
62
网络中的机器学习节点分类链接预测机器学习的生命圈需要特征工程网络的特征学习——特征向量 embeddingnetwork embedding的意义节点的表征节点的相似度衡量→网络相似度衡量网络信息编码,生成节点表征用途:异常检测,属性预测,聚类,关系预测例子:deepwalk难度:当前的深度学习视为... ...
分类:
其他好文 时间:
2020-02-07 00:58:56
阅读次数:
134