一、 1.在这节课中我们将补充一些缺失的细节,并且介绍一些在实际中应用这些思想,例如怎么处理支持向量机中的偏差分析。上节课我们谈到选择标记点的过程,比如l(1),l(2)和l(3)使我们能够定义相似度函数,我们也称之为核函数,在这个例子中,我们的相似度函数为高斯核函数,这使得我们能够构造一个预测函数 ...
分类:
其他好文 时间:
2019-02-02 14:15:19
阅读次数:
184
1.导弹拦截 (+贪心) 两问:一个导弹拦截系统最多能拦多少导弹 要拦截所有导弹至少需要多少拦截系统 第一问感觉是一个比较巧妙的方法: 维护一个单调递减的序列 length[] 记录的是拦截导弹的高度 当下一个导弹小于 length[] 最后一个数(最小的数)则直接把它加在序列后即可 若大于 则找到 ...
分类:
其他好文 时间:
2019-01-30 00:17:49
阅读次数:
173
1.句子如下: 2.分词: 2.词频向量化: 4.计算2个向量的相似度: ...
分类:
编程语言 时间:
2019-01-29 18:08:23
阅读次数:
413
1 TensorFlow使用 分析流程: 1.1 使用gensim加载预训练中文分词embedding 加载预训练词向量模型:https://github.com/Embedding/Chinese-Word-Vectors/ 查看词语的向量模型表示: 维度为300 词语相似度:向量余弦值 最相似的 ...
分类:
编程语言 时间:
2019-01-28 21:08:12
阅读次数:
308
感知哈希算法(perceptual hash algorithm),它的作用是对每张图像生成一个“指纹”(fingerprint)字符串,然后比较不同图像的指纹。结果越接近,就说明图像越相似。 实现步骤: 1. 缩小尺寸:将图像缩小到8*8的尺寸,总共64个像素。这一步的作用是去除图像的细节,只保留 ...
分类:
其他好文 时间:
2019-01-24 20:06:57
阅读次数:
340
将开发过程中较好的一些代码段备份一下,下面的代码是关于C#通过编辑距离计算两个字符串的相似度的代码,应该能对码农们有些帮助。usingSystem;usingSystem.Text.RegularExpressions;usingSystem.Threading.Tasks;namespaceLevenshtein{publicdelegatevoidAnalyzerCompletedHander
聚类评估:轮廓系数 计算样本到同簇其他样本的平均距离ai, ai越小,说明样本越应该被聚类到该簇 计算样本到其他簇样本的平均距离bi,这个称为样本与簇Cj的不相似度 s(i) = (b(i) - a(i)) / max(b(i), a(i)) si 接近1, 说明b(i) 远大于a(i), 说明分类 ...
分类:
其他好文 时间:
2019-01-21 12:12:51
阅读次数:
133
无监督问题,我们手里没有标签 聚类:相似的东西聚在一起 难点:如何进行调参 K-means算法 需要制定k值,用来获得到底有几个簇,即几种类型 质心:均值,即向量各维取平均值 距离的度量: 欧式距离和余弦相似度 优化目标: min∑∑dist(ci, xi) 即每种类别的数据到该类别质心距离的之和最 ...
分类:
编程语言 时间:
2019-01-19 13:20:27
阅读次数:
185
贝叶斯里面的参数原理 最大似然: 即最符合观测数据的最有优势,即p(D|h)最大 奥卡姆剃刀:即越常见的越有可能发生,即p(h) 表示的是先验概率 最大似然: 当我们投掷一枚硬币,观测到的是正面,那么我们猜测投掷正面的概率为1,即最大似然值的概率是最大的 奥卡姆剃刀: 如果平面上有N个点,我们使用n ...
分类:
其他好文 时间:
2019-01-18 19:59:07
阅读次数:
224
SPSS-聚类分析介绍 聚类分析,就是按照个体的特征将他们分类,目的在于让同一个类别内的个体之间具有较高的相似度,而不同类别之间具有较大的差异性。 我们可以对变量进行聚类,但是更常见的还是对个体进行聚类,也就是样本聚类。例如对用户、渠道、商品、员工等方面的聚类,聚类分析主要应用在市场细分、用户细分等... ...
分类:
其他好文 时间:
2019-01-18 10:16:19
阅读次数:
422