单轮对话 一般是基于检索的,回答句对 Or 知识库 评价指标 召回率,准确率,问题解决率 召回率 = 能回答的总数 / 问题总数 准确率 = 正确回答数量 / 问题总数 问题解决率 = 机器人成功解决的问题数量 / 问题总数,该指标一般用来替代准确率(准确率需要人工标记,统计复杂) 机器人成功解决的 ...
分类:
其他好文 时间:
2019-12-01 18:33:36
阅读次数:
160
本文整理了60个机器学习算法应用场景实例,含分类算法应用场景20个、回归算法应用场景20个、聚类算法应用场景10个以及关联规则应用场景10个。包含了天池、DataCastle、DataFountain中所有竞赛场景。 目录 1 分类算法应用场景实例 1.1 O2O优惠券使用预测 1.2 市民出行选乘 ...
分类:
编程语言 时间:
2019-11-30 09:25:43
阅读次数:
126
MATLAB聚类有效性评价指标(外部 成对度量) 作者:凯鲁嘎吉 - 博客园 http://www.cnblogs.com/kailugaji/ 更多内容,请看:MATLAB: Clustering Algorithms, MATLAB聚类有效性评价指标(外部) 前提:数据的真实标签已知!TP:真阳 ...
分类:
其他好文 时间:
2019-11-25 11:46:35
阅读次数:
152
聚类算法 概述 无监督问题 手中无标签 聚类 将相似的东西分到一组 难点 如何 评估, 如何 调参 基本概念 要得到的簇的个数 - 需要指定 K 值 质心 - 均值, 即向量各维度取平均 距离的度量 - 常用 欧几里得距离 和 余弦线相似度 ( 先标准化 ) 优化目标 - 需求每个簇中的点, 到质心 ...
分类:
编程语言 时间:
2019-11-25 09:42:34
阅读次数:
54
一、领域建模的概念 业务领域建模是描述业务用例实现的对象模型。它是对业务角色和业务实体之间应该如何联系和协作以执行业务的一种抽象。通俗来说就是我们设计一个系统,总是希望它能解决一些问题,这些问题总是会映射到现实问题和概念。对这些问题进行归纳、分析的过程就是领域建模。 二、建立领域模型的好处: 1、通 ...
分类:
其他好文 时间:
2019-11-24 17:44:07
阅读次数:
87
基本思想:通过迭代寻找K个簇的一种划分方法,使得聚类结果对应的代价函数最小。特别地,代价函数可以定义为各个样本距离所属聚类中心的误差平方和 $$J(c, \mu) = \sum \limits_{i=1}{M}||x_i \mu_{c_i}||^2?$$ 具体步骤 数据预处理,如归一化、离群点处理等 ...
分类:
其他好文 时间:
2019-11-24 15:51:17
阅读次数:
70
原理 聚类、高维可视化、数据压缩、特征提取 自组织映射神经网络本质上是一个两层的神经网络,包含输入层和输出层(竞争层)输出层中神经元的个数通常是聚类的个数 训练时采用“竞争学习”方式,每个输入在输出层中找到一个和它最匹配的节点,称为激活节点。紧接着用随机梯度下降法更新激活节点的参数,同时,激活节点临 ...
分类:
其他好文 时间:
2019-11-24 15:45:03
阅读次数:
87
这里只讨论没有外部标签的情况,有标签自然好判别 数据簇的特点 以中心定义的数据簇:通常球形分布,集合中的数据到中心的距离相比到其他簇中心的距离更近 以密度定义的数据簇:当数据簇不规则或互相盘绕,并且有噪声和离群点时,常常使用 以连通定义的数据簇:具有连通关系 以概念定义的数据簇:同一集合内数据具有某 ...
分类:
编程语言 时间:
2019-11-24 15:44:50
阅读次数:
91
本文节选自: https://www.antiy.cn/doc/market/201204.pdf 安天实验室 肖新光 互联网用户泛隐私安全 热点问题回顾与浅析 2012年发表 免费模式与传统安全价值的冲突过去我们探讨隐私时,往往用微技术化观点或泛道德观点来考虑这个问题,缺少对这种隐私威胁 风起云涌 ...
分类:
其他好文 时间:
2019-11-21 18:35:11
阅读次数:
85
k均值聚类算法(k-means clustering algorithm)是一种迭代求解的聚类分析算法,其步骤是随机选取K个对象作为初始的聚类中心,然后计算每个对象与各个种子聚类中心之间的距离,把每个对象分配给距离它最近的聚类中心。聚类中心以及分配给它们的对象就代表一个聚类。每分配一个样本,聚类的聚 ...
分类:
编程语言 时间:
2019-11-20 14:11:33
阅读次数:
97