概率图模型构建了这样一幅图,用观测节点表示观测到的数据,用隐含节点表示潜在的知识,用边来描述知识与数据的相互关系,最后基于这样的关系图获得一个概率分布,非常“优雅”地解决的问题。 概率图模型包括了朴素贝叶斯模型、最大熵模型、隐马尔可夫模型、条件随机场、主题模型等。主要在NLP领域用的较为广泛 1 概 ...
分类:
其他好文 时间:
2019-07-21 01:49:40
阅读次数:
146
一、简介 https://cloud.tencent.com/developer/article/1058777 1、LDA是一种主题模型 作用:可以将每篇文档的主题以概率分布的形式给出【给定一篇文档,推测其主题分布】。 从而通过分析一些文档抽取出它们的主题(分布)出来后,便可以根据主题(分布)进行 ...
分类:
其他好文 时间:
2019-07-08 12:01:06
阅读次数:
175
先上代码 后面再补充说明,代码来自于 机器学习基础 吕云翔 ...
分类:
其他好文 时间:
2019-06-24 00:14:29
阅读次数:
141
【Gradle】eclipse导入Gradle项目 Echarts:https://echarts.baidu.com/echarts2/doc/example.html 使用NSIS打包一个客户端的完整示例 主题模型一——潜在隐语义索引(LSI/LSA) RestSharp 一个.NET(C#)的 ...
分类:
其他好文 时间:
2019-05-29 15:12:00
阅读次数:
121
最近学习主题模型pLSA、LDA,就想拿来试试中文。首先就是找文本进行切词、去停用词等预处理,这里我找了开源工具IKAnalyzer2012,下载地址:(:(注意:这里尽量下载最新版本,我这里用的IKAnalyzer2012.zip 这本版本后来测试时发现bug,这里建议IKAnalyzer2012 ...
分类:
其他好文 时间:
2019-04-15 18:10:26
阅读次数:
278
摘要: 两篇文档是否相关往往不只决定于字面上的词语重复,还取决于文字背后的语义关联。对语义关联的挖掘,可以让我们的搜索更加智能化。本文着重介绍了一个语义挖掘的利器:主题模型。主题模型是对文字隐含主题进行建模的方法。它克服了传统信息检索中文档相似度计算方法的缺点,并且能够在海量互联网数据中自动寻找出文 ...
分类:
其他好文 时间:
2019-02-17 23:39:34
阅读次数:
273
函数说明 1.LDA(n_topics, max_iters, random_state) 用于构建LDA主题模型,将文本分成不同的主题 参数说明:n_topics 表示分为多少个主题, max_iters表示最大的迭代次数, random_state 表示随机种子 2. LDA.component ...
分类:
其他好文 时间:
2019-01-27 01:06:51
阅读次数:
760
贝叶斯定理-执行数据分析解决肇事逃逸之谜 ? 在这一章中,我们将: 贝叶斯定理概况 当我们使用贝叶斯定理的时候,我们是在测量一件事发生的概论程度: ? 上式表示在给定事件B的情况下事件A发生的概率。 概率通常被量化为0和1之间的一个数,包括这两者;0表示不可能,1表示绝对肯定。概率越大,确定性越大。 ...
数据库 IO类 统计类 描述性统计 回归(包括统计和机器学习) 假设检验 时间序列 生存分析 机器学习类 分类器 LDA、QDA SVM(支持向量机) 基于临近 贝叶斯 决策树 Assemble方法 聚类 关联规则 神经网络 概率图模型 文本、NLP 基本操作 主题模型 与其他分析/可视化/挖掘/报 ...
分类:
编程语言 时间:
2019-01-03 22:37:25
阅读次数:
522
2. 隐语义模型 隐语义模型又可称为LFM(latent factor model),它从诞生到今天产生了很多著名的模型和方法,其中和该技术相关且耳熟能详的名词有pLSA、 LDA、隐含类别模型(latent class model)、隐含主题模型(latent topic model)、矩阵分解( ...
分类:
其他好文 时间:
2019-01-02 12:39:59
阅读次数:
186