目录 一、有针对地选择文献... 2 1.关键词、主题词检索:... 2 2. 检索某个学者:... 2 3. 参考综述检索:... 2 4. 注意文章的参考价值:... 2 二:陌生领域如何阅读文献... 2 三:文献阅读... 4 1.先找5 篇跟自己论文最相关的外文文章... 4 2.如何读标 ...
分类:
其他好文 时间:
2017-12-10 18:27:55
阅读次数:
122
为了更好的促进自然语言处理的发展:包括分词、文本分类、命名实体识别、句法分析、信息抽取、知识库构建、主题词识别、自动摘要、智能问答、语义理解、对话生成、话题推荐、语言模型、机器翻译、语义表示等方面在中文中的快速发展和广泛使用,必须很好的掌握汉语语法知识以及汉语词义网络的构建。本篇主要介绍汉语语法,汉 ...
分类:
其他好文 时间:
2017-11-04 21:40:54
阅读次数:
572
随着科技的发展,拥有高容量、高速度和多样性的大数据已经成为当今时代的主题词。移动互联网、云计算、大数据的快速发展,使Python给开发者带来巨大的机会。Python 不仅仅是一个设计优秀的程序语言,它能够完成现实中的各种任务,包括开发者们日复一日所做的事情。 百度指数概况 整体趋势 选择Python ...
分类:
编程语言 时间:
2017-09-04 19:53:05
阅读次数:
182
数据表: 数据类型: 帮助的三种形式: 在cmd中输入: help 要帮助的主题词,或 ? 要帮助的主题词 或 \h 要帮助的主题词 。 数据表的创建: 插入: 下面通过sql命令往student中插入数据: 通过mysql workbench可以看到数据结构。 下面通过python连接并操控mys ...
分类:
数据库 时间:
2017-06-09 19:18:10
阅读次数:
306
以下代码是Jibbslda中计算(文档-主题)和(主题-词)矩阵的代码实现计算Theta(文档-主题)nd[m][k]是文档m被分配到主题k的单词数量ndsum[m]是文档m中单词的数量K*trnModel.alpha//因为所有的alpha,beta是一样的所以,K*alpha为所有alpha的和publicvoidcomputeTheta(){for(intm=0;..
分类:
其他好文 时间:
2017-05-09 17:46:24
阅读次数:
138
1、问题一LDA求出主题-词概率phi之后。可以知道每个主题下每个词的概率,之后怎么确定每篇文档的主题分布呢?在gibbs抽样稳定之后,统计每篇文档topic出现的频率就可以算出来。2、问题二每个主题下的词有可能是相同的,只是概率不同而已。统计时这个应该算在哪个主题下?3、问..
分类:
其他好文 时间:
2017-04-26 19:09:46
阅读次数:
175
对文章best title的选项进行打分 第1题结果成功输出到文件:savefile\\save1.txt成功得到结果:4.272724.311054.247894.24789答案是:B 正确 第2题结果成功输出到文件:savefile\\save2.txt成功得到结果:4.307854.31105 ...
分类:
编程语言 时间:
2017-01-24 21:52:39
阅读次数:
299
http://www.52ml.net/1917.html 主题模型LDA(latent dirichlet allocation)的应用还是很广泛的,之前我自己在检索、图像分类、文本分类、用户评论的主题词抽取等都用过,做feature、降维等。例如可以用主题维度来表示原来的字典维度,大大的降低了文 ...
分类:
其他好文 时间:
2016-12-22 14:55:29
阅读次数:
186
一.聚类算法: 1.1LDA算法: 算法的目的:对文本进行聚类,得到几簇相似的样本。 算法的流程: 预处理:统计sscCorpus中所有的词、词频、词的标号。 初始化:形成初始的文章-主题和主题-词的矩阵(最开始) Gibbs 采样:使用Gibbs采样得到稳定的文章-主题和主题-词的矩阵 每一簇的主 ...
分类:
编程语言 时间:
2016-12-12 22:05:44
阅读次数:
322
餐厅到店点餐系统需求分析 (版本v1.0.0) 成文信息 主题词: 需求分析 作 者: 14商软ETC 文档类别: 审 核: 批 准: 文档性质: 正式稿 主 送: 存档日期: 抄 送: 发布日期: 签收信息 发送方 接收方: 接收方: 接收方: 代表人: 代表人: 代表人: 代表人: 日期: 日期 ...
分类:
Web程序 时间:
2016-11-17 01:56:33
阅读次数:
1057