1,词法分析 待续 2,文本分类 文本表示: 重点是贝叶斯模型:二项表示法和多项表示法。(向量维度为词库大小,一个是01,一个是频次)。模型重点在于化后验为先验。 还有其他模型:机器学习模型,分布式模型等等。 特征选择:重要的是TF-IDF。它的意思是一个词在单个文本中出现的次数越多,在其他文本中出 ...
分类:
其他好文 时间:
2017-01-03 07:50:11
阅读次数:
202
1、 命名实体识别功能测试 结果如下所示 2、句法分析功能测试 结果: 4、语义角色标注功能测试 结果如下图所示: 下面插入一段原网站的分词示例 分词依据 http://www.ltp-cloud.com/intro/#pos_how 具体大家可以来前边这个网址中查看分类依据,感觉哈工大讲得很牛呀! ...
分类:
其他好文 时间:
2016-12-19 07:54:13
阅读次数:
254
1、首先需要构建自然语言处理的LTP的框架 (1)需要下载LTP的源码包即c++程序(https://github.com/HIT-SCIR/ltp)下载完解压缩之后的文件为ltp-master (2)需要下载LTP4j的封装包(https://github.com/HIT-SCIR/ltp4j), ...
分类:
编程语言 时间:
2016-12-19 00:10:19
阅读次数:
701
之前敲过很多遍的Vector就不算了,从现在开始,每次将敲过的次数记下来,直至108遍为止.(瑜伽做108遍拜日,在此借助瑜伽的思想) 为什么要敲这么多次?借助NLP中的一句话:最基础的就是最精华的! 为什么偏偏要敲108遍?借助瑜伽中108遍拜日的思想. 本文仅供个人学习,总结..... 废话不多 ...
分类:
其他好文 时间:
2016-12-18 23:22:48
阅读次数:
226
文件操作的学习笔记。>>>file=open(‘/tmp/test.txt‘,‘r‘)>>>file.read()‘root:x:0:0:root:/root:/bin/bash\nbin:x:1:1:bin:/bin:/sbin/nologin\ndaemon:x:2:2:daemon:/sbin:/sbin/nologin\nadm:x:3:4:adm:/var/adm:/sbin/nologin\nlp:x:4:7:lp:/var/spool/lp..
分类:
编程语言 时间:
2016-12-13 00:29:00
阅读次数:
293
问题:Jenkins 2.16.3默认没有Launch agent via Java Web Start,如下图所示,而这种启动方式在Windows上是最方便的。 如何设置才能让出来呢? 打开"系统管理"——"Configure Global Security" TCP port JNLP agen... ...
分类:
编程语言 时间:
2016-12-05 14:43:35
阅读次数:
3631
转自:http://blog.csdn.net/malefactor/article/details/51078135 CNN是目前自然语言处理中和RNN并驾齐驱的两种最常见的深度学习模型。图1展示了在NLP任务中使用CNN模型的典型网络结构。一般而言,输入的字或者词用Word Embedding的 ...
分类:
其他好文 时间:
2016-11-25 17:47:59
阅读次数:
265
当垃圾收集器判断已经没有任何引用指向对象的时候,会调用对象的finalize方法来释放对象占据的内存空间~ ...
分类:
编程语言 时间:
2016-11-25 11:53:46
阅读次数:
277
1、运行services.msc,在服务中停止 apache 服务。2、运行命令行程序,输入 sc delete apache,删除该服务3、删除apache文件夹。 ...
分类:
Web程序 时间:
2016-11-25 09:41:28
阅读次数:
352
上一篇(R语言实现︱局部敏感哈希算法(LSH)解决文本机械相似性的问题(一,基本原理))讲解了LSH的基本原理,笔者在想这么牛气冲天的方法在R语言中能不能实现得了呢?
于是在网上搜索了一下,真的发现了...
分类:
编程语言 时间:
2016-11-19 21:21:23
阅读次数:
829