因为Twitter nlp中使用了较老版本的stanford parser,导致不能同时使用解决方法是使用未集成其它jar包的Twitter nlp,关于这点Stanford FAQ中也有说明(在FAQ17),并且还给出了twitter nlp中都用了哪些jar包大部分的jar包都可以下载到但有些因...
分类:
其他好文 时间:
2015-01-09 13:57:21
阅读次数:
169
作为一个推荐系统业余爱好者,在机器学习领域的鄙视链中,我感觉一直地位不高,时常被搞NLP CV语音等高科技技术的朋友鄙视。最近甚至被人问,推荐算法开源包多如牛毛,我们为什么还要专门的推荐算法工程师?(难道想要辞退我!?惊)不得不说,我想吐槽这个观点很久了。事实上搞推荐的工作不等于 import IB...
分类:
编程语言 时间:
2015-01-08 19:46:17
阅读次数:
421
[yangxb@localhost ~]# netstat -nlp netstat命令各个参数说明如下: -t : 指明显示TCP端口 -u : 指明显示UDP端口 -l : 仅显示监听套接字(所谓套接字就是使应用程序能够读写与收发通讯协议(protocol...
分类:
系统相关 时间:
2015-01-08 13:34:32
阅读次数:
236
搞NLP的人经常会听到一个神秘的名字LDC,因为大量的论文所使用的数据都来自于LDC,本文就来揭露其神秘面目。About LDC:LDC,全名Linguistic Data Consortium,是一个由大学、图书馆、企业、政府、研究机构共同合办的联合企业。成立于1992年,目前由宾夕法尼亚大学主要...
分类:
其他好文 时间:
2015-01-06 16:58:58
阅读次数:
579
shell中执行jar程序,并且手动配置执行此jar程序的jdk环境,执行脚本为:#!/bin/sh
exportJAVA_HOME=/home/hadoop/szw/jdk1.8.0_25
exportPATH=$JAVA_HOME/bin:$JAVA_HOME/jre/bin:$PATH
echo`date`
java-jarstanford.jaredu.stanford.nlp.wordseg.ChineseDictionary-inputDict..
分类:
编程语言 时间:
2015-01-05 18:56:01
阅读次数:
175
http://biancheng.dnbcw.info/java/341268.htmlCRF简介ConditionalRandomField:条件随机场,一种机器学习技术(模型)CRF由John Lafferty最早用于NLP技术领域,其在NLP技术领域中主要用于文本标注,并有多种应用场景,例如:...
分类:
其他好文 时间:
2015-01-04 18:38:16
阅读次数:
355
1.Google在研究博客中总结了他们2011年的精彩论文《Excellent Papers for 2011》,包括社会网络、机器学习、人机交互、信息检索、自然语言处理、多媒体、系统等各个领域,很精彩的论文集锦。http://googleresearch.blogspot.com/2012/03/...
分类:
其他好文 时间:
2014-12-17 16:10:15
阅读次数:
323
最近又要做文本方面的处理,由于需求的定制化较高,还可能要放到集群上使用,所以不能再用公司封得严严密密、又笨又重的分词组件了。于是再次在网上找了一下能下载的分词工具,开源的:mmseg、IK_Analyzer、imdict、paoding、jcseg、free_ictclas、fnlp闭源的:NLPI...
分类:
其他好文 时间:
2014-12-16 17:00:10
阅读次数:
6186
http://blog.csdn.net/ice110956/article/details/17090061整理至11月中旬在重庆参加的自然语言处理与机器学习会议,第一讲为自然语言处理。由基本理论到实际运用,整理了基本的框架。1.自然语言处理基础词性标注(POS):为句子中的每个词语标注词性,可看...
分类:
编程语言 时间:
2014-12-16 13:18:08
阅读次数:
303
一个星期的NIPS终于开完了,Montreal的会场真是高大上,比去年的又大又新太多,设施很好,组织的也很好。因为离我们近,好多深藏不露的人物都来了,不光machine learning,好多vision,NLP和compbio的人也都来了,甚至Radford Neal这种鄙视publication...
分类:
其他好文 时间:
2014-12-15 08:56:20
阅读次数:
718