码迷,mamicode.com
首页 >  
搜索关键字:词性标注    ( 116个结果
Python下的自然语言处理利器-LTP语言技术平台 pyltp 学习手札
1 什么是pyltp 语言技术平台(LTP) 是由 哈工大社会计算与信息检索研究中心 11 年的持续研发而形成的一个自然语言处理工具库,其提供包括中文分词、词性标注、命名实体识别、依存句法分...
分类:编程语言   时间:2016-09-11 00:13:40    阅读次数:2435
自己动手做聊天机器人教程
自己动手做聊天机器人一-涉及知识(2016-06-09)自己动手做聊天机器人二-初识NLTK库(2016-06-10)自己动手做聊天机器人三-语料与词汇资源(2016-06-12)自己动手做聊天机器人四-何须动手?完全自动化对语料做词性标注(2016-06-17)自己动手做聊天机器人五-自然语言处理中的文本分类(2..
分类:其他好文   时间:2016-06-24 22:21:01    阅读次数:638
文本分类概述
转自:http://blog.csdn.net/csdwb/article/details/7082066 一.概述 文本分类在文本处理中是很重要的一个模块,它的应用也非常广泛,比如:垃圾过滤,新闻分类,词性标注等等。它和其他的分类没有本质的区别,核心方法为首先提取分类数据的特征,然后选择最优的匹配 ...
分类:其他好文   时间:2016-06-10 13:38:59    阅读次数:266
关于NLPIR应用在KETTLE中的探索
一:什么是NLPIR? NLPIR汉语分词系统(自然语言处理与信息检索共享平台),主要功能包括中文分词;词性标注;命名实体识别;用户词典功能;支持GBK编码、UTF8编码、BIG5编码。新增微博分词、新词发现与关键词提取;张华平博士先后倾力打造十余年,内核升级10次。 全球用户突破20万,先后获得了 ...
分类:其他好文   时间:2016-05-09 15:50:35    阅读次数:170
coreNLP的使用
最近考虑做些英文词语词干化的工作,听说coreNLP这个工具不错,就拿来用了。 coreNLP是斯坦福大学开发的一套关于自然语言处理的工具(toolbox),使用简单功能强大,有;命名实体识别、词性标注、词语词干化、语句语法树的构造还有指代关系等功能,使用起来比较方便。 coreNLP是使用Java编写的,运行环境需要在JDK1.8,1.7貌似都不支持。这是需要注意的   ...
分类:其他好文   时间:2016-05-07 11:03:45    阅读次数:1015
猪猪的机器学习笔记(十八)条件随机场
条件随机场 <!--more--> 作者:樱花猪 摘要: 本文为七月算法(julyedu.com)12月机器学习第十八次课在线笔记。条件随机场是一种判别式概率模型,是随机场的一种,常用于标注或分析序列资料,如自然语言文字或是生物序列。 引言: “条件随机场”被用于中文分词和词性标注等词法分析工作,一 ...
分类:其他好文   时间:2016-05-06 20:14:35    阅读次数:408
中科院分词ICTCLAS5.0_JNI 使用方法
1.简介 中国科学院计算技术研究所在多年研究基础上,耗时一年研制出了基于多层隐码模型的汉语词法分析系统 ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),该系统的功能有:中文分词;词性标注;未登录词 ...
分类:其他好文   时间:2016-04-18 20:50:03    阅读次数:241
ICTCLAS中文分词库的使用
ICTCLAS计算所中文分词(当前最好的汉语词法分析器)系统特点:准确度高(98.5%),性能优越(500KB/s分词速度),词性标注(POS tagging)且支持多种标注集,支持用户自定义词典,支持用户自定义词性标注,支持多平台,支持模块组合关闭(在Configure.xml中设置),支持多编码 ...
分类:其他好文   时间:2016-04-18 19:00:04    阅读次数:309
OpenNLP:驾驭文本,分词那些事
OpenNLP:驾驭文本,分词那些事 作者 白宁超 2016年3月27日19:55:03 摘要:字符串、字符数组以及其他文本表示的处理库构成大部分文本处理程序的基础。大部分语言都包括基本的处理库,这也是对文本处理或自然语言处理的前期必要工作。典型代表便是分词、词性标注、句子识别等等。本文所介绍的工具 ...
分类:其他好文   时间:2016-03-27 21:13:11    阅读次数:2472
NLPIR分词工具的使用(java环境下)
一、NLPIR是什么? NLPIR(汉语分词系统)由中科大张华平博士团队开发,主要功能包括:中文分词,词性标注,命名实体识别,用户词典功能,详情见官网:http://ictclas.nlpir.org/。 二、java环境下的使用: 主要参考了如下资料:http://www.360doc.com/c
分类:编程语言   时间:2016-02-28 09:48:22    阅读次数:305
116条   上一页 1 ... 6 7 8 9 10 ... 12 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!