码迷,mamicode.com
首页 >  
搜索关键字:nlp    ( 935个结果
NLP系列(1)_从破译外星人文字浅谈自然语言处理的基础
如果让你破译“三体”人文字你会怎么办?我们试着开一下脑洞:假如你有一个优盘,里面存了大量“三体”人(刘慈欣小说中的高智能外星人)的网络文本信息... 当面对一种一无所知的语言的时候,似乎最直接的方法就是掌握大量的语料库,而且这些语料最好是经过各种方式标注了的。然后对其进行各种各样的统计,发掘一些有价值的信息。这是传说中自然语言处理的经验主义视角。...
分类:编程语言   时间:2016-01-20 01:14:12    阅读次数:273
NLP常用工具
1、统计类工具:可参见【统计学习常用Python扩展包】2、简繁转换工具:opencc Open Chinese Convert(OpenCC)是一個中文簡繁轉換開源項目,提供高質量的簡繁轉換詞庫和可供調用的函數庫(libopencc)。還提供命令行簡繁轉換工具,人工校對工具,詞典生成程序,以及圖....
分类:其他好文   时间:2016-01-05 15:10:15    阅读次数:135
MyEclipse10中配置开发Python所需要的PyDev 绝对靠谱 不忽悠!
在NLP(自然语言处理)这个领域中,Python具有良好的声誉,于是也想学习一下。首先第一步就是需要在计算机上配置Python环境。由于Python自带的编辑器太简单,使用起来不顺手,于是就考虑在相对熟悉的MyEclipse中配置PyDev来进行Python开发。在网上搜了一下配置方法,发现介绍基于...
分类:编程语言   时间:2015-12-31 10:16:18    阅读次数:169
编辑距离算法 (二)摘自网络
/*** 编辑距离算法,首先由俄国科学家Levenshtein提出的,又叫Levenshtein Distance* 主要用来计算从原串(s)转换到目标串(t)所需要的最少的插入,删除和替换的数目, 在NLP中应用比较广泛,同时也常用来计算你对原文所作的改动数*/public class Leven...
分类:编程语言   时间:2015-12-29 21:14:22    阅读次数:284
Ansj配置指南!
=。=折腾死①你想要http://maven.ansj.org/org/ansj/ansj_seg/找一个尽可能高的版本号,比方2.0.7,点进去之后找到相应的jar,比方ansj_seg-2.0.7.jar②然后。http://maven.ansj.org/org/nlpcn/nlp-lang/在...
分类:其他好文   时间:2015-12-15 14:38:26    阅读次数:133
GPU 加速NLP任务(Theano+CUDA)
之前学习了CNN的相关知识,提到Yoon Kim(2014)的论文,利用CNN进行文本分类,虽然该CNN网络结构简单效果可观,但论文没有给出具体训练时间,这便值得进一步探讨。 Yoon Kim代码:https://github.com/yoonkim/CNN_sentence 利用作者提供的...
分类:其他好文   时间:2015-12-05 19:33:36    阅读次数:294
LAMP 1.5 测试PHP解析 问题解决
安装完php从新加载了一个模块 php5_module重新启动模块/usr/local/apache2/bin/apachectl restartifconfig 查看本机ip,在浏览器里面输入ip地址,显示先检测 80端口是否打开 netstat -nlp没有打开 移步 http://www.cn...
分类:Web程序   时间:2015-12-02 00:50:09    阅读次数:196
在NLP中深度学习模型何时需要树形结构?
在NLP中深度学习模型何时需要树形结构? 前段时间阅读了Jiwei Li等人[1]在EMNLP2015上发表的论文《When Are Tree Structures Necessary for Deep Learning of Representations?》,该文主要对比了基于树形结构的递归神经...
分类:其他好文   时间:2015-11-29 12:03:54    阅读次数:298
深度学习还有哪些鲜为人知的潜力?
深度学习2011年最开始火的时候(Hinton),人们会认为deep learning(DL) 约等于convolutional neural network(CNN), 这是一个有监督学习的图像识别工具;然后出现了词向量(word2vec),人们开始觉得DL还能解决一部分NLP问题然后long s...
分类:其他好文   时间:2015-11-23 11:29:49    阅读次数:223
Python简单实现基于VSM的余弦相似度计算
在知识图谱构建阶段的实体对齐和属性值决策过程中、判断一篇文章是否是你喜欢的文章、比较两篇文章的相似性等,都涉及到了向量空间模型(Vector Space Model,简称VSM)和余弦相似度计算相关知识。这篇文章主要是先叙述VSM和余弦相似度相关理论知识,然后引用阮一峰大神的例子进行解释,最后通过Python简单实现百度百科和互动百科Infobox的余弦相似度计算。基本步骤:1.分别统计两个文档的关键词 2.两篇文章的关键词合并成一个集合...希望文章对你有所帮助~...
分类:编程语言   时间:2015-11-18 07:04:06    阅读次数:534
935条   上一页 1 ... 76 77 78 79 80 ... 94 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!