公鸡是怎么叫的?书呆子:喔喔喔农民:鸡够够哦等其他:哈哈哈,还挺谐音的物理:物理现象,速度是位移相对时间的变化率,加速度是速度相对时间的变化率,急动度是加速度相对时间的变化率。可以矢量分析。类似电路中的阶跃响应和冲击响应。“够够哦等”表示频率和周期。自然语言处理:通过以上的比较,这个说明语言是很模糊...
分类:
其他好文 时间:
2015-08-31 21:32:19
阅读次数:
137
NumPy丰富的数值计算SciPy科学计算NLTK自然语言处理MLpy基于最上面两种的机器学习模块Shogun大规模机器学习工具箱OpenStack完全用python实现的开源的laaS的解决方案参考社区:华蟒用户组在模块第一行加上#!/usr/bin/python指的是用python去运行文件,用./module.py既可以运行这..
分类:
其他好文 时间:
2015-08-28 02:23:03
阅读次数:
243
之前下载过一个PDF,书名是《用python进行自然语言处理》,挺有意思的,加上NLP和机器学习目前大热,想趁着暑假涉猎一下。于是开始了入门NLP之旅。安装环境:Ubuntu14.04桌面版,python版本:2.7第一步:安装nltk,首先要安装pip工具:sudo apt-get install...
分类:
其他好文 时间:
2015-08-27 15:11:35
阅读次数:
136
文本处理基础1.正则表达式(Regular Expressions)正则表达式是重要的文本预处理工具。
以下截取了部分正则写法:
2.分词(Word tokenization)
我们在进行每一次文本处理时都要对文本进行统一标准化(text normalization)处理。文本规模 How many words?
我们引入变量Type和Token
分别代表词典中的元素(an...
分类:
编程语言 时间:
2015-08-26 20:14:22
阅读次数:
196
二十六、维特比和他的维特比算法
维特比算法是现代数字通信中最常用的算法,同时也是很多自然语言处理采用的解码算法。
首先谈了维特比算法。 他和雅各布共同创办了高通公司,提出了CDMA标准。维特比算法是针对篱笆网络的有向图最短路径提出的,是一个特殊但应用最广的动态规划算法,凡是使用隐含马尔可夫模型描述的问题都可以用它来解码。之后便详细介绍了维特比算法,指出它的复...
分类:
其他好文 时间:
2015-08-13 12:15:44
阅读次数:
635
NLTK是Python的一个自然语言处理的模块,其中实现了朴素贝叶斯分类算法。以下,就使用上一篇文中提到的数据,来应用这个模块实现朴素贝叶斯分类。NLTK的实现更加泛化,所以在应用到我们的数据上时需要做一点的转化。
首先来看一下NLTK官方文档中给出的一个简单明了的例子,在了解这个例子之后,再设法将同样的模型应用到自己的数据集上。官方给出的例子是英文名中,在知道名字中最后一个字母后,判断...
分类:
其他好文 时间:
2015-08-10 20:10:15
阅读次数:
651
基于python 自然语言处理工具包 :NLPT(natural language processing toolkit)? ,安装时 sudo pip -U install nltk NLPT的网址 Natural language processing toolkits Name Language License Creators Website ...
分类:
其他好文 时间:
2015-08-10 16:21:46
阅读次数:
143
折叠导航HanLP下载文档联系关于开源自由的汉语言处理包功能全面调用简单 欢迎使用HanLP HanLP v1.2.4 HanLP是由一系列模型与算法组成的Java工具包,目标是普及自然语言处理在生产环境中的应用。不仅仅是分词,而是提供词法分析、句法分析、语义理解等完备的功能。HanLP具备功...
分类:
编程语言 时间:
2015-08-10 01:55:09
阅读次数:
334
淘宝的评论归纳是如何做到的? - 社交网络 - 知乎 社交网络 数据挖掘 自然语言处理 LDA 淘宝的评论归纳是如何做到的? 6 条评论 分享 按投票排序 按时间排序 9 个回答 什么是答案总结? 答案总结 .zm-item-answer"}" data-ini...
分类:
其他好文 时间:
2015-08-10 01:39:17
阅读次数:
577
《python自然语言处理时》第28页有这样一个命令--text3.generate()---功能是:产生一些与text3风格类似的随机文本。
用NLTK3.0.4和Python2.7.6来实现时却出现错误:'Text' object has no attribute 'generate' .
探索一下后发现问题所在:
打开nltk文件夹中的text.py发现了,原来新版本的NLTK...
分类:
编程语言 时间:
2015-08-09 14:10:22
阅读次数:
156