摘要:最早接触马尔可夫模型的定义源于吴军先生《数学之美》一书,起初觉得深奥难懂且无什么用场。直到学习自然语言处理时,才真正使用到隐马尔可夫模型,并体会到此模型的妙用之处。马尔可夫模型在处理序列分类时具体强大的功能,诸如解决:词类标注、语音识别、句子切分、字素音位转换、局部句法剖析、语块分析、命名实体... ...
分类:
其他好文 时间:
2016-07-12 15:08:46
阅读次数:
146
摘要:最早接触马尔可夫模型的定义源于吴军先生《数学之美》一书,起初觉得深奥难懂且无什么用场。直到学习自然语言处理时,才真正使用到隐马尔可夫模型,并体会到此模型的妙用之处。马尔可夫模型在处理序列分类时具体强大的功能,诸如解决:词类标注、语音识别、句子切分、字素音位转换、局部句法剖析、语块分析、命名实体... ...
分类:
其他好文 时间:
2016-07-11 23:42:54
阅读次数:
430
Tensorflow是Google提供资金研发的,比较全,支持分布式,同时有Google这样的亲爹在,我猜资源倾斜也是迟早的事情。今天的重点自然是Tensorflow,其他的框架也都很好,大家可以自行尝试。...
分类:
编程语言 时间:
2016-07-10 18:29:36
阅读次数:
205
之前的课程里介绍了自然语言处理当中的一些问题,以及设计出来的一些相应的算法。research的东西还是落地到工程应用上比较有价值,之前也手撸过一些toy project,不过这些实现要用在工程中,总是有那么些虚的,毕竟稳定性和效率未必能够保证。所幸的是,深度学习热度持续升温的大环境下,各种大神和各家大厂也陆续造福民众,开源了一些深度学习框架,在这些开源框架的基础上去搭建和实现自己想要的深度学习网络结构就简单和稳定得多...
分类:
编程语言 时间:
2016-07-10 15:30:11
阅读次数:
507
原本打算把作业和答案做个编排,一起发出来给大家看,无奈代码量有点大,贴上来以后文章篇幅过长,于是乎题目的代码解答放到了百度云盘,欢迎自行下载和运行或者调整。...
分类:
编程语言 时间:
2016-07-04 20:43:17
阅读次数:
495
本文为斯坦福大学CS224d课程的第二次作业内容,原本打算把作业和答案做个编排,一起发出来给大家看,无奈代码量有点大,贴上来以后文章篇幅过长,于是乎题目的代码解答放到了百度云盘,欢迎自行下载和运行或者调整...
分类:
编程语言 时间:
2016-07-03 19:17:12
阅读次数:
241
前面一个接一个的Lecture,看得老衲自己也是一脸懵逼,不过你以为你做一个安安静静的美男子(总感觉有勇气做deep learning的女生也是一条汉纸)就能在Stanford这样的学校顺利毕业啦?图样图森破,除掉极高的内容学习梯度,这种顶尖大学的作业和考试一样会让你突(tong)飞(bu)猛(yu)进(sheng)。...
分类:
编程语言 时间:
2016-06-27 01:42:07
阅读次数:
414
前面一个接一个的Lecture,看得老衲自己也是一脸懵逼,不过你以为你做一个安安静静的美男子(总感觉有勇气做deep learning的女生也是一条汉纸)就能在Stanford这样的学校顺利毕业啦?图样图森破,除掉极高的内容学习梯度,这种顶尖大学的作业和考试一样会让你突(tong)飞(bu)猛(yu)进(sheng)。
说起来,怎么也是堂堂斯坦福的课,这种最看重前言研究在实际工业应用的学校,一定是理论和应用并进...
分类:
编程语言 时间:
2016-06-26 07:02:37
阅读次数:
354
自己动手做聊天机器人一-涉及知识(2016-06-09)自己动手做聊天机器人二-初识NLTK库(2016-06-10)自己动手做聊天机器人三-语料与词汇资源(2016-06-12)自己动手做聊天机器人四-何须动手?完全自动化对语料做词性标注(2016-06-17)自己动手做聊天机器人五-自然语言处理中的文本分类(2..
分类:
其他好文 时间:
2016-06-24 22:21:01
阅读次数:
638
基于Web 开发模式的信息抽取
信息抽取是一个互联网自然语言处理的一个首要环节,信息抽取的准确度会直接影响到后续的处理。信息抽取的目标是去除噪音,获取网页有价值的信息如网页的标题、时间、正文、链接等信息。
主流算法介绍
网页信息抽取的方法有很多,比如从算法上分:基于模板的,基于信息量、基于视觉的、基于语义挖掘的、基于统计的。从HTML 处理上分为:基于行块、基于DOM 树。下面...
分类:
Web程序 时间:
2016-06-21 07:33:50
阅读次数:
311