我们在上一步做了很多基础性的训练,所以现在我们可以来做一些简单的事情喽。我们要加入全文检索功能(没错,这个真的非常简单!)。同时,我们也会写一个端到端测试,因为一个好的端到端测试可以帮上很大忙。它监视着你的应用,并且在发生回归的时候迅速报告。请重置工作目录:git checkout -f step-...
分类:
Web程序 时间:
2014-07-22 09:13:35
阅读次数:
289
清晨的第一缕阳光刚刚反射到电子屏幕之前,新一代的程序猿便开始双手敲击键盘,精神饱满地对着屏幕开始新一天的生活。他要去做回归测试,这是一种古老的习俗,是程序猿赖以生存的自我保护方式。 ...
分类:
其他好文 时间:
2014-07-22 08:10:35
阅读次数:
152
上一节最后讲到了建立一个extractor的方法,手工建立和机器学习等,这一节详细阐述手工建立pattern的方法。引用Jurafsky教授常说的话: let‘s look at the intuition. Jurafsky教授讲话总是微皱着眉头,感觉很较真...
分类:
其他好文 时间:
2014-07-21 13:30:48
阅读次数:
257
word2vec 是 Google 于 2013 年开源推出的一个用于获取 word vector 的工具包,它简单、高效,因此引起了很多人的关注。由于 word2vec 的作者 Tomas Mikolov 在两篇相关的论文 [3,4] 中并没有谈及太多算法细节,因而在一定程度上增加了这个工具包的神秘感。一些按捺不住的人于是选择了通过解剖源代码的方式来一窥究竟,出于好奇,我也成为了他们中的一员。读完代码后,觉得收获颇多,整理成文,给有需要的朋友参考。...
分类:
其他好文 时间:
2014-07-21 11:47:14
阅读次数:
294
word2vec 是 Google 于 2013 年开源推出的一个用于获取 word vector 的工具包,它简单、高效,因此引起了很多人的关注。由于 word2vec 的作者 Tomas Mikolov 在两篇相关的论文 [3,4] 中并没有谈及太多算法细节,因而在一定程度上增加了这个工具包的神秘感。一些按捺不住的人于是选择了通过解剖源代码的方式来一窥究竟,出于好奇,我也成为了他们中的一员。读完代码后,觉得收获颇多,整理成文,给有需要的朋友参考。...
分类:
其他好文 时间:
2014-07-21 11:25:14
阅读次数:
837
二种类别的点在平面上分布,我想找到一条直线,将平面划为两半边,每一边的点类别尽可能的统一,如何找到效果最佳的分界线,这就是最佳拟合问题,也叫作回归问题。 这次,代码很少。logRegres.py #?coding:utf-...
分类:
其他好文 时间:
2014-07-21 10:24:21
阅读次数:
321
从今天开始学习python,学习的目的:国外的都是以python做编程入门,去英国前要把课补上今天买了一本机器学习实战,是用python写的,虽然大部分代码能够看懂,但是系统的学习还是很有必要知乎上的大牛很推崇python,一定有道理,学学也无妨在知乎上找了一些python入门的经验,这篇比较中意。...
分类:
编程语言 时间:
2014-07-21 09:31:57
阅读次数:
357
学习方式根据数据类型的不同,对一个问题的建模有不同的方式。在机器学习或者人工智能领域,人们首先会考虑算法的学习方式。在机器学习领域,有几种主要的学习方式。将算法按照学习方式分类是一个不错的想法,这样可以让人们在建模和算法选择的时候考虑能根据输入数据来选择最合适的算法来获得最好的结果。监督式学习:在监...
分类:
其他好文 时间:
2014-07-21 08:08:39
阅读次数:
327
日本统计学家写的统计学入门。深入浅出介绍统计学最常见的几个应用场景:抽样调查,随机对照,回归分析等,挺有趣的。对统计学感兴趣的,想复习统计学的,都可以看看。同意作者在书中表达的一个思想:统计学思维是现代人应该掌握的非常重要的一种常识。个人感觉,在个体遇到医疗健康相关的问题,企业家遇到经营管理问题的....
分类:
其他好文 时间:
2014-07-20 22:36:05
阅读次数:
241
前一篇博文提到怎么得到汉字字库,这篇文章讲怎么把一个一个的字转成图片,这在机器学习中会有用处。
一句话,用pygame渲染文字到图片上。
下面上代码。
import os
import pygame
chinese_dir = 'chinese'
if not os.path.exists(chinese_dir):
os.mkdir(chinese_dir)
pygame.ini...
分类:
编程语言 时间:
2014-07-20 11:43:38
阅读次数:
334