技巧之一:提高使用Request集合的效率 访问一个ASP集合来提取一个值是费时的、占用计算资源的过程。因为这个操作包含了一系列对相关集合的搜索,这比访问一个局部变量要慢得多。因此,如果打算在页面中多次使用Request集合中的一个值,应该考虑将其存贮为一个局部变量。例如将代码写成下面的形式以...
分类:
Web程序 时间:
2014-11-16 10:30:18
阅读次数:
155
1.统计学习 统计学习是关于计算机基于数据构建概率统计模型并运用模型对数据进行预测与分析的一门学科,也称统计机器学习。统计学习是数据驱动的学科。统计学习是一门概率论、统计学、信息论、计算理论、最优化理论及计算机科学等多个领域的交叉学科。 统计学习的对象是数据,它从数据出发,提取数据的特征,...
分类:
其他好文 时间:
2014-11-15 20:13:40
阅读次数:
223
续上篇文章,网页抓取到手之后就是解析网页了。在Python中解析网页的库不少,我最开始使用的是BeautifulSoup,貌似这个也是Python中最知名的HTML解析库。它主要的特点就是容错性很好,能很好地处理实际生活中各种乱七八糟的网页,而且它的API也相当灵活而且丰富。但是我在自己的正文提取项...
分类:
编程语言 时间:
2014-11-15 17:00:12
阅读次数:
277
TF-IDF(term frequency–inverse document frequency)是一种用于资讯检索与资讯探勘的常用加权技术。TF-IDF是一种统计方法,用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降。TF-IDF加权的各种形式常被搜寻引擎应用,作为文件与用户查询之间相关程度的度量或评级。除了TF-IDF以外,因特网上的搜寻引擎还会使用基于连结分析的评级方法,以确定文件在搜寻结果...
分类:
编程语言 时间:
2014-11-15 11:31:57
阅读次数:
363
给开发加了个pdf信息提取优化任务。弄了半天发现服务器也是个好东西。这周末可以和爬虫讨论整合的问题了。 MemberToday’s taskNext task林豪森协助测试及服务器部署协助测试及服务器部署宋天舒服务器程序部署服务器程序部署及运行测试张迎春整合测试分词算法修复整合存在的bug黄漠源.....
分类:
其他好文 时间:
2014-11-14 19:25:39
阅读次数:
188
原文: 游标的使用 定义游标: cursor calenderStatus_cur is select * from ut_calenderStatus ; vr_calenderStatus ut_calenderStatus % rowtype; 打开游标,提取游标中的数据到游标行中: open...
分类:
其他好文 时间:
2014-11-14 19:17:26
阅读次数:
144
定义游标:
cursor calenderStatus_cur
is
select * from ut_calenderStatus ;
vr_calenderStatus ut_calenderStatus % rowtype;
打开游标,提取游标中的数据到游标行中:
open calenderStatus_cur;
...
分类:
其他好文 时间:
2014-11-14 17:46:57
阅读次数:
147
1:由于天气apk接口不稳定所以经常获取不到信息。于是就动手写一个扒取天气网站上的数据然后做成json,apk直接调用服务器上扒取的数据增加稳定性。2:项目主要是用servlet然后正则表达式来提取网站信息。3:我觉得比较难得地方就是如何写正确的正则来提取出需要的信息,以下记录..
分类:
编程语言 时间:
2014-11-14 15:57:54
阅读次数:
231
python中r的用法,r'str'表示raw string,既忽略转义字符。因为和windows不一样,python中认为\就是转义字符escape sequences的标志。python中提取系统时间,以及将其转化成字符串的方法。time.strftime()。将list转化成str的方法,s....
分类:
其他好文 时间:
2014-11-14 13:55:30
阅读次数:
147
大多数文章和博客介绍都是MFCC的算法流程,物理意义,这里仅仅从数据分布可视化的角度,清晰观察MFCC特征在空间中的分布情况,加深理解。 MFCC处理流程: MFCC参数的提取包括以下几个步骤:1.预滤波:CODEC前端带宽为300-3400Hz的抗混叠滤波器。2.A/D变换:8kHz...
分类:
编程语言 时间:
2014-11-14 12:02:11
阅读次数:
302