1. 科普
通用搜索引擎处理的对象是互联网的网页,目前网页的数量数以亿计,所以搜索引擎面临的第一个问题是如何设计出高效的下载系统,已将海量的网页下载到本地,在本地形成互联网网页的镜像。网络爬虫就是担当此大任的。
抓取网页的过程其实和读者平时使用IE浏览器浏览网页的道理是一样的。比如说你在浏...
分类:
编程语言 时间:
2014-05-07 02:41:56
阅读次数:
368
目前在做一个winform小软件,其中有一个功能是能根据关键字检索本地保存的word文档。第一次是用com读取word方式(见上一篇文章),先遍历文件夹下的word文档,读取每个文档时循环关键字查找,结果可想而知效率很慢。检索结果是一条接一条显示出来的o(>_
2 /// 创建索引...
分类:
Web程序 时间:
2014-05-07 02:20:56
阅读次数:
428
select * from table where id =
?类似于上面这样的sql,如果不用绑定变量,每次执行时Oracle会认为是不同的sql,会在每次执行时生成一遍执行计划,而执行计划的生成是非常耗CPU,试想一下,如果1000个并发都在执行这条语句,等于同时在生成1000个执行计划。如果使...
分类:
数据库 时间:
2014-05-07 00:58:05
阅读次数:
418
1. 推导出函数间隔最小 2. 约束优化函数变形至如下形式 /*min 1/2*||w||^2s.t.
(w[i]*x[i] + b[i] - y[i]) >= 0;*/ 3. 对偶函数 /*min(para alpha)
1/2*sum(i)sum(j)(alpha[i]*alpha[j]*y[i...
分类:
编程语言 时间:
2014-05-07 00:48:13
阅读次数:
498
下载java vm。在命令行输入 wget --no-cookie --header "Cookie:
gpw_e24=http%3A%2F%2Fwww.oracle.com%2F"
http://download.oracle.com/otn-pub/java/jdk/7u25-b15/jdk-7...
分类:
系统相关 时间:
2014-05-07 00:43:03
阅读次数:
570
题目链接题意 :
一篇文章有n个单词,如果每行打印k个单词,那这行的花费是,问你怎么安排能够得到最小花费,输出最小花费。思路 :
一开始想的简单了以为是背包,后来才知道是斜率优化DP,然后看了网上的资料,看得还挺懂的,不过我觉得如果以后真遇到斜率DP,要推起来肯定不简单。。。。。网上资料1网上资料2...
分类:
其他好文 时间:
2014-05-07 00:35:18
阅读次数:
424
http://www.blogjava.net/freeman1984/archive/2011/08/08/356023.htmlhttp://blog.sina.com.cn/s/blog_713978a50100yboz.html
分类:
数据库 时间:
2014-05-07 00:17:11
阅读次数:
291
List 代表一个元素有序、且可重复的集合,集合中的每个元素都有其对应的顺序索引List
允许使用重复元素,可以通过索引来访问指定位置的集合元素。 List 默认按元素的添加顺序设置元素的索引。List
集合里添加了一些根据索引来操作集合元素的方法:另外:List 额外提供了一个 listItera...
分类:
编程语言 时间:
2014-05-07 00:16:29
阅读次数:
349
一、服务器侧优化
1.添加Expires或Cache-Control信息头某些经常使用到、并且不会经常做改动的图片(banner、logo等等)、静态文件(登录首页、说明文档等)可以设置较长的有效期
(expiration date),这些HTTP头向客户端表明了文档的有效性和持久性。如果有缓存,....
分类:
Web程序 时间:
2014-05-07 00:12:36
阅读次数:
487
题目原文:
Given n, how many structurally unique BST's (binary search trees) that store values 1...n?
For example,Given n = 3, there are a total of 5 unique BST's.
题目理解...
分类:
其他好文 时间:
2014-05-06 22:15:57
阅读次数:
415