码迷,mamicode.com
首页 >  
搜索关键字:爬虫 数据处理    ( 15133个结果
金蝶KIS标准版与金蝶K3的区别
一、数据库 金蝶KIS标准版使用MS Access数据库,该数据库适用于小规模的数据处理,是比较经济的数据库解决方案,但当单个表的数据记录超过5万条时,运行的速度和稳定性都将受到一定程序的影响。 K3系统使用大型数据库MS SQL Server,该数据库为大型数据库,是当今主流的数据库平台之一,能提供高性能数据存储能力,数据量的大小仅仅受物理磁盘容量大小的限制,并且数据库的性能也不会因为数据量的增大而受到影响。 反应到客户具体的应用当中,也就意味着金蝶KIS标准版软件必须进行年结的操作,否则会造成软件...
分类:其他好文   时间:2014-06-24 19:54:24    阅读次数:160
将Html文档整理为规范XML文档
有多种方式可以在.NET 平台进行HTML文件解析、数据提取,其中最简单、稳妥的办法是先使用工具将Html文档整理成XML文档,再通过XML Dom模型或XPath灵活地进行数据处理。SGML便是一个Html文档整理工具类库:Microsoft的XML大师Chris Lovett专门开发了一个SGM...
分类:Web程序   时间:2014-06-24 12:20:38    阅读次数:163
[转载]爬虫的自我解剖(抓取网页HtmlUnit)
网络爬虫第一个要面临的问题,就是如何抓取网页,抓取其实很容易,没你想的那么复杂,一个开源HtmlUnit包,4行代码就OK啦,例子如下:1234finalWebClient webClient=newWebClient();finalHtmlPage page=webClient.getPage("...
分类:Web程序   时间:2014-06-22 23:47:37    阅读次数:373
ZYNQ的数据处理能力
这段时间由于有任务要做,身体也不太好,所以一直没有时间在完成zynq数据处理能力的文档,今天晚上,抽了一晚上时间将相应的资料及实验都整理了出来,剩下的部分等把任务做完后在来折腾。在这里记下今天的历程,权当以后参考 。 由于zynq自身自带本地arm-linux-gnu工具链,因此我就偷了一下懒,没....
分类:其他好文   时间:2014-06-22 23:15:53    阅读次数:503
【转】SQL Server与Oracle的区别
转自:http://soft.chinabyte.com/database/255/12258255.shtmlSQL Server与Oracle的区别2012-02-10 00:00 中国IT实验室 佚名 关键字:Oracle 随着信息技术的飞速发展,数据处理不仅在数量上要求越来越大,而且在质量....
分类:数据库   时间:2014-06-21 07:21:00    阅读次数:278
Epson Pos Printer for .net
注:因发现各网站爬虫随意收集文章,故做此声明:版权归原作者(Leaf.Duan)所有,转载还请著名出处,谢谢设备信息Epson TM-T88IV Thermal Printer,爱普生 TM-T88IV 热敏式打印机,主要用来打印票据(receipt)操作系统:windows 7 Ultimate ...
分类:Web程序   时间:2014-06-20 14:05:15    阅读次数:370
nutch,solr集成在hadoop上
nutch,solr集成在hadoop上 nutch是一个应用程序,在我的这个项目里主要是做爬虫用,爬取后的内容寄存在hdfs上,所以在hdfs结合模块现已结合上去了。 solr: 在eclipse新建动态页面项目,删去WebContent的一切内容。 在solr/dist下(或许/solr3.6....
分类:其他好文   时间:2014-06-18 10:30:02    阅读次数:223
教你分分钟画出越南全境的主干路由拓扑
标题党了一次,用一个高大上的的题目先吸引各位看官点进来。 其实原理很简单,我们要做的工作只是做一些数据处理并最终生成kml脚本呈现在Google Earth上。 进入正题: 首先数据来源http://www.caida.org .这是一个英特网数据分析的合作组织,数据比较权威,全球很多网络方面的科研数据都来源于此。 而对本文有用的信息在这里:http://www.caida.org/dat...
分类:其他好文   时间:2014-06-18 07:21:51    阅读次数:298
nutch的爬虫demo代码 编辑
关键词:nutch今日来看看Nutch怎么Parse页面的:Nutch运用了两种Htmlparser东西(NekoHTML和TagSoup)来完成html的获取,这两种东西是可经过配置来选择的。当然你要自己完成Parser你还能够选择HTMLParser[根据visitor访问者形式一起也供给了Eventdriver的接口]来获取页面。假如..
分类:其他好文   时间:2014-06-17 18:30:27    阅读次数:200
用Java写的爬虫程序
这是一个web查找的根本程序,从命令行输入查找条件(开端的URL、处置url的最大数、要查找的字符串),它就会逐一对Internet上的URL进行实时查找,查找并输出匹配查找条件的页面。这个程序的原型来自《java编程艺术》,为了非常好的剖析,站长去掉了其间的GUI有些,并稍作修改以适..
分类:编程语言   时间:2014-06-17 16:50:56    阅读次数:259
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!