码迷,mamicode.com
首页 >  
搜索关键字:爬虫 数据处理    ( 15133个结果
王家林最受欢迎的一站式云计算大数据和移动互联网解决方案课程 V4之Hadoop大数据时代:Hadoop&YarnSpark企业级最佳实践 -0905
Hadoop、Yarn、Spark是企业构建生产环境下大数据中心的关键技术,也是大数据处理的核心技术,是每个云计算大数据工程师必修课。大数据时代的精髓技术在于Hadoop、Yarn、Spark,是大数据时代公司和个人必须掌握和使用的核心内容。Hadoop、Yarn、Spark是Yahoo!、阿里淘宝...
分类:移动开发   时间:2014-09-13 17:03:45    阅读次数:328
Python大数据处理工具
来自http://www.xmind.net/m/WvfC/...
分类:编程语言   时间:2014-09-13 10:43:55    阅读次数:196
grep命令和curl命令的使用方法
今天看了汪海写的python爬虫教程,说实话看不懂。。。于是就用bash下的工具自己开始写了一个抓取糗事百科的糗事的脚本,期间搜索到了grep和curl命令的一些使用技巧。grep命令,使用grep命令来进行文本的通配,一般只是显示匹配的行,但是使用以下几个参数就可以显示上下文了:-C [num] ...
分类:其他好文   时间:2014-09-12 23:19:24    阅读次数:665
用python实现的抓取腾讯视频所有电影的爬虫
1. [代码]用python实现的抓取腾讯视频所有电影的爬虫 # -*- coding: utf-8 -*-# by awakenjoys. my site: www.dianying.atimport reimport urllib2from bs4 import BeautifulSoupim....
分类:编程语言   时间:2014-09-12 17:01:43    阅读次数:422
如何截取url中的各个参数?
在页面跳的时候,目的界面可能会根据url中的某些参数进行数据处理,这个时候如何能快速并设计一个通用的截取url中的参数,并且获取各个参数值?代码: url = location.search;//获取当前界面url中“?”后面的所有值组成的字符串 var paramRequest...
分类:其他好文   时间:2014-09-12 13:14:53    阅读次数:206
走进企业级批处理框架--Springbatch
Springbatch是一个轻量级的,完全面向Spring的批处理框架,可以应用于企业级大量的数据处理系统。Spring Batch可以提供大量的,可重复的数据处理功能,包括日志记录/跟踪,事务管理,作业处理统计工作重新启动、跳过,和资源管理等重要功能。它能使业务人员专注于核心业务的开发,而将重复性的耗时工作交给系统自动处理。如数据的倒入,导出,数据的复制等工作。本文将通过一个简单的文件复制的小例子介绍SpringBatch的工作原理。首先来看相关的核心代码和配置:...
分类:编程语言   时间:2014-09-12 11:55:13    阅读次数:268
live555 基本命令处理流程
live555源码分析----DESCRIBE命令处理live555源码分析----SETUP命令处理流程live555源码分析----PLAY命令的处理live555源码分析----RTP的打包与发送实现RTP协议的H.264视频传输系统live555源码分析----H264的数据处理live555源码分析----mpg文件的处理...
分类:其他好文   时间:2014-09-11 23:53:42    阅读次数:233
【数据处理】各门店POS销售导入
--抓取西部POS数据DELETE FROM POSLSBFINSERT INTO POSLSBFselect * from [192.168.1.100].[SCMIS].DBO.possrlbf WHERE SLDAT>'20130101'ORDER BY 1INSERT INTO POSXBB...
分类:其他好文   时间:2014-09-11 20:56:12    阅读次数:252
Hibernate批处理操作优化 (批量插入、更新与删除)
问题描述我开发的网站加了个新功能:需要在线上处理表数据的批量合并和更新,昨天下午发布上线,执行该功能后,服务器的load突然增高,变化曲线异常,SA教育了我一番,让我尽快处理,将CPU负载降低。工作所需,我经常要写些程序批量处理数据,每次执行几十万数据处理的时候,我机子的CPU都会飙高,而且数据处理...
分类:系统相关   时间:2014-09-11 18:58:52    阅读次数:942
如何用SHELL写好网络爬虫
上周,老大压下来任务,让写一个网络爬虫,负责爬某一个行业网站的数据信息。由于本人只会shell编程语言,其它编程语言从未涉猎,因此就只能硬着头皮用shell去写了。转眼之前已经过去一周了,一切从无到有,经历的坎坷无数,这里我就不一一吐槽。这里呢,我就简单和大家分享下..
分类:其他好文   时间:2014-09-11 09:45:02    阅读次数:335
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!