码迷,mamicode.com
首页 >  
搜索关键字:爬虫 数据处理    ( 15133个结果
MySQL事务概述
为了防止无良网站的爬虫抓取文章,特此标识,转载请注明文章出处。LaplaceDemon/SJQ。http://www.cnblogs.com/shijiaqi1066/p/3858050.html1 事务(Transaction)概述1.1 数据库事务的四个特性:ACID原子性(Atomicity)...
分类:数据库   时间:2014-07-22 00:31:37    阅读次数:297
关于python基础认证(用于爬虫)
转自http://www.voidspace.org.uk/python/articles/authentication.shtml先转来,由于是python2的版本之后会翻译文章以及移植到python3IntroductionThis tutorial aims to explain and il...
分类:编程语言   时间:2014-07-22 00:18:35    阅读次数:588
企业邮箱服务优化软件
我们已经进入了大数据处理时代,需要快速、简单的处理海量数据,企业邮箱服务也面临着大数据处理,海量数据处理的三个主要因素:大容量数据、多格式数据和速度。DMCTextFilter和HTMLFilter是由北京红樱枫软件有限公司研制和开发的纯文本抽出和HTML转换通用程序库产品。本产品可以从各种各样的文档格式的数据中或从插入的OLE对象中,快速抽出纯文本数据信息和转换成HTML文件。便于用户实现对多种文档数据资源信息进行统一管理,编辑,检索和浏览。...
分类:其他好文   时间:2014-07-22 00:09:35    阅读次数:373
企业邮箱服务优化软件
我们已经进入了大数据处理时代,需要快速、简单的处理海量数据,企业邮箱服务也面临着大数据处理,海量数据处理的三个主要因素:大容量数据、多格式数据和速度。DMCTextFilter和HTMLFilter是由北京红樱枫软件有限公司研制和开发的纯文本抽出和HTML转换通用程序库产品。本产品可以从各种各样的文档格式的数据中或从插入的OLE对象中,快速抽出纯文本数据信息和转换成HTML文件。便于用户实现对多种文档数据资源信息进行统一管理,编辑,检索和浏览。...
分类:其他好文   时间:2014-07-22 00:06:35    阅读次数:372
[Openwrt 项目开发笔记]:Samba服务&vsFTP服务(四)
在上一节中,我们讲述了如何在路由器上挂载U盘,以及如何通过改造U盘提升路由器的存储和数据处理能力。通过增加USB挂载,为我们后续进行智能家居构建提供了保障。在本节中,我将简单介绍如何在路由器上建立网络文件共享服务。
分类:其他好文   时间:2014-07-21 14:29:49    阅读次数:358
爬虫在游戏数据分析的一个实践
在实际工作中,数据的来源不能局限于自家的数据库或者成型的后台,在做某些市场分析或是竞争对手开服节奏分析的情况下,对竞争对手数据的获得显得更为至关重要,本文就以获取某大平台开服数据作为一个案例,简要的介绍另一种获取数据的方法,网络爬虫技术。何为网络爬虫,爬虫是一个自动提取网页的程序,为搜索引擎在万维网...
分类:其他好文   时间:2014-07-21 14:25:25    阅读次数:222
【云端大数据实战】大数据误区、大数据处理步骤分析
1.背景       本文思路的依据来源于本次...
分类:其他好文   时间:2014-07-21 11:46:04    阅读次数:277
struct2 笔记
HTTP 特点: 无状态和基于文本基于文本 于 强类型的技术匹配 引来大量的数据绑定工作—— 文本 跟 数据类型的矛盾 —— 核心:数据处理servlet将HTTP公开给java语言提供了会话机制。深入的需求研究 ——servlet不能解决的问题——由此引入的struct2的 功能1. 数据验证(高...
分类:其他好文   时间:2014-07-21 11:08:44    阅读次数:254
webservice传递特殊字符时的解决的方法
webservice soap报文是xml格式交互的,当中针对特殊字符传递无法解析,导致数据处理失败。解决的方法例如以下:1、在发送报文之前,针对报文进行base64转码,转义后避免报文中含有特殊字符。标准base64中是以%开头的,假设存储到数据库中,并进行查询sql中,会解析成通配符,这样会报错...
分类:Web程序   时间:2014-07-21 09:11:47    阅读次数:508
python3 爬虫小例子
#!/usr/bin/env python# -*- coding: utf-8 -*-import sys,reimport urllib.request,urllib.parse,http.cookiejarclass myW3(): def login(self): 'post 数据' dat...
分类:编程语言   时间:2014-07-21 08:22:06    阅读次数:354
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!