码迷,mamicode.com
首页 >  
搜索关键字:抓取    ( 5747个结果
Java抓取网页数据(原网页+Javascript返回数据)
转载请注明出处!原文链接:http://blog.csdn.net/zgyulongfei/article/details/7909006有时候因为种种原因,我们须要採集某个站点的数据,但因为不同站点对数据的显示方式略有不同!本文就用Java给大家演示怎样抓取站点的数据:(1)抓取原网页数据;(2)...
分类:编程语言   时间:2014-08-20 16:07:22    阅读次数:288
python爬虫----(2. scrapy框架)
Scrapy框架,Python开发的一个快速,高层次的屏幕抓取和web抓取框架,用于抓取web站点并从页面中提取结构化的数据。Scrapy用途广泛,可以用于数据挖掘、监测和自动化测试。 ????刚开始学习这个框架。不...
分类:编程语言   时间:2014-08-20 04:00:06    阅读次数:302
TCPdump少许实例
说是大全其实我列取得只是一些常用的命令与大家分享。下面的例子全是以抓取eth0接口为例,如果不加”-i eth0”是表示抓取所有的接口包括lo。1、抓取包含10.10.10.122的数据包# tcpdump -i eth0 -vnn host 10.10.10.1222、抓取包含10.10.10.0...
分类:其他好文   时间:2014-08-19 18:52:55    阅读次数:213
抓取扑克之星免费赛玩家排行榜
function getpokerstaropenplayers(){ //http://www.intellipoker.tw/leagues/Open-League/leaderboard?page=1 // 获取扑克之星开放玩家排名 $url = "http://www.intellipoke...
分类:其他好文   时间:2014-08-19 18:07:55    阅读次数:236
php 抓取微信列表中的最新的一组微信消息
array( "wx_content" => array("weixin_user" => "微信号码", "weixin_pass" => "微信密码") ) ); wx_login(); $messge_list = get_message_list(); $file_id=$messge_list[...
分类:微信   时间:2014-08-19 16:32:34    阅读次数:416
php 抓取天气情况 www.weather.com.cn
<?php function getweather($city){ $url="http://www.weather.com.cn/weather1d/".$city.".shtml"; $result=file_get_contents($url); $arr=explode("",$result); $arr1=explode("",$arr[1]); $wt= mb...
分类:Web程序   时间:2014-08-19 09:26:13    阅读次数:165
怎么去运营一个稳定流量的个人网站
无意间发现这个问题,无意间发现是校友~要有稳定的流量来源,首先有一点是要有稳定的原创新内容,刚大概看了一下你的网站,今年的三四月份更新的内容比较多,再之后更新的内容就很少了。至于为什么讲原创呢,搜索引擎对于原创内容的抓取是要高于非原创的,这样网站在搜索引擎的排名也会比较高。第二点,首页上的内容要放最...
分类:Web程序   时间:2014-08-18 15:50:03    阅读次数:201
PHP解码unicode编码中文字符代码示例
在抓取某网站数据,结果在数据包中发现了一串编码的数据:"......\u65b0\u6d6a\u5fae\u535a......", 这其实是中文被unicode编码后了的数据,想解码出中文来。解决方案:方案A(稳定版+推荐):function replace_unicode_escape_sequ...
分类:Web程序   时间:2014-08-18 10:38:03    阅读次数:208
网页内容相似度之SimHash算法
抓取的网页内容中,有大部分会是相似的,抓取时就要过滤掉,开始考虑用VSM算法,后来发现不对,要比较太多东西了,然后就发现了simHash算法,这个算法的解释我就懒得copy了,simhash算法对于短数据的支持不好,但是,我本来就是很长的数据,用上! 源码实现网上也有不少,但是貌似都是同样的,...
分类:Web程序   时间:2014-08-17 23:59:23    阅读次数:709
初识python之 APP store排行榜 蜘蛛抓取(一)
直接上干货!!采用python 2.7.5-windows打开http://www.apple.com/cn/itunes/charts/free-apps/如上图可以见采用的是utf-8 编码 经过一番思想斗争 编码如下 (拍砖别打脸)#coding=utf-8import urllib2 ...
分类:移动开发   时间:2014-08-17 22:30:22    阅读次数:328
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!