首页 > Web开发 > 详细

爬虫原理和网页构造

时间：2018-12-01 15:22:09 阅读：175 评论：0 收藏：0 [点我收藏+]

标签：就会 info 技术分享接收分享图片快捷爬虫 script 基本原理

网络连接像是在自助饮料售货机上购买饮料一样：购买者只需选择所需饮料，投入硬币（或纸币），自助饮料售货机就会弹出相应的商品。网络连接也正是如此，如下图所示，本机电脑（购买者）带着请求头和消息体（硬币和所需饮料）向服务器（自助饮料售货机）发起一次Requests请求（购买），相应的服务器（自助饮料售货机）会返回本机电脑相应的HTML文件作为Response（相应的商品）。

技术分享图片

了解网络连接的基本原理后，爬虫原理就很好理解了。网络连接需要电脑一次Requests请求和服务器端的Response回应。爬虫也是需要二件事：

（1）模拟电脑对服务器发起Requests请求。

（2）接收服务器端的Response的内容并解析提取所需信息。

技术分享图片

现在任意打开一个网页（http://www.anjuke.com/），标右击空白处，在弹出的快捷菜单中选择“检查”命令，可以看到网页的代码，如图所示。

技术分享图片

分析这个图，上半部分为HTML文件，下部分为CSS样式，用<script></script>标签的就是JavaScript。用户浏览的网页就是浏览器渲染后的结果，浏览器就像翻译官，把HTML、CSS和JavaScript进行翻译得到用户使用的网页界面。

右击网页空白处，从快捷菜单中选择“查看网页源代码”命令，即可查看该网页的源代码，如图所示。

技术分享图片

爬虫原理和网页构造

标签：就会 info 技术分享接收分享图片快捷爬虫 script 基本原理

原文地址：https://www.cnblogs.com/wuxingqueshui/p/10049062.html

踩

(0)

赞

(0)

举报

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行

更多

友情链接

兰亭集智国之画百度统计站长统计阿里云 chrome插件新版天听网

关于我们 - 联系我们 - 留言反馈

© 2014 mamicode.com 版权所有联系我们:gaon5@hotmail.com

迷上了代码！