关于携程酒店的爬虫,网上有很多,我仔细看了下,大概的分成了两派:selenuim与python执行JS,夹生饭大佬在知乎的专栏中也讲述的很清楚了,我不想再复刻他的文章了,而且我在github中也找到了开源项目针对携程酒店的,链接点击这里,我在复现夹生饭大佬代码的过程中始终有一段代码没找到 在网上别人 ...
分类:
其他好文 时间:
2019-03-10 17:55:03
阅读次数:
670
前言 现在有了互联网,很容易让很多人产生错觉,觉得很多东西可以免费得到,似乎你也正在享受很多免费的东西,头条让你免费看新闻,抖音让你免费看娱乐,各种视频网站也可以免费看到很多电影,电视剧八卦等。 我们有没有认真想想,这些东西你真的是免费得到的吗?你是不是在忍受各种广告?你的各种点赞是不是在帮助服务商 ...
分类:
其他好文 时间:
2019-03-05 09:32:09
阅读次数:
162
并发与并行 并发 拥有处理多个任务的能力。对于单核CPU来说,只能处理并发 并行 拥有同时处理多个任务的能力,对于多核CPU,即可以并发和并行 同步与异步 同步和异步强调的是消息通信机制 同步 如果一个人这样处理:先烧水,烧水的过程中啥也不干,就一直等着,等水开后,再把茶叶放到开水壶中。这种处理方法 ...
分类:
编程语言 时间:
2019-03-04 21:10:42
阅读次数:
347
1.xml简介 应用 xml:extensible Markup Language:可扩展标记型语言 可扩展: -html里面的标签是固定的,每个标签都有特定的含义 -xml中标签可以自己定义,也可以携程中文的标签 例<person></person> <猫></猫> xml用途: ** html是 ...
分类:
其他好文 时间:
2019-02-28 11:50:05
阅读次数:
130
1.Plan 9 的八卦 在 Windows 下喜欢用 FTP 的同学抱怨 Linux 下面没有如 LeapFTP 那样的方便的工具. 在苹果下面用惯了 Cyberduck 的同学可能也会抱怨 Linux 下面使用 FTP 和 SFTP 是一件麻烦的事情. 其实一点都不麻烦, 因为在 LINUX 系 ...
分类:
其他好文 时间:
2019-02-25 18:16:40
阅读次数:
194
2019年2月IT帮线下活动【定义工作,解读自我】 昨天的活动收获很大,全面的总结周老师会另写一篇来帮助大家回顾。我想说一下其中最打动我的一句话:“只有你能决定你有多优秀!” “工作中把自己当成企业家,把你的工作当成创业,公司给你提供了可以协作的团队、场所”。责任感程度不同,就有不同的结果。当你认为 ...
分类:
其他好文 时间:
2019-02-25 13:38:19
阅读次数:
389
channel 分为两种: 1. 无缓冲 channel 2. 缓冲 channel 无缓冲 channel 的使用必须遵循一个原则:推送和读取必须同时存在,否则就发生死锁 先上代码: 这里定义了一个 int 型的信道 c1,然后通过辅助协程并行给 c1 推送 v(就是 i)然后又在主协程读取。 输 ...
分类:
其他好文 时间:
2019-02-20 14:43:59
阅读次数:
195
背景:在百度每次输入关键词检索后,会出现很多的检索页,不利于有效阅读,为更方便收集检索信息,编写了一个可以收集每个检索页与检索词相关的十条检索信息(百度在每个检索页放置十条检索标题信息)。可以根据需要选择爬取多少检索页,通过修改main()函数的depth变量 1 import urllib.req... ...
分类:
编程语言 时间:
2019-02-14 13:22:55
阅读次数:
202
看大家讨论得热火朝天,我也来八卦一下“大龄程序员”的问题。当然所谓的大龄,当然是指30岁以上的软件开发人员,他们的前途怎么样选择呢?是一件令人关注的事情。 大龄程序员的前途,主要的选择就这几样:继续码农、做管理、创业和转行。先来说一下码农的情况,在中国这种人口的大国下,每年毕业的学生就几百万,因此继 ...
分类:
其他好文 时间:
2019-02-01 21:08:55
阅读次数:
204
概述 对于ASCII编码,相信同学们都比较了解,那么对于Unicode、UTF 8和UTF 16,它们是怎么编码的呢?以及它们之间的关系是什么呢?它们与ASCII之间又有什么关系? 本文就来回答这两个问题。 ASCII编码 在学校学 C 语言的时候,了解到一些计算机内部的机制,知道所有的信息最终都表 ...
分类:
其他好文 时间:
2019-01-28 12:16:38
阅读次数:
166