什么是爬虫 爬虫就是通过编写程序模拟浏览器上网,然后让其去互联网上抓取数据的过程。 哪些语言可以实现爬虫 1.php:可以实现爬虫。php被号称是全世界最优美的语言(当然是其自己号称的,就是王婆卖瓜的意思),但是php在实现爬虫中支持多线程和多进程方面做的不好。 2.java:可以实现爬虫。java ...
分类:
其他好文 时间:
2018-12-03 11:20:02
阅读次数:
459
由于作者不习惯该编辑器,只是贴出上本文的截图,详见:https://www.yuque.com/docs/share/37fb40af-e808-45f3-b385-94342fc7bb62
分类:
其他好文 时间:
2018-12-02 17:31:06
阅读次数:
128
自动类型转换 强制类型转换 二 转int() 三 转float() 四 complex() 五 bool() 六 字符串str() ...
分类:
编程语言 时间:
2018-12-02 13:39:34
阅读次数:
198
文章摘抄自:一支小白,博客地址:http://www.cnblogs.com/startnow/p/7580865.html Centos7安装Oracle 11gR2 - 环境:VM12+centos7 x86_64 minimal - 最小化安装的Centos7 - 虚拟机配置- 50G硬盘 - ...
分类:
数据库 时间:
2018-12-02 10:27:23
阅读次数:
172
$(cat /etc/passwd) `cat /etc/passwd` ...
分类:
系统相关 时间:
2018-12-01 23:38:19
阅读次数:
188
今天装了CM集群,在集群当中集成了impala,hive。然后一直觉得认为impala自动共享hive的元数据,最后发现好像并不是这样的,需要经过一个同步元数据的操作才能实现数据的同步。 具体的做法如下: (1)安装好hive和impala,然后在hive当中创建目标数据库,创建一张表 2. 在Im ...
分类:
其他好文 时间:
2018-12-01 20:11:35
阅读次数:
226
比如我存储的数据,有的是 山东,有的是山东省 我想统一改为山东省 ...
分类:
数据库 时间:
2018-12-01 00:24:00
阅读次数:
403