阿里巴巴供应商爬虫 起因 学了爬虫入门之后,打算找一个有难度的网站来实践,一开始打算找淘宝或者天猫(业界老大)来实践,但后续发现网上已经有很多这方面的项目,于是瞄上了阿里的国际网站阿里巴巴。开始一切顺利,没发现什么难度,后面发现供应商的联系方式需要登录,于是以其为目标开始写爬虫。 网站结构 1.阿里 ...
分类:
编程语言 时间:
2019-03-27 12:32:32
阅读次数:
300
链接:https://vjudge.net/problem/HDU-2612#author=zhang95986 题意: hsj和lsh最近迷上了pokemon go的游戏。在双十一大物期中考试来临之前,他们想抓一只稀有土拨鼠来攒攒人品(因为土拨鼠的刷新地点最近来到了哈工程)但是由于土拨鼠过于强大, ...
分类:
其他好文 时间:
2019-03-24 23:26:15
阅读次数:
285
假设订单下发, 采用单机每分钟从订单OrderEntry接口表中抓100单, 接入订单oms系统中. 由于双十一期间, 订单量激增, 导致订单单机每分钟100单造成, 订单积压. 所以采用多节点多线程处理三方商家的订单接入系统. 流程图: 如图所示: 采用多节点, 多线程, 使用curator操作z ...
分类:
编程语言 时间:
2019-03-23 10:19:48
阅读次数:
178
简介 上一个博文已经讲述了如何使用selenium跳过webdriver检测并爬取天猫商品数据,所以在此不再详细讲,有需要思路的可以查看另外一篇博文。 源代码 使用教程 1. [点击这里下载][1]下载chrome浏览器 2. 查看chrome浏览器的版本号,[点击这里下载][2]对应版本号的chr ...
分类:
Web程序 时间:
2019-03-14 16:48:15
阅读次数:
268
相信很多前端同学们,都听说过https,现在很多大的站点(如天猫、百度等),均使用了https协议进行传输。但是https是做什么的,往往并不十分了解。今天我们就来一起聊一聊HTTP / HTTPS那些事儿. 一、什么是http协议?http协议是指Hyper Text Transfer Proto ...
分类:
Web程序 时间:
2019-03-13 19:45:07
阅读次数:
226
1 可用性分析 可用性分析所关注的方面包括:如何检测系统故障,系统故障发生的频度,出现故障时会发生什么情况,允许系统有多长时间非正常运行,什么时候可以安全地出现故障,如何防止故障的发生以及发生故障时要求进行哪种通知。 场景:双十一或者春晚抽奖导致淘宝用户猛增 刺激源:淘宝用户 刺激:登录人数过多,导 ...
分类:
其他好文 时间:
2019-03-12 21:12:47
阅读次数:
269
公司的智能家居产品需要接入语音控制,目前在对接阿里语音的天猫精灵 对接天猫精灵的第一步是完成outh鉴权 https://doc-bot.tmall.com/docs/doc.htm?spm=0.7629140.0.0.42271780KZ1bNk&treeId=393&articleId=1075 ...
分类:
其他好文 时间:
2019-02-27 13:08:07
阅读次数:
578
一.分析所采用数据的来源有哪些? 1.国家相关部门统计信息主要包括央行、银监会、证监会、国家统计局、政府网、互联网络信息中心发布的数据统计信息(如通过统计局发布的数据得知春运的客流人数) 2.第三方机构统计数据,主要包括天猫大数据、搜数网、统计网、数据堂、淘宝指数、百度指数、艾瑞咨询、知网数据、万方 ...
分类:
其他好文 时间:
2019-02-25 19:02:37
阅读次数:
242
又是一年双十一了,不知道从什么时候开始,双十一从“光棍节”变成了“双十一购物狂欢节”,最后一个属于单身狗的节日也成功被攻陷,成为了情侣们送礼物秀恩爱的节日。 翻着安静到死寂的聊天列表,我忽然惊醒,不行,我们不能这样下去,光羡慕别人有什么用,我们要行动起来,去找自己的幸福!!! 我也想“谈不分手的恋爱 ...
分类:
编程语言 时间:
2019-02-21 09:21:55
阅读次数:
364
python编程语言无疑是人工智能最重要的语言之一,但是其中语音识别是当前人工智能比较热门的方向,百度的小度机器人、阿里的天猫精灵等其他各大公司都推出了各自的语音助手机器人,其识别算法主要是由RNN、LSTM、DNN-HMM等机器学习和深度学习技术做支撑。
分类:
编程语言 时间:
2019-02-12 19:04:15
阅读次数:
230