Scrapy 是一个通用的爬虫框架,但是不支持分布式,Scrapy-redis是为了更方便地实现Scrapy分布式爬取,而提供了一些以redis为基础的组件(仅有组件)。 一、Scrapy-Redis分布式策略: Master端(核心服务器):搭建一个Redis数据库,并开启redis-server ...
分类:
其他好文 时间:
2021-05-24 06:20:04
阅读次数:
0
时至今日,推荐系统已经成为许多产品的核心功能。一个好的推荐系统应该拥有的特质: 1.实时响应请求 2.及时、准确,全面记录用户反馈 3.可以优雅降级 4.快速试验多种策略 针对数据的使用时间进行划分,可分为三部分: 1.离线:使用历史数据,提供历史数据的推理 2.近线:使用实时数据,可提供实时数据的 ...
分类:
Web程序 时间:
2021-05-24 06:10:56
阅读次数:
0
LRU概述 LRU算法,即最近最少使用算法。其使用场景非常广泛,像我们日常用的手机的后台应用展示,软件的复制粘贴板等。 本文将基于算法思想手写一个具有LRU算法功能的Java工具类。 结构设计 在插入数据时,需要能快速判断是否已有相同数据。为实现该目的,可以使用hash表结构。 同时根据LRU的规则 ...
分类:
其他好文 时间:
2021-05-24 06:07:20
阅读次数:
0
配置解析 mybatis核心配置文件 :mybatis-config.xml configuration(配置) properties(属性) settings(设置) typeAliases(类型别名) typeHandlers(类型处理器) objectFactory(对象工厂) plugins ...
分类:
其他好文 时间:
2021-05-24 06:05:56
阅读次数:
0
字符编码具体原理 计算机的三大核心cpu、内存、硬盘,CPU相当于人的大脑,内存做临时存储,硬盘做永久存储 文本编辑器存取文件的原理(nodepad++,pycharm,word) 打开编辑器就可以启动一个进程,是在内存中的,所以在编辑器编写的内容也都是存放在内存中的,断电后数据就丢失了。因而需要保 ...
分类:
编程语言 时间:
2021-05-24 05:50:15
阅读次数:
0
CS架构:客户机-服务器,即Client-Server(C/S)架构,缺少通用性,系统维护、升级需要重新设计和开发,增加了维护和管理的难度 BS架构:B/S架构即浏览器和服务器架构模式,是web兴起后的一种网络架构模式,web浏览器是客户端最主要的应用软件,统一了客户端,将系统功能实现的核心部分集中 ...
分类:
Web程序 时间:
2021-05-24 05:44:40
阅读次数:
0
GraphQL是Facebook提出的一种数据查询语言,核心特性是数据聚合和按需索取,目前被广泛应用于前后端之间,解决客户端灵活使用数据问题。本文介绍的是GraphQL的另一种实践,我们将GraphQL下沉至后端BFF层之下,结合元数据技术,实现数据和加工逻辑的按需查询和执行。这样不仅解决了后端BF ...
分类:
其他好文 时间:
2021-05-24 05:42:17
阅读次数:
0
解决 TOP k 问题通常可采用 堆排序 和 快速排序的思想 1. 大根堆(前 K 小) / 小根堆(前 K 大): 时间复杂度O(NlogK) c++ STL 中提供了 priority_queue 实现堆的基本功能,比如 priority_queue <int> pq; 堆 pq 的元素都是 i ...
分类:
编程语言 时间:
2021-05-24 05:41:19
阅读次数:
0
文章地址:地址 函数指针数组:存放函数指针元素的数组而已 函数指针结构体:结构体和指针语法,允许C语言程序员写出面向对象风格的代码(其实,面向对象更多时候是一种编程思想,而不仅限于一种编程语言的语法) 注意:使用函数指针结构体之前,必须对结构体初始化,否则C语言程序就会有崩溃的风险(没有初始化的函数 ...
分类:
其他好文 时间:
2021-05-24 05:05:29
阅读次数:
0
Selenium基本操作 Selenium工具原理 Selenium2的核心是webdriver webdriver是按照 client-server设计原理设计 client:简单来说就是我们写的代码,以http请求的方式发送给server端,server 端接收请求,执行相应操作,并返回给cli ...
分类:
其他好文 时间:
2021-05-24 04:49:43
阅读次数:
0