是什么? 网络爬虫就是自动从互联网中定向或不定向地采集信息的一种程序 网络爬虫有很多种类型,常用的有通用网络爬虫、聚焦网络爬虫等。 做什么? 通用网络爬虫可以应用在搜索引擎中,聚焦网络爬虫可以从互联网中自动采集信息并代替我们筛选出相关的数据出来。 网络爬虫经常应用在以下方面: 1、 搜索引擎 2、 ...
分类:
编程语言 时间:
2020-07-11 17:14:26
阅读次数:
69
string site:URI 在某一站点内搜索 "string1 string2 ......... stringN" 作为整体搜索,必须使用double quotation marks 搜索引擎会进行分词等等,加入double quotation marks会禁止搜索引擎拆词string之间不会 ...
分类:
其他好文 时间:
2020-07-10 22:37:45
阅读次数:
67
HTML 浏览头上设置的meta,用于增加搜索可见度,content指示关键字 <meta charset="UTF-8" name="keywords" content="HTML5,CSS,前端"> description:指定网站的描述,网站的描述会显示在搜索引擎搜索结果中 <meta nam ...
分类:
Web程序 时间:
2020-07-10 00:12:05
阅读次数:
131
[这篇文章是对所有的SEO优化教程进行分类和汇总,每有SEO优化文章更新,都会在这篇文章更新。SEO优化之站内页面优化教程文章列表都是对SEO页面优化的总结:SEO是什么意思SEO的基本概念 和 提交sitemap到搜索引擎SEO之网站关键词的优化 :首页,内页关键字,长尾关键字SEO关键词的优化 ... ...
分类:
其他好文 时间:
2020-07-09 12:10:59
阅读次数:
71
先来看一下都有哪些题目: 如何从大量的 URL 中找出相同的 URL?(百度) 如何从大量数据中找出高频词?(百度) 如何找出某一天访问百度网站最多的 IP?(百度) 如何在大量的数据中找出不重复的整数?(百度) 如何在大量的数据中判断一个数是否存在?(腾讯) 如何查询最热门的查询串?(腾讯) 如何 ...
分类:
其他好文 时间:
2020-07-07 13:30:40
阅读次数:
117
ELK简介1.ElasticSearch简称ES,它是一个实时的分布式搜索和分析引擎,它可以用于全文搜索,结构化搜索以及分析。它是一个建立在全文搜索引擎ApacheLucene基础上的搜索引擎,使用Java语言编写。2.Logstash是一个具有实时传输能力的数据收集引擎,用来进行数据收集(如:读取文本文件)、解析、过滤,并将数据发送给ES。3.Kibana为Elasticsearch提供了分析和
分类:
其他好文 时间:
2020-07-06 01:15:14
阅读次数:
52
第一步:下载mingw64 首先,在各大搜索引擎上搜索mingw64,进入其官网下载即可 需要注意的是,下载默认的是先从网页上下载下载器,再进行选择下载。但是在部分电脑上下载会出现什么mingw64.txt错误; (十分诡异的是,当我现在用这个方法进行的时候那个错误又不见了~~~) 所以这时候你就需 ...
分类:
编程语言 时间:
2020-07-05 23:16:46
阅读次数:
65
First. 什么是 algolia search? 根据algolia官方网站自我阐述:Algolia是一个托管搜索引擎,提供全文,数字和多面搜索,能够从第一次击键中提供实时结果。 Algolia强大的API可让您快速无缝地在网站和移动应用程序中实施搜索。我们的搜索API每月为成千上万的公司提供数 ...
分类:
其他好文 时间:
2020-07-05 13:54:02
阅读次数:
79
Jitsi是个优秀的WebRTC流媒体服务器,使用Java语言做开发,可以让很多Java人员也能进行流媒体开发,但是奈何国内的教程太少,官方文档更新太快,导致很多想用他的人却望而却步。 在写这篇文章之前,在搜索引擎上进行了搜索,发现没有一篇文章完整的把Jitsi Meet搭建起来并且能够多人正常音视 ...
分类:
Web程序 时间:
2020-07-05 12:05:18
阅读次数:
307
ES是啥? ES就是一个开源的搜索引擎 也是一个分布式文档数据库 可以在极短的时间内存储、搜索和分析大量的数据。 ES基本属性: 字段 ES中,每个文档,其实是以json形式存储的。而一个文档可以被视为多个字段的集合。 映射 每个类型中字段的定义称为映射。例如,name字段映射为String。 索引 ...
分类:
其他好文 时间:
2020-07-04 18:59:37
阅读次数:
48