1 第三方库的安装与简介 1.1 Python第三方库 jieba(中文分词) 1. 特点 (1)支持三种分词模式: 精确模式,试图将句子最精确地切开,适合文本分析; 全模式,把句子中所有的可以成词的词语都扫描出来, 速度非常快,但是不能解决歧义; 搜索引擎模式,在精确模式的基础上,对长词再次切分, ...
分类:
编程语言 时间:
2020-04-10 21:06:58
阅读次数:
142
什么是SEO SEO由英文Search Engine Optimization缩写而来, 中文意译为“搜索引擎优化”。SEO是指从自然搜索结果获得网站流量的技术和过程,是在了解搜索引擎自然排名机制的基础上, 对网站进行内部及外部的调整优化, 改进网站在搜索引擎中的关键词自然排名, 获得更多流量, 从 ...
分类:
其他好文 时间:
2020-04-10 11:57:46
阅读次数:
73
在工程实践中遇到问题是如何解决的: 对于普遍存在的问题,例如环境问题、工具问题、Linux内核问题等可以在相关的论坛相关的issue,以及对该issue的解决方案。很多小问题通过Google、Baidu搜索引擎收到的答案就能解决了。 对于部门内部的问题、和项目强相关的问题,优先的解决问题的方案是在部 ...
分类:
其他好文 时间:
2020-04-09 12:27:05
阅读次数:
189
简述 前面从新回顾学习了Solr,正好也借此机会顺便学习一下Lucene。 一、什么是Lucene? 全文检索的一个实现方式,也是非结构化数据查询的方法。应用场景:在数据量大,数据结构不固定的时候,采用Lucene,比如百度、Google等搜索引擎,网站的站内搜索,电商平台的商品检索等。 二、Luc ...
分类:
Web程序 时间:
2020-04-08 10:11:04
阅读次数:
88
一、Elasticsearch介绍 之前有学习使用过Solr。Elasticsearch也是基于Lucene的搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎,基于RESTful web接口。Elasticsearch是用Java开发的,并作为Apache许可条款下的开放源码发布,是当前流行的 ...
分类:
其他好文 时间:
2020-04-08 10:03:52
阅读次数:
306
网络状态码301与302 """ 301和302都是HTTP状态的编码,都代表着某个URL发生了转移。 301跳转,也叫“永久性转移”,301会把原网页权重转移到重定向目标的网站上面。 302跳转也称为,“临时性跳转”。 区别 1、使用效果不同 302跳转是暂时的跳转,搜索引擎会抓取新的内容而保留旧 ...
分类:
其他好文 时间:
2020-04-08 09:47:16
阅读次数:
51
安装jieba pip install jieba 简单用法 结巴分词分为三种模式:精确模式(默认)、全模式和搜索引擎模式,下面对这三种模式分别举例介绍: 精确模式 import jieba s = u'我想和女朋友一起去北京故宫博物院参观和闲逛。' cut = jieba.cut(s) print ...
分类:
其他好文 时间:
2020-04-07 13:01:37
阅读次数:
128
[toc] 需求描述 "必应" 作为一个在壁纸圈做搜索引擎最优秀的站点,其每日壁纸也是可圈可点的。 那么自然就生出了如何将必应的每日壁纸保存下来,用作电脑桌面壁纸轮播的想法。 实现方式 简单粗暴 如何下载 最简单,不需要任何编程的办法,就是右键查看背景图像,然后另存到本地。 箭头指向的这个链接,就是 ...
分类:
其他好文 时间:
2020-04-07 12:57:33
阅读次数:
701
Python jieba 库的使用说明 1、jieba库基本介绍 (1)、jieba库概述 jieba是优秀的中文分词第三方库 - 中文文本需要通过分词获得单个的词语 - jieba是优秀的中文分词第三方库,需要额外安装 - jieba库提供三种分词模式,最简单只需掌握一个函数 (2)、jieba分 ...
分类:
其他好文 时间:
2020-04-07 12:51:26
阅读次数:
768
1.所有搜索引擎都是get请求,get方式有缓存功能,进行压缩发送gzip方式。 请求-响应头: ...
分类:
Web程序 时间:
2020-04-06 17:39:57
阅读次数:
69