html标题 通过 <h1>、<h2>、<h3>、<h4>、<h5>、<h6>,标签可以在网页上定义6种级别的标题。6种级别的标题表示文档的6级目录层级关系,比如说: <h1>用作主标题(最重要的),其后是 <h2>(次重要的),再其次是 <h3>,以此类推。搜索引擎会使用标题将网页的结构和内容编制 ...
分类:
Web程序 时间:
2020-02-03 09:59:36
阅读次数:
100
html图像 <img>标签可以在网页上插入一张图片,它是独立使用的标签,通过“src”属性定义图片的地址,通过“alt”属性定义图片加载失败时显示的文字,以及对搜索引擎和盲人读屏软件的支持。 <img src="images/pic.jpg" alt="产品图片" /> 绝对路径和相对路径 像网页 ...
分类:
Web程序 时间:
2020-02-03 09:58:47
阅读次数:
97
什么是爬虫 网络爬虫,也叫网络蜘蛛(spider),是一种用来自动浏览万维网的网络机器人。其目的一般为编纂网络索引。 网络搜索引擎等站点通过爬虫软件更新自身的网站内容或其对其他网站的索引。网络爬虫可以将自己所访问的页面保存下来,以便搜索引擎事后生成索引供用户搜索。 爬虫访问网站的过程会消耗目标系统资 ...
分类:
编程语言 时间:
2020-02-02 15:45:03
阅读次数:
203
HTML学习记录 起因是买了本书学习flask,书里让我自己学HTML……超文本标记语言即HTML,HTML文档以.html为后缀。HTML是一种用来描述网页的标记语言,是一套标记标签,因此HTML使用标记标签来描述网页。HTML标签有以下特征: ·标签是由尖括号包围的关键字 ·标签通常是成对出现的 ...
分类:
Web程序 时间:
2020-01-31 21:01:45
阅读次数:
84
1. 倒排求交 上一篇讲了分词。对用户的query分词之后,得到了一个个独立的词(term)。先设想一个问题,用这些词去索引里搜索时,是不是doc命中query中任何一个term,都可以被搜索出来?(query中只有一个term除外) 这里涉及好几个问题: 1. 截断:例如query是5个词ABCD ...
分类:
其他好文 时间:
2020-01-30 09:56:17
阅读次数:
101
许多搜索引擎都提供了关键词联想api,且大多数都是jsonp. Jsonp(JSON with Padding) 是 json 的一种"使用模式",可以让网页从别的域名(网站)那获取资料,即跨域读取数据。使用jsonp就不用担心浏览器因同源策略而禁止跨域这种情况的发生了。 以百度为例, 1 wind ...
文档结构 head标签 1. meta 文档字符编码 标签写法分类 1.2 meta 页面刷新 1.3 meta 关键字 meta标签可以设置关键字,用于搜索引擎收录和关键字搜索。 1.4 meta 网站描述 meta标签可以设置网站描述信息,用于在搜索引擎搜索时,显示网站基本描述信息。 1.5 m ...
分类:
Web程序 时间:
2020-01-29 16:13:07
阅读次数:
100
请问您今天要来个引擎吗? 工欲善其事必先利其器最终项目上线演示地址: http://search.mtianyan.cn第二节:我们搞搞比利,搞搞环境的搭建。Github地址: https://github.com/mtianyan/ArticleSpiderIDE: pycharm数据库: mys... ...
分类:
其他好文 时间:
2020-01-29 12:22:19
阅读次数:
184
搜索引擎的下拉关键词有“易经六十四卦符号如何输入”、“Word可拷贝的易经六十四卦符号”,「易经六十四卦」[1]这篇文章可拷贝。 这些符号有Unicode,「输出《易经》六十四卦的卦象符号」[2]这篇文章用编程生成。 如果键盘输入,在Mac手动输入的话,首先添加输入法“Unicode Hex Inp ...
分类:
其他好文 时间:
2020-01-24 13:23:08
阅读次数:
960
该课题来源于UVA中Searching the Web的题目:https://vjudge.net/problem/UVA-1597 按照题目的说法,我对按照特定格式输入的文章中的词语合成字典,以满足后期的快速查找。 针对于字典的合成途径,我利用了STL中的map与set的嵌套形成了一种特定的数据结 ...
分类:
编程语言 时间:
2020-01-23 15:31:40
阅读次数:
113