背景 文本分类属于文本挖掘。文本挖掘从已知文本提取未知的知识,即从非结构的文本中提取知识。文本挖掘主要领域:搜索和信息检索;文本聚类;文本分类;Web挖掘;信息抽取;自然语言处理;概念提取。[1] 搜索和信息检索:存储和文本文档的检索,包括搜索引擎和关键字搜索。 文本聚类:使用聚类方法,对词汇,片段 ...
分类:
其他好文 时间:
2020-05-14 23:50:55
阅读次数:
113
如果你用home.php作为wordpress首页模板的时候,经常会发现head中会出现rel='next',代码如下,实际上并没有第二页,点击访问还是首页,这样就造成了重复内容,对搜索引擎很不友好,如何把这个标签去掉呢?随ytkah一起来看看 <link rel='next' href='http ...
分类:
Web程序 时间:
2020-05-14 11:02:38
阅读次数:
116
图片标签 图片标签用于向当前页面中引入一个外部图片 使用img标签来引入外部图片,img标签是一个自结束标签,img这种元素属于替换元素(块元素与行内元素之间,具有两种元素的特点) 属性:src 指得是图片的路径 alt指得是图片的描述,正常情况下不会显示,当有的浏览器不显示的时候,搜索引擎会根据a ...
分类:
其他好文 时间:
2020-05-13 23:44:48
阅读次数:
90
前言 我们每天都在用 Google, 百度这些搜索引擎,那大家有没想过搜索引擎是如何实现的呢,看似简单的搜索其实技术细节非常复杂,说搜索引擎是 IT 皇冠上的明珠也不为过,今天我们来就来简单过一下搜索引擎的原理,看看它是如何工作的,当然搜索引擎博大精深,一篇文章不可能完全介绍完,我们只会介绍它最重要 ...
分类:
编程语言 时间:
2020-05-12 11:43:27
阅读次数:
66
语义化标签 用最恰当的HTML元素标记的内容。 优点: 提升可访问性 SEO 结构清晰,利于维护 通用容器: div 块级通用容器 span 短语内容无语义容器 <title></title>:简短、描述性、唯一(提升搜索引擎排名)。 搜索引擎会将title作为判断页面主要内容的指标,有效的titl ...
分类:
Web程序 时间:
2020-05-11 20:20:25
阅读次数:
84
实例 如何定义时间和日期: <p>我们在每天早上 <time>9:00</time> 开始营业。</p> <p>我在 <time datetime="2008-02-14">情人节</time> 有个约会。</p> 亲自试一试 浏览器支持 IEFirefoxChromeSafariOpera <ti ...
分类:
Web程序 时间:
2020-05-11 19:06:43
阅读次数:
72
ISO 语言代码 HTML 的 lang 属性可用于网页或部分网页的语言。这对搜索引擎和浏览器是有帮助的。 根据 W3C 推荐标准,您应该通过 <html> 标签中的 lang 属性对每张页面中的主要语言进行声明,比如: <html lang="en"> ... </html> 在 XHTML 中, ...
分类:
编程语言 时间:
2020-05-10 16:50:58
阅读次数:
78
【最佳实践】阿里云 Elasticsearch 向量检索4步搭建“以图搜图”搜索引擎, 本文作者: 小森同学 和通数据库Elasticsearch客户真实实践分享文中涉及到的图片特征提取,使用了yongyuan.name的VGGNet库,再此表示感谢! “图片搜索”是作为导购类网站比较常见的一种功能 ...
分类:
其他好文 时间:
2020-05-10 01:11:55
阅读次数:
75
1. 信息搜集的作用 信息零碎化,收集的工整性 1.1 为什么信息收集 + 获得信息 + 了解对方 + 掌握情况 + 寻找弱点 + 安全短板 1.2 收集哪些信息 网站的架构:osi模型 域名,Whois,CDN,c段 前端:HTML/ CSS/ JS…… 各级指纹识别,GitHub /源代码泄漏, ...
分类:
其他好文 时间:
2020-05-09 22:54:12
阅读次数:
154
之前在博客上分享过一篇文章,涉及到 Java 中的注释,就信誓旦旦地写了一句话:“注释是不会被执行的!”结果,有小伙伴留言说,“老师,你确定吗?” 我这个人一直有个优点,就是能听得进去别人的声音,管你是赞美的还是批评的,从来都是虚心接受。因为我相信,大多数小伙伴都是出于善的目的。 况且,我在技术上从 ...
分类:
编程语言 时间:
2020-05-06 19:49:12
阅读次数:
76