一、计算机的发展 (1)计算机的概念: 计算机是一种能那种事先储存的程序,自动、高速地进行数值计算和信息处理的智能电子设备。 (2)计算机的诞生: 诞生:1946年 名称:电子数字积分计算机——ENIAC ( Electronic Numerical Integrator And Computer ...
分类:
其他好文 时间:
2020-06-13 23:23:54
阅读次数:
131
全文搜索介绍 全文搜索两个最重要的方面是: 相关性(Relevance) 它是评价查询与其结果间的相关程度,并根据这种相关程度对结果排名的一种能力,这 种计算方式可以是 TF/IDF 方法、地理位置邻近、模糊相似,或其他的某些算法。 分词(Analysis) 它是将文本块转换为有区别的、规范化的 t ...
分类:
其他好文 时间:
2020-06-13 13:21:20
阅读次数:
86
最近在学习Weka发现是一个很不错的数据挖掘工具,在这里介绍下。 什么是数据挖掘?什么是Weka? 数据挖掘是一门成熟的技术,Weka 是数据挖掘的工具包,是 Waikato Environment for Knowledge Analysis 的首字母缩略词,我们称作 Weka。 Explorin ...
分类:
其他好文 时间:
2020-06-13 11:19:41
阅读次数:
168
本篇对中文分词器IK作了简单的讲解,市面上流行的中文分词器很多,如果我们遇到有中文分词的需求,货比三家是永远不过时的道理,调研可能要花费一些时间,但能挑到适合自己项目的分词器,还是划算的
分类:
其他好文 时间:
2020-06-11 12:05:12
阅读次数:
61
##1.ElasticSearch Head使用 扩展程序安装插件:ElasticSearch github地址:https://github.com/mobz/elasticsearch-head/ 运行效果: ##2.Kibana使用 下载链接:https://www.elastic.co/gu ...
分类:
其他好文 时间:
2020-06-08 23:28:06
阅读次数:
88
> 文章来源:http://www.hollischuang.com/archives/1047 hat(Java Heap Analysis Tool),是一个用来分析java的堆情况的命令。之前的文章讲到过,使用jmap可以生成Java堆的Dump文件。生成dump文件之后就可以用jhat命令, ...
分类:
编程语言 时间:
2020-06-08 20:46:59
阅读次数:
79
一、概念 主成分分析(Principal Component Analysis)是指将多个变量通过线性变换以选出较少数重要变量的一种多元统计分析方法,又称为主成分分析。在实际应用场合中,为了全面分析问题,往往提出很多与此有关的变量(或因素),因为每个变量都在不同程度上反映这个应用场合的某些信息。 主 ...
分类:
编程语言 时间:
2020-06-07 01:00:18
阅读次数:
92
原文链接 从高数原理推导出的PCA降维 【机器学习】降维-PCA PCA(Principal Component Analysis) 是一种常见的数据分析方式,常用于高维数据的降维,可用于提取数据的主要特征分量。 PCA 的数学推导可以从最大可分型和最近重构性两方面进行,前者的优化条件为划分后方差最 ...
分类:
编程语言 时间:
2020-06-03 15:13:40
阅读次数:
75
abstract 在本文中,我们研究了来自预先训练的语言模型(如BERT)的上下文嵌入的建模能力 ,如E2E-ABSA任务。具体来说,我们建立了一系列简单而又有洞察力的神经基线来处理E2E-ABSA。实验结果表明,即使是一个简单的线性分类层,我们的BERT-based结构也可以超越最先进的作品。此外 ...
分类:
Web程序 时间:
2020-05-29 23:25:24
阅读次数:
106
传送门 Analysis AC自动机+dp 直接从正面做 设$f[i][j][0/1]$表示在节点$i$,串长为$j$,是否已经经过结尾点的总方案数,然后从父亲向儿子转移 做$dp$的时候不用跳$fail$,在构建$fail$指针的时候顺带把对于结尾点的标记通过$fail$指针扩展到它在$fail$ ...
分类:
Web程序 时间:
2020-05-28 16:08:03
阅读次数:
71