功能要求为:1,数据采集,定期从网络中爬取信息领域的相关热词 2,数据清洗:对热词信息进行数据清洗,并采用自动分类技术生成自动分类计数生成信息领域热词目录。 3,热词解释:针对每个热词名词自动添加中文解释(参照百度百科或维基百科) 4,热词引用:并对近期引用热词的文章或新闻进行标记,生成超链接目录, ...
分类:
其他好文 时间:
2020-02-15 00:13:41
阅读次数:
141
语言模型 一段自然语言文本可以看作是一个离散时间序列,给定一个长度为𝑇的词的序列𝑤1,𝑤2,…,𝑤𝑇,语言模型的目标就是评估该序列是否合理,即计算该序列的概率: 本节我们介绍基于统计的语言模型,主要是𝑛元语法(𝑛-gram)。 语言模型 假设序列𝑤1,𝑤2,…,𝑤𝑇中的每个词是 ...
分类:
编程语言 时间:
2020-02-14 10:30:47
阅读次数:
106
思考 1.什么是非对称加密? 公钥加密系统,广泛用于数据加密传输 更详细的解释可参考维基百科 ( https://en.wikipedia.org/wiki/RSA_cryptosystem) 2.非对称加密难吗? very easy! 几乎每一种开发语言都能处理,同时也存在大量的工具 Python ...
分类:
编程语言 时间:
2020-02-12 22:25:11
阅读次数:
101
功能要求为:1,数据采集,定期从网络中爬取信息领域的相关热词 2,数据清洗:对热词信息进行数据清洗,并采用自动分类技术生成自动分类计数生成信息领域热词目录。 3,热词解释:针对每个热词名词自动添加中文解释(参照百度百科或维基百科) 4,热词引用:并对近期引用热词的文章或新闻进行标记,生成超链接目录, ...
分类:
其他好文 时间:
2020-02-11 00:41:47
阅读次数:
66
一 、什么是股票? 维基百科的定义: 股票 (英语:stock)或是 资本存货 (英语:capital stock)是一种有价证券, "股份公司" 将其所有权借由这种有价证卷进行分配 "[1\]" 。因为股份公司需要筹集资金,因此将股票发给投资者作为公司资本部分所有权的凭证,成为股东以此获得股息(股 ...
分类:
其他好文 时间:
2020-02-08 20:51:24
阅读次数:
110
简介 @ "维基百科" 本文内容皆源自 "Andrew Ng" 目的 1.实现数据压缩 2.实现数据在2D或3D中可视化 算法 "PCA(主成分分析)" 步骤 1.数据预处理 采用归一化方法,是的均值为0,方差为1。 步骤,1.均值为0 2.方差为1 $x_j^{(i)}={x_j \mu}\fra ...
分类:
其他好文 时间:
2020-02-08 09:33:05
阅读次数:
74
伸展树 Splay 维基百科上称为伸展树,但是国内好像一般叫平衡树,是众多平衡树中比较优秀的一种。 平衡树左旋右旋不会影响中序遍历顺序。 一棵平衡树的中序遍历顺序是值递增排序的,相当于从小到大到大排了一次序。 平衡树的作用: 平衡树其实就是一棵二叉搜索树,set和map都是平衡树实现。 一棵二叉搜索 ...
分类:
其他好文 时间:
2020-02-06 14:19:56
阅读次数:
56
发展 Curated KBs:以yago2和freebase为代表,他们从维基百科和WordNet等知识库抽取了大量的实体及实体关系,可以把它理解城一种结构化的维基百科。 RDF <实体1,关系,实体2> 或 <实体1,属性1,属性值1>, 例如:<Google,is-a,人工智能公司>;<人工智能 ...
分类:
其他好文 时间:
2020-01-31 16:10:56
阅读次数:
97
第十八个知识点:画一个描述ECB,CBC,CTR模式的操作 第8周是画三个图的任务,但是维基百科上已经有人画的很好了 https://en.wikipedia.org/wiki/File:ECB_encryption.svg https://en.wikipedia.org/wiki/File:CB ...
分类:
其他好文 时间:
2020-01-31 15:53:47
阅读次数:
257
什么是Shell shell是操作系统的命令解释器,在计算机科学中指“为用户提供用户界面”的软件,我的理解就是系统与用户沟通的桥梁。值得一提的是,shell不仅指的是命令行界面(CLI),图形界面(GUI)也是shell的一种。 壳层(shell)这个说法起源于路易斯·普赞(Louis Pouzin ...
分类:
系统相关 时间:
2020-01-27 00:06:15
阅读次数:
353