在知识图谱构建阶段的实体对齐和属性值决策过程中、判断一篇文章是否是你喜欢的文章、比较两篇文章的相似性等,都涉及到了向量空间模型(Vector Space Model,简称VSM)和余弦相似度计算相关知识。这篇文章主要是先叙述VSM和余弦相似度相关理论知识,然后引用阮一峰大神的例子进行解释,最后通过Python简单实现百度百科和互动百科Infobox的余弦相似度计算。基本步骤:1.分别统计两个文档的关键词 2.两篇文章的关键词合并成一个集合...希望文章对你有所帮助~...
分类:
编程语言 时间:
2015-11-18 07:04:06
阅读次数:
534
1:分区表 ? ? ?图:创建分区表 ? ? ? 图:导入数据 ? ? ? ? 图:在HDFS的显示信息 分区字段就是一个文件夹的标识 ? ? ?图:在多列上创建分区 ? ? ? 图:导入数据 ? ? ? ? ? ? ? ? ?图:...
分类:
其他好文 时间:
2015-11-09 15:51:55
阅读次数:
293
JavaSE知识图解:面向对象:l面向对象(OOP)与面向过程二者都是一种思想,面向对象是相对于面向过程而言的。面向过程,强调的是功能行为。面向对象,将功能封装进对象,强调具备了功能的对象。面向对象更加强调运用人类在日常的思维逻辑中采用的思想方法与原则,如抽象、分类、..
分类:
编程语言 时间:
2015-10-31 01:48:30
阅读次数:
372
周日没事,简单总结了一下Android开发中使用到的知识,以脑图的形式呈现。
分类:
移动开发 时间:
2015-10-24 14:29:50
阅读次数:
261
最近研究搜索引擎、知识图谱和Python爬虫比较多,中文乱码问题再次浮现于眼前。虽然市面上讲述中文编码问题的文章数不胜数,同时以前我也讲述过PHP处理数据库服务器中文乱码问题,但是此处还是准备简单做下笔记。方便以后查阅和大家学习。主要包括raw_input输入、文件读取、变量比较等str、unicode、utf-8转换问题。
纪伯伦曾说过:“你无法同时拥有青春和关于青春的知识;因为青春忙于生计,没有余暇去求知;而知识忙于寻求自我,无法享受生活。”同样现在找工作的我,无法在拥有扎实基础知识的同时又兼顾深度的项...
分类:
编程语言 时间:
2015-10-02 00:19:43
阅读次数:
318
原文:http://book.thunlp.org/knowledge_graph/ 第二章 知识图谱——机器大脑中的知识库 Published by?liuzy?on?July 6, 2015 作者:刘知远(清华大学);整理:林颖(RPI) 版权所有,转载请注明出处 知识就...
分类:
其他好文 时间:
2015-09-21 16:05:01
阅读次数:
272
图像识别引擎-引擎收集知识地图识图如今搜索结果还是不够理想,有非常大的提升空间。以下介绍几个比較专业的图片搜索引擎。1:https://images.google.com/http://www.google.com/imghp(旧版:http://similar-images.googlelabs....
分类:
其他好文 时间:
2015-09-20 11:55:56
阅读次数:
206
你想要的,你需要全力去追求;你要追求的,可能不是你真正想要的。人生,享受的是过程,至于结果,那是天注定的! 前些天,用初中的照片和现在的照片在百度识图搜了一下,识图结果却惊人的一致,“IT男”,既然命中注定了,何不好好享受过程呢。 时光如白驹过隙,入新公司到现在居然快满五年。感叹岁...
分类:
其他好文 时间:
2015-09-11 01:28:07
阅读次数:
211
转自:http://www.hahait.com/news/185.html原理非常简单易懂。我们可以用一个快速算法,就达到基本的效果。这里的关键技术叫做“感知哈希算法”(Perceptual hash algorithm),它的作用是对每张图片生成一个“指纹”(fingerprint)字符串,然后...
分类:
其他好文 时间:
2015-09-06 18:15:34
阅读次数:
427
J2SE面向对象这一块的内容还是较为简单的。之前面向对象的知识已经有了一定的了解与深入。到了Java这一块,换汤不换药。
在这里我将其与C#进行对比,分为新知识与就旧知识。图片比文字更加直观生动形象容易理解,晒一下:
首先声明一点,内存分析贯穿始终,也是我这次学习收获的最大的一个知识点。
面向对象:
面向对象有三部曲:考虑有哪些对象,类和对象有哪些属性和方法以及...
分类:
其他好文 时间:
2015-08-30 12:59:54
阅读次数:
178