码迷,mamicode.com
首页 >  
搜索关键字:结构化数据    ( 770个结果
[Elasticsearch] 控制相关度 (一) - 相关度分值计算背后的理论
本章翻译自Elasticsearch官方指南的Controlling Relevance一章。 控制相关度(Controlling Relevance) 对于仅处理结构化数据(比如日期,数值和字符枚举值)的数据库,它们只需要检查一份文档(在关系数据库中是一行)是否匹配查询即可。 尽管布尔类型的YES|NO匹配也是全文搜索的一个必要组成,它们本身是不够的。我们还需要...
分类:其他好文   时间:2014-12-23 10:32:51    阅读次数:216
HDInsight HBase的概述
HDInsight HBase的概述 什么是HBase的? HBase的是建立在Hadoop的Apache的开源的NoSQL数据库,提供了大量的非结构化和半结构化数据的随机存取和强大的一致性。它是仿照谷歌的BigTable是一个列面向家庭的数据库。数据被存储在一排内的表和数据的行是由列族分组。 HBase的是在这个意义上,无论是列也不存储在其中的数据类型需要在使用它们之前所定义的模式的更小的数据库。开放源代码是首次发布由Mike Cafarella于2007年,线性扩展处理PB级数据数千个节点。它可以依靠数...
分类:其他好文   时间:2014-12-16 11:49:47    阅读次数:205
XML基础(一)
一、概念         1、可扩展标记语言,标准通用标记语言的子集,是一种用于标记电子文件使其具有结构性的标记语言。 它可以用来标记数据、定义数据类型,是一种允许用户对自己的标记语言进行定义的源语言。 它非常适合万维网传输,提供统一的方法来描述和交换独立于应用程序或供应商的结构化数据。...
分类:其他好文   时间:2014-12-16 08:47:46    阅读次数:147
Google Protocal Buffer
Google Protocal Buffer 是一种轻便高效的结构化数据存储格式,可以用于结构化数据串行化或者说序列化。它很适合做数据存储或RPC数据交换格式。串行化(序列化):将对象存储到解释中式以二进制方式通过网络传输。之后可以通过反串行化从这些联系的字节数据重新构建一个与袁术对象状态相同的对像...
分类:其他好文   时间:2014-12-15 17:08:01    阅读次数:188
MySQL笔记系列:数据库概述
数据库管理技术的发展阶段1、人工管理阶段数据不能长期保存、程序本身管理数据、数据不能共享、数据不具有独立性。2、文件系统阶段数据可以长期保存、数据有文件系统管理、数据冗余大,共享性差、存取效率低下。3、数据库系统阶段数据实现结构化、数据实现共享性、存取效率高数据库系统相关概念数据库(database...
分类:数据库   时间:2014-12-13 00:47:55    阅读次数:346
nosql
nosql引入:  1.大数据时代  3v  海量volume  多样性Variety   实时 Velocity  2.系统需求(互联网的应用----淘宝、天猫)        高并发、海量结构化非结构化数据的存储、高可扩展性、高可用性  3.传统的数据库解决方案  :  数据的切分(水平切分、垂直切分)  4.nosql---->易扩展、灵活的数据模型、高可用、大数据量(就是因为这些...
分类:数据库   时间:2014-12-09 09:18:20    阅读次数:203
关于JS中的JSON
早期,一般是使用XML作为互联网上传输结构化数据的,但由于它解析麻烦,字符冗长,因此被轻量级的JSON所逐渐替代。JSON是JavaScript的一个严格子集,利用了JavaScript中一些模式来表示结构化的数据。可以直接将JSON格式的字符串传递给eval()进行处理,由于JSON是JS的子集,...
分类:Web程序   时间:2014-12-08 15:23:30    阅读次数:204
[Elasticsearch] 全文搜索 (一) - 基础概念和match查询
翻译自官方指南的全文搜索一章。 全文搜索(Full Text Search) 现在我们已经讨论了搜索结构化数据的一些简单用例,是时候开始探索全文搜索了 - 如何在全文字段中搜索来找到最相关的文档。 对于全文搜索而言,最重要的两个方面是: 相关度(Relevance) 查询的结果按照它们对查询本身的相关度进行排序的能力,相关度可以通过TF/IDF,参见什么是相关...
分类:其他好文   时间:2014-12-03 10:31:26    阅读次数:313
双活架构保服务24小时在线
江西省测绘地理信息局借助云计算和大数据技术,打造了一个高效、智能、可靠的私有云服务平台,其双活数据中心的架构、结构化数据与非结构化数据分而治之的先进理念被同行广泛借鉴。2014年3月10日是一个让江西省测绘地理信息局上上下下记忆深刻和感到骄傲的日子。继公众版之后,..
分类:其他好文   时间:2014-12-01 19:28:14    阅读次数:269
用大数据处理思路保护数据
面对虚拟化、非结构化数据等新挑战,昆腾提出的解决思路其实很简单,也很直接,就是区分不同的数据类型和需要,然后采取不同的更有针对性的保护方式。这其实就是今天人们处理大数据的基本思路。在云计算、大数据等新概念出现后,主存储,也就是在线存储,其性能、可靠性、可管..
分类:其他好文   时间:2014-12-01 19:27:14    阅读次数:181
770条   上一页 1 ... 68 69 70 71 72 ... 77 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!