码迷,mamicode.com
首页 >  
搜索关键字:结构化    ( 4092个结果
在Hadoop中重写FileInputFormat类以处理二进制格式存储的整数
最近开始使用MapReduce,发现网上大部分例子都是对文本数据进行处理的,也就是说在读取输入数据时直接使用默认的TextInputFormat进行处理即可。对于文本数据处理,这个类还是能满足一部分应用场景。但是如果要处理以二进制形式结构化记录存储的文件时,这些类就不再适合了。 本文以一个简单的应用场景为例:对按照二进制格式存储的整数做频数统计。以此来说明如何重写FileInputFormat来实现对非文本数据的处理。...
分类:其他好文   时间:2014-06-04 21:53:46    阅读次数:341
90%的商界领袖视大数据为企业决策关键因素
在过去的几年中,雪崩的数据,包括结构化和非结构化数据,推动组织到了一个突破点,大数据时代俨然已经到了。在大数据时代,CIO和IT主管知道,他们能否取得成功,严重依赖于如何挖掘到大数据,并把它充分利用。然而,目前许多高管并不知道如何最好地利用大数据以提高企业决策能力。据凯捷最近发布的关于“决定因素:大...
分类:其他好文   时间:2014-05-29 19:01:33    阅读次数:216
An Introduction to Conditional Random Fields论文摘要(翻译:Trey;审校:Shooya)
摘要:通常,我们希望预测大量的,正如依赖于其他观察到的变元一样,互相间同样存在依赖的变元。结构化的预测模型,本质上是分类方法和图形化建模的结合,这些预测模型将图形化模型对多变元数据的有效建模能力,以及分类方法通过使用大的输入特征集来作出预测的能力结合起来。本指引讨论用于结构化预测的一个流行的概率模型...
分类:其他好文   时间:2014-05-28 00:54:37    阅读次数:240
各种工具介绍
编号 工具名称工具介绍下载地址1FreeMindFreeMind是一套由Java撰写而成的实用的开源思维导图/心智(MindMap)软件,可用来帮助你整理思绪的工具软体,可将每一个环节用 图形表示,透过将思路图形化、结构化,帮助你对整个作业流程的了解。http://freemind.sourcef....
分类:其他好文   时间:2014-05-26 10:35:25    阅读次数:213
网络爬虫(网络蜘蛛)之网页抓取
现在有越来越多的人热衷于做网络爬虫(网络蜘蛛),也有越来越多的地方需要网络爬虫,比如搜索引擎、资讯采集、舆情监测等等,诸如此类。网络爬虫涉及到的技术(算法/策略)广而复杂,如网页获取、网页跟踪、网页分析、网页搜索、网页评级和结构/非结构化数据抽取以及后期更细粒度的数据挖掘等方方面面,对于新手来说,不...
分类:Web程序   时间:2014-05-26 05:54:50    阅读次数:393
我的软考之路(八)——三大原则学会数据流图
数据流图是软考当中比较重要的一部分考点,不仅上午的选择题会考,而且下午要考一个大题。所以对数据流图的学习不容忽视。        对于数据流图,我们不做过多详细的介绍,网上有很多丰富的资源(百科),一定了解的它的由来,这才是学习的关键。下面我们看看数据流图基本图形符号、设计原则、应用和总结。 基本图形符号                   设计原则...
分类:其他好文   时间:2014-05-26 04:52:47    阅读次数:215
dom 编程(html和xml)
html dom与xml dom关系: 什么是 DOM? DOM 是 W3C(万维网联盟)的标准。 DOM 定义了访问 HTML 和 XML 文档的标准: “W3C 文档对象模型 (DOM) 是中立于平台和语言的接口,它允许程序和脚本动态地访问和更新文档的内容、结构和样式。” W3C DOM 标准被分为 3 个不同的部分: 核心 DOM - 针对任何结构化文档的标准模型 XM...
分类:Web程序   时间:2014-05-26 04:51:28    阅读次数:331
当前软件设计分析
当前的软件工程技术:已经老去的面向过程,正当壮年的面向对象,冉冉升起的面向服务.面向过程技术(结构化程序设计技术):DFD图,ER模型,UC矩阵.面向对象技术:继承,封装,多态,复用等.面向服务技术:业务的组合,面向服务,与IT技术的无关性.面向过程的理解:世界的一切都不是孤立的,它们相互地紧密联系...
分类:其他好文   时间:2014-05-23 02:48:31    阅读次数:277
day19 数据库的初步认识
一:数据库的概念数据库:一个用于储存数据并可以对之进行管理和使用的软件系统。sql:struct(结构) query(查询) language(语言) 结构化查询语言: 其实是一种国际化语言标准,在这个基础上开发数据库产品数据库产品:mysql oracle db2 mssql......需要记住的...
分类:数据库   时间:2014-05-21 17:52:24    阅读次数:234
oracle基础sql
二、SQL Structur query language 结构化查询语言,是操作关系型数据库中的对象。 DDL(Data definition language 数据定义语言),用于建表或删表操作,以及对表约束进行修改 create table , alter table , drop tabl....
分类:数据库   时间:2014-05-21 17:34:25    阅读次数:383
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!