码迷,mamicode.com
首页 >  
搜索关键字:结构化    ( 4092个结果
商业智能bi应用程序的环境支持
随着计算机技术的进步,越来越多的数据可以以较低的成本获得和存储。任何在线信息站点或设备都可以收集新的数据,括电子商务网站、RFID标签、网站、电子邮件、博客等。本文从结构化、非结构化和数据类型、数据库、数据挖掘和云数据等方面介绍了商业智能的应用。结构化、非结构化和数据类型:从广义上讲,数据可以分为结构化数据和非结构化数据。随着现代企业内外部数据的快速积累,结构化和非结构化数据对于商业智能的无缝分析
分类:其他好文   时间:2020-08-20 18:38:33    阅读次数:68
正则表达式在NLP中应用
正则表达式是一种定义了搜索模式的特征序列 ,用于字符串的模式匹配。 它的作用有两个: (1) 将文档内容从非结构化转为结构化 , 以便文本挖掘 (2) 去除“噪声”(即 文本片段中,与文本无关的文字信息和最终输出) 1. 匹配字符串 re.search(regex,string ) 检查string ...
分类:其他好文   时间:2020-08-18 15:38:17    阅读次数:57
模块化、结构化的代码,程序员正讲述着人生
今天没有发技术文章,只是聊聊我今天让我有所感悟的关键字:模块化我们都知道在sqlserver里面,存储相应的功能让他变成模块化,这是为了让优秀的代码有更快的重复性,避免重构的麻烦。然而我在想优秀的T-SQL代码被封装成一个模块,让开发程序的时候更加便捷,而我们的人生是会是一个个模块吗?我们小时候被教育好好学习,才有更好的未来,不然没有出头日,这就相当于我们应客户的需求在构建优秀的模块,让客户满意。
分类:其他好文   时间:2020-08-17 17:37:15    阅读次数:72
2020重新出发,JAVA基础,面向对象
面向对象 最早的程序开发使用的是结构化程序设计语言,随着时间的流逝,软件的规模逐渐扩大,使用结构化语言会出现各种弊端,导致无休止地拖延开发周期,产品的质量也不尽如人意。这一切都体现了结构化语言不再适合当前的软件开发。现在程序设计者们将另一种开发思想引入程序中,那就是面向对象开发思想。 面向对象最关键 ...
分类:编程语言   时间:2020-08-17 16:45:13    阅读次数:57
数据源管理 | 分布式NoSQL系统,Cassandra集群管理
本文源码:GitHub·点这里||GitEE·点这里一、Cassandra简介1、基础描述Cassandra是一套开源分布式NoSQL数据库系统。它最初由Facebook开发,用于储存收件箱等简单格式数据,此后,由于Cassandra良好的可扩展性,逐渐发展成为了一种流行的分布式结构化数据存储方案。2、特点分析弹性可扩展性Cassandra是高度可扩展的;它允许添加更多的硬件以适应更多的客户和更多
分类:数据库   时间:2020-08-13 11:56:51    阅读次数:74
SQL查询两个日期的差-datediff函数
datediff函数: 语法:DATEDIFF(datepart,startdate,enddate) startdate 和 enddate 参数是合法的日期表达式。 datepart 参数可以是下列的值: 结构化查询语言(Structured Query Language)简称SQL,结构化查询 ...
分类:数据库   时间:2020-08-12 15:54:10    阅读次数:173
网站流量日志分析(模块开发——数据预处理)
数据预处理 在正式处理数据之前对收集的数据进行预先处理的操作。 原因:不管通过何种手段收集的数据 往往是不利于直接分析的 数据中存在的格式规整的差异。 目的:把不干净的数据 格式不规则的数据 通过预处理清洗变成格式统一规整的结构化数据 技术:MapReduce 预处理的编程思路问题 在使用mr编程的 ...
分类:Web程序   时间:2020-08-10 17:26:02    阅读次数:80
SQL语言基础
1.定义 对数据库进行查询和修改操作的语言叫做SQL(Structured Query Language,结构化查询语言) SQL是一种数据库查询和程序设计语言,用于存储数据以及查询、更新和管理关系数据库系统; 与其他程序设计语言不同的是,SQL由很少的关键字组成,每个SQL语句通过一个或多个关键字 ...
分类:数据库   时间:2020-08-08 21:23:14    阅读次数:82
Spark(十一)【SparkSQL的基本使用】
一. SparkSQL简介 Spark SQL是Spark用于结构化数据(structured data)处理的Spark模块。 Dremel > Drill(Apache) >Impala(Cloudrea) Presto(Hotonworks) Hive > Shark(对Hive的模仿,区别在 ...
分类:数据库   时间:2020-08-07 21:45:52    阅读次数:79
PB 级大规模 Elasticsearch 集群运维与调优实践
作者:bellen,腾讯云大数据研发工程师。腾讯云Elasticsearch被广泛应用于日志实时分析、结构化数据分析、全文检索等场景中,本文将以情景植入的方式,向大家介绍与腾讯云客户合作过程中遇到的各种典型问题,以及相应的解决思路与方法,希望与大家一同交流。背景因为游戏业务本身的日志数据量非常大(写入峰值在100wqps),在服务客户的几个月中,踩了不少坑,经过数次优化与调整,把客户的ES集群调整
分类:其他好文   时间:2020-08-07 10:02:01    阅读次数:67
4092条   上一页 1 ... 8 9 10 11 12 ... 410 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!