1 分布式事务背景 随着分布式数据库技术的发展越来越成熟,业内对于分布式数据库的要求也由曾经只用满足解决海量数据的存储和读取这类边缘业务向核心交易业务转变。分布式数据库如果要满足核心账务类交易需求,则其需要完善分布式事务,向传统关系型数据库看齐。即分布式事务的实现也需要像传统关系型数据库的事务一样满 ...
                            
                            
                                分类:
数据库   时间:
2020-01-10 12:31:38   
                                阅读次数:
75
                             
                         
                    
                        
                            
                            
                                    本章分享的目录: 1:基础 第一节:简介与原理 2:设置用户及权限赋予 第二节:角色权限 3:安装 ,配置,连接 第三节:部署hive 4:参数动态设置 第四节:hive参数设置 第一节:简介与原理 简介: 数据仓库,对海量数据的离线处理(以HiveQL的形式,生成MR任务); 核心组件: 解释器, ...
                            
                            
                                分类:
其他好文   时间:
2020-01-09 14:49:03   
                                阅读次数:
115
                             
                         
                    
                        
                            
                            
                                在全球科技革命与产业变革浪潮中,信息科技与各个领域的融合已势不可挡。随着融合的不断深入,政府的治理方式也随之发生变化。建设数字政府成为“创新行政方式、提高行政效能,建设人民满意的服务型政府”的重要途径和关键抉择。在政府部门加大对数字政府的信息基础设施建设投入过程中,优化信息存储与信息使用安全环境,为数据的采集、存储、开发和利用提供可靠的数据源,将有利于政府提升决策能力、管理能力和服务能力。2020
                            
                            
                                分类:
其他好文   时间:
2020-01-07 14:46:59   
                                阅读次数:
135
                             
                         
                    
                        
                            
                            
                                1 序 对ETL系统中数据转换和存储操作的相关日志进行记录以及实时分析有助于我们更好的观察和监控ETL系统的相关指标(如单位时间某些操作的处理时间),发现系统中出现的缺陷和性能瓶颈。 由于需要对日志进行实时分析,所以Storm是我们想到的首个框架。Storm是一个分布式实时计算系统,它可以很好的处理 ...
                            
                            
                                分类:
其他好文   时间:
2020-01-06 22:42:07   
                                阅读次数:
78
                             
                         
                    
                        
                            
                            
                                    从何说起 前些天和朋友讨论一个问题,他们的应用有几十万会员然后对应有积分,现在想做积分排名的需求,问有没有什么好方案。这个问题也算常见,很多地方都能看到,常规做法一般是数据定时跑批把计算结果到中间表然后直接查表就行,或者只显示个TOP N的排行榜,名次高的计算真实名次,名次比较低的直接显示在xxx名 ...
                            
                            
                         
                    
                        
                            
                            
                                    最近在研究机器学习,随手将学习的过程记录下来,方面自己的学习与回顾 1. 机器学习是什么? 最近在研究机器学习,随手将学习的过程记录下来,方面自己的学习与回顾 1. 机器学习是什么? 机器学习(Machine Learning,ML)是专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能 ...
                            
                            
                                分类:
其他好文   时间:
2020-01-04 10:41:21   
                                阅读次数:
60
                             
                         
                    
                        
                            
                            
                                在金融领域,NLP技术的作用主要在于自动从海量的宏观、行业、微观资讯中发现、分析并整合与各类决策相关的信息。知识图谱在金融中有多项应用,首先通过信息检索技术获取相关文本,然后借语义分析技术从非结构化文本中提取结构化的信息,最后将这些信息加以提炼,并且使之关联到未来可能的发展趋势,从而为预测和决策提供有价值的及时信息。智能金融应用是通过知识图谱相关技术从招股书、年报、公司公告、券商研究报告、新闻等半
                            
                            
                                分类:
其他好文   时间:
2020-01-04 01:13:09   
                                阅读次数:
103
                             
                         
                    
                        
                            
                            
                                数据库中的每条记录都需要一个ID,即使在分库分表后这个ID需要全局唯一性。因此,分库分表后不能使用Mysql自带的自增ID了。因为不通的库之间的ID可能是一样的。 我们以记录海量的用户信息为例,可能会想到身份证号、电话号码或者email。但是这些信息是会变的。如果用户要修改这些信息,那么ID就失效了 ...
                            
                            
                                分类:
其他好文   时间:
2020-01-04 00:42:58   
                                阅读次数:
85
                             
                         
                    
                        
                            
                            
                                    生成器 生成器 生成器仅仅保存了一套生成数值或者对象的算法,并且没有让这个算法现在就开始执行,而是我什么时候调它,它什么时候开始计算一个新的值,并给你返回。 为何要用生成器 存储海量的数据会占用内存资源,如果我们可以根据算法推算后面的数据,什么时候需要的时候就去生成,这样将极大地减少内存占用。 创建 ...
                            
                            
                                分类:
其他好文   时间:
2020-01-04 00:42:40   
                                阅读次数:
110
                             
                         
                    
                        
                            
                            
                                    WPS Office 2019专业增强版最新安装包,正版序列号分享,终身授权激活。WPS Office是款一免费的办公软件套件,全面涵盖了文字处理、电子表格,演示文稿、PDF以及云服务等功能。WPS2019办公套件,体积轻巧、内存占用低、运行速度快、强大插件平台支持、免费提供海量在线存储空间及文档模 ...
                            
                            
                                分类:
其他好文   时间:
2020-01-03 14:05:03   
                                阅读次数:
422