KNN算法全名为k-Nearest Neighbor,就是K最近邻的意思。 算法描述 KNN是一种分类算法,其基本思想是采用测量不同特征值之间的距离方法进行分类。 算法过程如下: 1、准备样本数据集(样本中每个数据都已经分好类,并具有分类标签);2、使用样本数据进行训练;3、输入测试数据A;4、计算 ...
                            
                            
                                分类:
编程语言   时间:
2017-06-16 12:44:54   
                                阅读次数:
236
                             
                    
                        
                            
                            
                                【python的基本数据类型及进制扫盲】 一、进制 1.进制简介 进制就是进位制,是人们规定的一种进位方法。计算机底层的数据运算和存储都是二进制数据。计算机语言就是二进制,计算机能直接识别二进制数据,其它数据都不能直接识别。 2.常用进制 对于任何一种进制 X进制,就表示某一位置上的数运算时是逢X进 ...
                            
                            
                                分类:
编程语言   时间:
2017-06-02 23:54:24   
                                阅读次数:
382
                             
                    
                        
                            
                            
                                本题就是要往墙上贴海报,问最后有多少可见的海报。 事实上本题的难点并非线段树,而是离散化。 由于数据非常大,直接按原始数据计算那么就会爆内存和时间的。 故此须要把数据离散化。 比方有海报1 6 7 9 20 100 5 1000的原始数据。直接计算须要1-1000的内存,离散化之后仅仅须要8内存,由 ...
                            
                            
                                分类:
其他好文   时间:
2017-05-31 20:49:25   
                                阅读次数:
176
                             
                    
                        
                            
                            
                                王峰,淘宝花名”莫问",2006年毕业后即加入阿里巴巴集团,长期从事搜索和大数据基础技术研发工作,目前在计算平台事业部,负责实时计算北京研发团队。 在阿里巴巴的11年工作期间,持续专注大数据计算与存储技术领域,基于Hadoop开源生态打造的数据基础设施一直服务于搜索、推荐等阿里核心电商业务场景,最近 ...
                            
                            
                                分类:
其他好文   时间:
2017-05-31 10:31:48   
                                阅读次数:
489
                             
                    
                        
                            
                            
                                摘要: 《大数据计算服务MaxCompute产品最新动态》,首先介绍了MaxCompute的发展历程和技术架构,然后对MaxCompute 2.0版本新特性和新技术进行了详细介绍。 《大数据计算服务MaxCompute产品最新动态》,首先介绍了MaxCompute的发展历程和技术架构,然后对MaxC ...
                            
                            
                                分类:
其他好文   时间:
2017-05-23 15:55:34   
                                阅读次数:
136
                             
                    
                        
                            
                            
                                在2017云栖大会·深圳峰会大数据专场,阿里云高级专家云郎分享了《大数据计算服务MaxCompute产品最新动态》。他首先介绍了MaxCompute的发展历程和技术架构,然后对MaxCompute 2.0版本新特性和新技术进行了详细介绍。最后,分享了基于MaxCompute平台构建完整大数据应用架构 ...
                            
                            
                                分类:
其他好文   时间:
2017-05-22 16:41:05   
                                阅读次数:
159
                             
                    
                        
                            
                            
                                    博主作为OpenGL新手,最近要用OpenGL进行并行的数据计算,突然发现这样的资料还是很少的,大部分资料和参考书都是讲用OpenGL进行渲染的。好不容易找到一本书《GPGPU编程技术,从OpenGL、CUDA到OpenCL》,里面对并行处理的发展进行了系统性的介绍,还是很不错的。小白博主很兴奋,看 ...
                            
                            
                                分类:
其他好文   时间:
2017-05-21 20:31:58   
                                阅读次数:
236
                             
                    
                        
                            
                            
                                    什么是数据库? 计算机处理和存储的一切信息都是数据。 计算机系统中一种用于存储数据的程序。 一种:计算机系统中有很多种能够存取数据的程序。 他们各有特长和长处,有自己的适用范围。 存取:能够保存数据避免丢失。 能够按照需求找到符合条件的数据。 为什么要使用数据库? 较大数据量,事务控制,网络访问,持 ...
                            
                            
                                分类:
数据库   时间:
2017-05-19 10:03:33   
                                阅读次数:
205
                             
                    
                        
                            
                            
                                编程语言的作用及与操作系统和硬件的关系 计算机硬件 CPU与寄存器,内核态与用户态的切换 CPU从内存中取指令,解码,执行。 中央处理器 (英语:Central Processing Unit,缩写:CPU),是计算机的主要设备之一,功能主要是解释计算机指令以及处理计算机软件中的数据。计算机的可编程 ...
                            
                            
                                分类:
其他好文   时间:
2017-05-18 20:10:52   
                                阅读次数:
235
                             
                    
                        
                            
                            
                                    Spark性能优化指南——高级篇 [TOC] 前言 继基础篇讲解了每个Spark开发人员都必须熟知的开发调优与资源调优之后,本文作为《Spark性能优化指南》的高级篇,将深入分析数据倾斜调优与shuffle调优,以解决更加棘手的性能问题。 数据倾斜调优 调优概述 有的时候,我们可能会遇到大数据计算中... ...
                            
                            
                                分类:
其他好文   时间:
2017-05-14 23:48:10   
                                阅读次数:
506