Numpy常用数据结构 1. 数组创建 In [ ]: # 导入库 import numpy as np In [ ]: arr1 = np.array([-9,7,4,3]) In [ ]: arr1 In [ ]: arr2 = np.array([-9,7,4,3],dtype =float) ...
                            
                            
                                分类:
其他好文   时间:
2020-02-04 22:08:05   
                                阅读次数:
110
                             
                         
                    
                        
                            
                            
                                flume agent 内部原理 1、Source采集数据,将数据封装成Event对象,然后将数据交给 Channel Processor (利用该类的方法进行下一步的处理) 2、 Channel Processor 将Event事件传递给拦截器链(Intercepter,进行简单的数据清洗),然后 ...
                            
                            
                                分类:
Web程序   时间:
2020-01-26 14:29:01   
                                阅读次数:
130
                             
                         
                    
                        
                            
                            
                                一、前言 上一节已经对这次的实战北京做了介绍,这一节主要介绍数据清洗。 唯一的就是,今天大年三十,祝大家新年快乐,来年事业、家庭都能如意!!! 二、实战-数据清洗 导入库 #导入库import pandas as pd import numpy as np import matplotlib.pyp ...
                            
                            
                                分类:
其他好文   时间:
2020-01-24 10:51:58   
                                阅读次数:
100
                             
                         
                    
                        
                            
                            
                                数据科学第三章 1.Panda 的数据结构 (1)引入panda包 part 1 (2)Series对象 part 2 13 187 14 190 7 185 2 178 9 185 dtype: int64 part 3 13 187 14 190 7 185 2 178 9 185 dtype: ...
                            
                            
                                分类:
其他好文   时间:
2020-01-15 13:58:11   
                                阅读次数:
91
                             
                         
                    
                        
                            
                            
                                课程介绍:此项目为GUI+爬虫+反反爬虫+网络多线程+自动打码+缓存机制+数据清洗等多项技术综合一体的项目;开发中更能体验抓包思路, MVC, 分层, 封装重构等思想课程目录:001、12306抢票软件项目-项目展示002、12306抢票项目开篇-2019新年快乐!003、抢票软件项目-项目需求和原 ...
                            
                            
                                分类:
编程语言   时间:
2020-01-14 23:31:49   
                                阅读次数:
209
                             
                         
                    
                        
                            
                            
                                    1,从数据处理到人工智能。 数据表示 ->数据清洗->数据统计->数据可视化->数据挖掘->人工智能 数据表示:采用合适方式用程序表达数据。 数据清理:数据归一化,数据转换,异常值处理。 数据统计:数据的概要理解,数量。分布。中位数等。 数据可视化:直观展示数据内涵的方式。 数据挖掘:从数据分析获得 ...
                            
                            
                                分类:
编程语言   时间:
2020-01-10 20:03:04   
                                阅读次数:
117
                             
                         
                    
                        
                            
                            
                                    一、 实训内容 能对基本的开发环境进行检验和错误排查,以及对新语言软件进行安装。 能使用Navicat for MySQL对MySQL数据库进行基本的连接测试,同时,在mysql中新建student数据库。能利用外部SQL脚本文件对数据库进行数据集的导入和初始化。 熟悉利用eclipse编程工具,新 ...
                            
                            
                                分类:
编程语言   时间:
2020-01-06 11:10:11   
                                阅读次数:
153
                             
                         
                    
                        
                            
                            
                                    美团 R 语言数据运营实战 2018年08月02日 作者: 喻灿 刘强 文章链接 3689字 8分钟阅读 一、引言 近年来,随着分布式数据处理技术的不断革新,Hive、Spark、Kylin、Impala、Presto 等工具不断推陈出新,对大数据集合的计算和存储成为现实,数据仓库/商业分析部门日益 ...
                            
                            
                                分类:
编程语言   时间:
2020-01-05 11:29:38   
                                阅读次数:
115
                             
                         
                    
                        
                            
                            
                                    一、Pandas基础 Pandas是基于NumPy的一套数据分析工具,该工具是为了解决数据分析任务而创建的,所以它至少有以下特点或用途: 基于NumPy,提供了矩阵运算 强大的分析结构化数据的工具集 提供数据清洗功能 (一)数据结构 1、Series 是带标签的一维数组,可存储整数、浮点数、字符串、 ...
                            
                            
                                分类:
其他好文   时间:
2020-01-04 20:32:49   
                                阅读次数:
87