码迷,mamicode.com
首页 >  
搜索关键字:r语言 数据处理 数据挖掘 数据可视化    ( 8390个结果
携程结合用户画像
用户画像作为“大数据”的核心组成部分,在众多互联网公司中一直有其独特的地位。作为国内旅游OTA的领头羊,携程也有着完善的用户画像平台体系。目前用户画像广泛用于个性化推荐,猜你喜欢等;针对旅游市场,携程更将其应用于“房型排序”“机票排序”“客服投诉”等诸多特色领域。 本文将从目的,架构、组成等几方面, ...
分类:其他好文   时间:2020-05-31 15:57:07    阅读次数:147
二分类问题
二分类问题 首先进行数据处理: 将读入的数据转成向量,将整数序列编码为二维矩阵 def v(sequences, dimension=10000): results = np.zeros((len(sequences), dimension)) for i, sequence in enumerat ...
分类:其他好文   时间:2020-05-31 10:48:04    阅读次数:75
分布式系统及CAP理论
一、集中式系统 在学习分布式之前,先了解一下与之相对应的集中式系统是什么样的。 集中式系统用一句话概括就是:一个主机带多个终端。终端没有数据处理能力,仅负责数据的录入和输出。而运算、存储等全部在主机上进行。现在的银行系统,大部分都是这种集中式的系统,此外,在大型企业、科研单位、军队、政府等也有分布。 ...
分类:其他好文   时间:2020-05-31 00:48:06    阅读次数:87
1、网络爬虫
网络爬虫(Web crawler),是一种按照一定的规则,自动的抓取万维网信息的程序或脚本。 1.1 爬虫入门程序 1.2网络爬虫介绍 大数据时代,信息的采集是一项重要的工作,而互联网的数据是海量的,如果单纯靠人力进行信息采集,不仅低效繁琐,搜集的成本也会提高。如何自动高效地获取互联网中我们感兴趣的 ...
分类:其他好文   时间:2020-05-30 21:50:07    阅读次数:123
hadoop 数据处理 总结
最近工作中用了了Hadoop,比如用Hadoop来处理广告的一些pv量数据、点击数据等,最后统计后给运营展示每个广告的数据报表 首先自己了解了一些关于Hadoop的概念知识 hadoop平台提供了分布式存储(hdfs),分布式计算(mapredduce),任务调度(YARN)、对象存储(Ozone) ...
分类:其他好文   时间:2020-05-30 20:22:33    阅读次数:94
服务器哪个品牌好?
服务器那个品牌号这是个好问题?最近小编新入手了一款云都网络的服务器。我这个人平时也不这么喜欢宽泛,但是我对电子产品这一方面是极为感兴趣的,因为平时也喜欢玩游戏,最近一直在玩王者荣耀这个游戏。因为一直是用原来的服务器,而这个服务器已经使用多年了,里面的硬件都老化了,玩游戏也已经出现了卡顿,玩的也有点力 ...
分类:其他好文   时间:2020-05-30 17:16:29    阅读次数:86
Machine Learnign 21 回归项目实例
定义问题 波士顿房价数据集收集于1978年,包括14个特征和506条数据(每条特征的中文解释暂时忽略)。 分析数据,发现输入的特征属性的度量单位是不统一的,也许需要对数据度量单位进行调整。 导入数据 首先导入项目中需要的类库。 1 #导入类库 2 import numpy as np 3 from ...
分类:系统相关   时间:2020-05-30 10:59:43    阅读次数:66
Echarts面试题
一.简述数据可视化技术 什么是数据可视化技术 借助图形化的数段,清晰有效的传递和沟通信息,以视觉的方式展现数据,便于用户的认知,偏于图表的样式,相对于文字说明更加直观 科学可视化(出现最早,最成熟) 处理科学数据,面向科学和工程数据方面,研究带有空间坐标和几何信息的三维空间,如何呈现数据中的几何特征 ...
分类:其他好文   时间:2020-05-30 10:42:50    阅读次数:514
NoSQL
NoSQL1SQL结构化的查询语言。SQL经常会用在我们的关系型数据库中(mysql/oracle/sqlserver/db2)。譬如我们之前使用的DDL/DML/DQL/DCL..2为什么要学习NOSQL非结构化的查询语言。NOSQL经常会用在我们的非关系型的数据中。谈一谈这个东西“互联网”。特点:多样化、数据量激增、实时变化、……………….在这样子的一种互联网的背景下,对于我们的软件来讲,它要
分类:数据库   时间:2020-05-30 09:16:21    阅读次数:85
爬虫毕设(六):数据可视化
pyecharts数据可视化 pyecharts是一个用于生成Echarts图表的类库。Echarts是百度开源的一个数据可视化JS库,主要用于数据可视化。实际是Echarts与Python的对接,使用pyecharts可以生成独立的网页。 pyechart可以做很多图表,毕业设计使用了三种简单的图 ...
分类:其他好文   时间:2020-05-30 01:21:40    阅读次数:68
8390条   上一页 1 ... 47 48 49 50 51 ... 839 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!