1. 准备文本文件从文件创建RDD lines=sc.textFile()筛选出含某个单词的行 lines.filter()lambda 参数:条件表达式 2. 生成单词的列表从列表创建RDD words=sc.parallelize()筛选出长度大于2 的单词 words.filter() ...
分类:
其他好文 时间:
2021-03-29 12:04:28
阅读次数:
0
1.$route 与 $router 区别 router 为 VueRouter 的实例,相当于一个全局的路由器对象,里面含有汗多属性和子对象,例如 history 对象,经常用的跳转链接就可以用this.$router.push()和router-link跳转一样,它是一个路由对象,可以方便的使用 ...
分类:
其他好文 时间:
2021-03-29 11:36:38
阅读次数:
0
react-router: 它通过管理 URL,实现组件的切换和状态的变化,开发复杂的应用几乎肯定会用到。 用法:子路由也可以不写在Router组件里面,单独传入Router组件的routes属性。 组件有一个参数history,它的值hashHistory表示,路由的切换由URL的hash变化决定 ...
分类:
其他好文 时间:
2021-03-17 14:02:24
阅读次数:
0
react-router:实现了路由的核心功能 react-router-dom:基于react-router,加入了在浏览器运行环境下的一些功能。例如Link组件,会渲染一个a标签。 路由模式分为:BrowserRouter(history)(不带#号),和HashRouter(带#号)。前者使用 ...
分类:
其他好文 时间:
2021-03-16 13:37:37
阅读次数:
0
1、为什么要引入Yarn和Spark。 (1)现有的hadoop生态系统中存在的问题 1)使用mapreduce进行批量离线分析; 2)使用hive进行历史数据的分析; 3)使用hbase进行实时数据的查询; 4)使用storm进行实时的流处理; (2)选用spark的原因 1) 应用于流式计算的S ...
分类:
其他好文 时间:
2021-03-16 13:32:12
阅读次数:
0
hash模式:路由地址带#号,适合做后台管理系统。 history模式:路由地址不带#号,适合做前端宣传页面,但是history模式有个问题就是:刷新页面会出现404错误,解决方法需要配置服务器。 一、如果是Apache服务器 (如何下载安装Apache服务器,并且设置工作目录) 把项目的dist文 ...
分类:
其他好文 时间:
2021-03-16 13:31:37
阅读次数:
0
1. 阐述Hadoop生态系统中,HDFS, MapReduce, Yarn, Hbase及Spark的相互关系,为什么要引入Yarn和Spark。 HDFS是Hadoop体系中数据存储管理的基础,它是一个高度容错的系统,能检测和应对硬件故障,在低成本的通用硬件上运行。 HBase构建在HDFS之上 ...
分类:
其他好文 时间:
2021-03-16 13:21:18
阅读次数:
0
数据应用,是真正体现数仓价值的部分,包括且又不局限于 数据可视化、BI、OLAP、即席查询,实时大屏,用户画像,推荐系统,数据分析,数据挖掘,人脸识别,风控反欺诈,ABtest等等 OLAP(On-Line Analytical Processing):在线分析处理,主要用于支持企业决策管理分析。 ...
分类:
其他好文 时间:
2021-03-16 11:54:33
阅读次数:
0
1. 为什么要引入Yarn和Spark。 从开源角度看,YARN的提出,从一定程度上弱化了多计算框架的优劣之争。YARN是在Hadoop MapReduce基础上演化而来的,在MapReduce时代,很多人批评MapReduce不适合迭代计算和流失计算,于是出现了Spark和Storm等计算框架,而 ...
分类:
其他好文 时间:
2021-03-15 11:29:44
阅读次数:
0
新增了五个教程: Python 和 Jupyter 机器学习入门 零、前言 一、Jupyter 基础知识 二、数据清理和高级机器学习 三、Web 爬取和交互式可视化 Python 数据科学和机器学习实践指南 零、前言 一、入门 二、统计和概率回顾和 Python 实践 三、Matplotlib 和高 ...
分类:
Web程序 时间:
2021-03-15 11:11:19
阅读次数:
0