码迷,mamicode.com
首页 >  
搜索关键字:大数据; hadoop; yarn    ( 25974个结果
Spark SQL 及其 DataFrame 的基本操作
Spark SQL 及其 DataFrame 的基本操作 Q & A 1. Spark SQL 出现的原因是什么? 关系数据库已经流行多年,能较好的满足各类商业公司的业务数据管理需求,但关系数据库在大数据时代已经不能满足各种新增的用户需求。用户需要从不同数据源执行各种操作(包括结构化和非结构化数据) ...
分类:数据库   时间:2021-05-24 04:48:45    阅读次数:0
采用脚手架创建项目热更新设置
首先暴露项目配置文件 1. npm run eject2. yarn eject 观察package.json会多出一些babel包和其他一些包,删除node_modules,重新下载包。把项目跑起来。。。 找到config文件夹下的webpackDevServer.config.js文件。 设置为 ...
分类:其他好文   时间:2021-05-24 04:11:41    阅读次数:0
5/09/21 记vue-route基本用法
1. 安装 npm i vue-router yarn add vue-router 2. 定义 src/router/index.js import Vue from 'vue' import VueRouter from 'vue-router' import Home from '@/view ...
分类:其他好文   时间:2021-05-24 03:48:28    阅读次数:0
完美避坑!记一次Elasticsearch集群迁移架构实战
前言 Elastic自身设计了集群分片的负载平衡机制,当有新数据节点加入集群或者离开集群,集群会自动平衡分片的负载分布。 需求背景 公司原有大数据平台基于公有云构建,由于种种原因,现在需要迁移到自建机房,Elasticsearch集群承担了大数据平台主要的对外查询需求,也有部分实时计算需求基于Ela ...
分类:其他好文   时间:2021-05-24 03:46:38    阅读次数:0
在AWS Glue中使用Apache Hudi
1. Glue与Hudi简介 AWS Glue AWS Glue是Amazon Web Services(AWS)云平台推出的一款无服务器(Serverless)的大数据分析服务。对于不了解该产品的读者来说,可以用一句话概括其实质:Glue是一个无服务器的全托管的Spark运行环境,只需提供Spar ...
分类:Web程序   时间:2021-05-24 03:46:26    阅读次数:0
记一次部署Hadoop后遭受kthreaddi挖矿病毒
云服务器在部署Hadoop后便被黑了,查看进程发现了kthreaddi占满了CPU。 ...
分类:其他好文   时间:2021-05-24 01:55:01    阅读次数:0
could only be replicated to 0 nodes instead of minReplication (=1). There are 1 datanode(s) running and no node(s) are excluded in this operation.
hdfs dfsadmin -report hadoop fsck -locations ...
分类:其他好文   时间:2021-05-24 01:37:15    阅读次数:0
数栈人:从青铜到星耀,10年大数据人的奋战晋级之路
? 今天,大家就请跟着数栈君一起,和申杭聊聊他从青铜到星耀的大数据之路。 数栈君:申杭,你是07年从华中科技大学软件工程专业毕业的,能说说你当时为什么选择这个专业吗? 申杭:当时会计、师范、机械制造、土木类专业比较热门,一般家人都会让报这些专业,出来好就业。而电子、计算机、软件工程类的专业刚刚兴起, ...
分类:其他好文   时间:2021-05-24 00:46:57    阅读次数:0
RuntimeError: you must first build vocabulary before training the model
解决RuntimeError: you must first build vocabulary before training the model错误 查找解决方案,意思就是说你的数据集中的数量过少,解决方案有两种,扩大数据集的数量、另一个就是更改min_count的值例如:如果太少的话可以更改为 ...
分类:其他好文   时间:2021-05-23 23:49:16    阅读次数:0
yarn
yarn和npm都是包管理工具,yarn比npm好用 特点 速度快、离线模式 离线模式:之前安装过的包会被保存进缓存目录,以后安装就直接从缓存中复制过来 不会出现npm可能出现的问题 npm把依赖安装到node_modules目录的过程具有不确定性,而由于重复的依赖可以合并到一起,从而导致node_ ...
分类:其他好文   时间:2021-05-23 23:02:57    阅读次数:0
25974条   上一页 1 ... 8 9 10 11 12 ... 2598 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!