码迷,mamicode.com
首页 > 其他好文 > 详细

基础知识

时间:2019-07-31 11:14:42      阅读:110      评论:0      收藏:0      [点我收藏+]

标签:通过   数据   知识   c++   spark   大数据集   大数   个人网站   perl   

1.数据存储:磁盘
(1)三种架构存储方式。SAN、NAS、DAS。
(2)分布式存储架构。
注:
1)SAN、NAS、DAS是共享存储架构。
2)分布式存储架构是一个集群(应用)。
3)分布式存储架构(HDFS),HDFS是用于存储数据的软件。

2.操作系统:Linux

3.
1.运维/大数据
大数据集群:
(1)分布式存储架构(HDFS)
(2)map-reduces的数据处理集群
注:
1)HDFS只是解决数据处理问题
2)map-reduces是将海量的数据按照一定的方式,修改为键值关系(key-value)
3)HDFS+map-reduces=Hadoop集群(运行于Linux上的一个高性能集群)
2.算法:
通过数学(统计学)+Python=算法。
3.数据可视化。

4.IT行业工作方向
(1)运维
1)Linux运维;包括web构架、搭建自己的个人网站方向
2)虚拟化KVM\XEN;包括openstack、docker(k$s)方向
3)Hadoop+java=大数据存储方向;包括spark学习(scala语言)、HDFS、map-reduces、Hive(SQL)、zookeeper
(2)开发---计算机语言
1)前端:JS、php、css、html、java
BASIC早期的机械语言
C语言 C++:系统开发、驱动开发、嵌入式开发(写板子)
(驱动程序:需要转换各个厂家设备之间的指令集,让厂家设备之前互通)
2)开发工具:脚本语言;shell、perl、python
3)数据库:MySQL、nosql

基础知识

标签:通过   数据   知识   c++   spark   大数据集   大数   个人网站   perl   

原文地址:https://blog.51cto.com/14475758/2424960

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!