在我的超算集群里,有台服务器故障报修,主板坏了,更换主板后,无法识别网卡,用命令ifconfig -a 查看只显示lo loopback 127.0.0.1,以及eth7,eth8,eth9等没有网卡的信息,如此的话,导致服务器和集群别的节点服务器都无法ping通 原因和解决办法: 系统加载网卡驱动 ...
分类:
系统相关 时间:
2016-08-05 00:27:55
阅读次数:
423
背景 操作系统为了适应更多的硬件环境,许多初始的设置值,宽容度都很高。 如果不经调整,这些值可能无法适应HPC,或者硬件稍好些的环境。 无法发挥更好的硬件性能,甚至可能影响某些应用软件的使用,特别是数据库。 数据库关心的OS内核参数 512GB 内存为例 参数 支持系统 参数解释 推荐设置 参数 支 ...
分类:
数据库 时间:
2016-08-04 10:17:11
阅读次数:
253
大陆比台湾科技领先的多了去了:航天航空、天文观测、军工、造船、重工机械、基础设施工程、超算、高铁、大飞机、量子通信、深海探测、农业、粒子对撞、核能…民用的如彩电、冰箱、空调、手机…台湾哪一项能沾大陆的边,就算台芯片领先大陆,那能代表台湾领先大陆吗? 摩尔定律马上就要走向终点,最终停留在5nm制程工艺 ...
分类:
其他好文 时间:
2016-08-04 06:47:33
阅读次数:
295
一个Rocks6.1.1的汲取一直运行良好因故需要重装与一个节点.但是安装时候提示reposity无法访问.后来发现/export/rocks/install/rocks-dist/x86_64/repodata/下面是空的.即使是rockscreatedistro也没有改善
最后用虚拟机装了一台rocks6.1.1,然后把那个机器上/export/rocks/insta..
分类:
其他好文 时间:
2016-08-01 23:28:59
阅读次数:
214
假设服务器IP地址为192.168.1.1,机器名:cluster.hpc.org 客户端IP地址为172.16.16.1,机器名:p470-2.wangrx.sioc.ac.cn 客户端用户yzhao需要使用ssh无密码登录服务器的zhaoy帐户 实现原理 使用一种被称为"公私钥"认证的方式来进行 ...
分类:
系统相关 时间:
2016-07-25 07:04:32
阅读次数:
989
根据世界超级计算机TOP500排名,Linux不仅占据主导地位,同时它还有将其它对手挤出500强名单之势。在世界上500台最快的计算机里,强劲的开源操作系统Linux占了其中的485个位子,再创新高。换句话说,世界上最快的计算机里97%是基于Linux的。剩下的15台计算机里有13台运行Unix..
分类:
系统相关 时间:
2016-07-25 00:24:50
阅读次数:
252
根据世界超级计算机TOP500排名,Linux不仅占据主导地位,同时它还有将其它对手挤出500强名单之势。在世界上500台最快的计算机里,强劲的开源操作系统Linux占了其中的485个位子,再创新高。换句话说,世界上最快的计算机里97%是基于Linux的。剩下的15台计算机里有13台运行Unix..
分类:
系统相关 时间:
2016-07-25 00:24:33
阅读次数:
234
简介:超算的parastor存储通过NFS网络文件系统共享给用户使用,由于存储空间使用率过高,达到了90%以上,出现了一些问题 问题一:用户在用fluent软件调用存储的数据的时候,一直调用不了 问题二:用户CST软件计算完的作业在回传给mc主控节点的时候,也即是回传计算结果到存储目录的时候,一直在 ...
分类:
其他好文 时间:
2016-07-22 21:31:32
阅读次数:
147
超算上一些重要角色节点: node100 node101 (lsf作业调度系统节点,和PAC网站页面管理) node108 node105 (NIS服务主从节点) node166 (parastor并行存储 MGR节点) 备份策略:备份可以通过定时计划任务 /etc/crontab 来进行备份,备份 ...
分类:
其他好文 时间:
2016-07-19 20:28:01
阅读次数:
168
问题:CST的main controller 程序在大量程序仿真时会出现失去响应和崩溃 ssh到主控节点(比如节点名是mc06):ssh mc06 查看main controller进程状态:/etc/init.d/lsb-maincontroller2013 status 1提示Not runni ...
分类:
其他好文 时间:
2016-07-19 18:25:43
阅读次数:
179