文档库 最新最全的文档下载
当前位置:文档库 › 曙光天演EP440-G用户手册V1.0

曙光天演EP440-G用户手册V1.0

曙光天演EP440-G用户手册V1.0
曙光天演EP440-G用户手册V1.0

曙光作业管理-调度系统安装配置手册

Torque + Maui配置手册之抛砖引玉篇 本文将以应用于实际案例(南航理学院、复旦大学物理系、宁波气象局)中的作业调度系统为例,简单介绍一下免费开源又好用的Torque+Maui如何在曙光服务器上进行安装和配置,以及针对用户特定需求的常用调度策略的设定情况,以便可以起到抛砖引玉的作用,使更多的人关注MAUI这个功能强大的集群调度器(后期将推出SGE+MAUI版本)。本文中的涉及的软件版本Torque 版本:2.1.7 maui版本:3.2.6p17。 1. 集群资源管理器Torque 1.1.从源代码安装Torque 其中pbs_server安装在node33上,TORQUE有两个主要的可执行文件,一个是主节点上的pbs_server,一个是计算节点上的pbs_mom,机群中每一个计算节点(node1~node16)都有一个pbs_mom负责与pbs_server通信,告诉pbs_server该节点上的可用资源数以及作业的状态。机群的NFS共享存储位置为/home,所有用户目录都在该目录下。 1.1.1.解压源文件包 在共享目录下解压缩torque # tar -zxf torque-2.1.17.tar.gz 假设解压的文件夹名字为: /home/dawning/torque-2.1.7 1.1. 2.编译设置 #./configure --enable-docs --with-scp --enable-syslog 其中, 默认情况下,TORQUE将可执行文件安装在/usr/local/bin和/usr/local/sbin下。其余的配置文件将安装在/var/spool/torque下 默认情况下,TORQUE不安装管理员手册,这里指定要安装。 默认情况下,TORQUE使用rcp来copy数据文件,官方强烈推荐使用scp,所以这里设定--with-scp. 默认情况下,TORQUE不允许使用syslog,我们这里使用syslog。 1.1.3.编译安装 # make # make install Server端安装设置: 在torque的安装源文件根目录中,执行 #./torque.setup root 以root作为torque的管理员账号创建作业队列。 计算节点(Client端)的安装: 由于计算节点节点系统相同,因而可以用如下SHELL script (脚本名字为torque.install.sh)在

高可用性集群系统的实现

高可用性集群系统的实现 《Linux企业应用案例精解》第8章主要介绍一下虚拟化技术应用。本节为大家介绍高可用性集群系统的实现。 8.3.5 高可用性集群系统的实现(1) VMware Infrastructure 的体系结构和典型配置 资源动态分配和高可用性的实现为构建高可用性集群系统提供了有力的保障,采用VMwae构建铁路企业高可用性集群,不需要为系统中的每台服务器分别添置备用服务器,就可以有效地降低系统成本,在基于VMware的我企业高可用性集群中,备用服务器安装了VMware ESX Server,与数据库服务器、Web服务器、OA服务器和文件服务器等构成高可用性集群,同时采用数据库备份服务器实现差额计划备份。 使用VMware提供的虚拟基础架构解决方案,服务器不再需要随着业务增加而添加,整个IT基础架构能得到有效控制并可充分发挥效能。只有当整体资源出现不足的时候,才需要增加服务器。而且对系统资源的

添加也非常简单,不再需要做繁琐的硬件维护以及业务迁移,只需要简单地将新服务器安装VMWARE? INFRASTRUCTURE 3软件,并添加到已有的VMWARE? INFRASTRUCTURE 3架构中即可,新增资源将自动分配到各个最需要的业务环境中。 在HA和DRS功能的共同支撑下,虚拟机的稳定、不间断运行得到了保证,而且,在没有搭建Cluster环境的情况下,迁移、升级依旧能不中断服务。哪怕是硬件升级、添加,正常停机维护等情况,也能够保证所有的业务正常运行,客户端访问服务器不产生业务中断现象。新的服务器虚拟化架构中另一个重点是VMware HA 的部署,它是整个服务器系统安全、可靠运行的一道防线。传统的热备机方式最大的问题就是容易造成资源的大量闲置;在正常运行状态下,所有备机服务器都处于闲置状态,不仅造成计算资源的空耗,而且还浪费大量的电力和散热资源,投资回报率非常低。 如何应对Linux系统软件包的依赖性问题 不管是初步跨入Linux殿堂的新手还是,具有多年经验的专家,在安装或编译软件包的过程中或多或少的都会遇到包的依赖问题从而导致安装过程无法继续,比如管理员在安装php软件包需要libgd.so文件,而这个文件属于gb软件包。但是在安装gb软件包时,可能这个软件包跟其他软件包又具有依赖关系,又需要安装其他软件包才行。这时有的管理员便失去耐心。在遇到这种Linux软件包依赖关系问题,该如何解决呢?在谈这个具体的措施之前,先跟大家聊聊Linux系统里的软件爱你依赖性问题。 我们把处理rpm依赖性故障的策略可以分成两类解决依赖性故障的自动方法和手工方法。但当安装不属于发行一部分的软件包时自动方法是不可用的。在描述如何手工解决依赖性故障后,将简要描述如何使用自动方法之一(YUM),但首先需要了解它们是什么及rpm如何强制实施它们。 一、什么是依赖性 程序依赖于程序代码的共享库,以便它们可以发出系统调用将输出发送到设备或打开文件等(共享库存在于许多方面,而不只局限于系统调用)。没有共享库,每次程序员开发一个新的程序,每个程序员都需要从头开始重写这些基本的系统操作。当编译程序时,程序员将他的代码链接到这些库。如果链接是静态的,编译后的共享库对象代码就添加到程序执行文件中;如果是动态的,编译后的共享库对象代码只在运行时需要它时由程序员加载。动态可执行文件依赖于正确的共享库或共享对象来进行操作。RPM依赖性尝试在安装时强制实施动态可执行文件的共享对象需求,以便在以后--当程序运行时--不会有与动态链接过程有关的任何问题。

浪潮WIN2K 集群服务解决方案

浪潮WIN2K 集群服务解决方案 集群服务的需求分析 随着Internet服务和电子商务的迅速发展,计算机系统的重要性也日益上升,对服务器可伸缩性和高可用性的要求也变得越来越高。集群技术的出现和发展则很好地解决了这两个问题。群集是由一组独立的计算机组成,这些计算机一起工作以运行一系列共同的应用程序,同时,为用户和应用程序提供单一的系统映射。群集内的计算机物理上通过电缆连接,程序上则通过群集软件连接。这些连接允许计算机使用故障应急与负载平衡功能,而故障应急与负载平衡功能在单机上是不可能实现的。 有网络负载平衡功能的Windows 2000为在分布和负载平衡的方式下建立关键且合乎要求的网站的工作提供了完整的基础结构。与组件服务的分布式应用程序特性和Internet 信息服务的增强可伸缩性相结合,网络负载平衡有助于确保服务能够灵活处理最重的通信负荷,同时,保持对服务器状态的监控,确保系统不停机。 Win2000群集技术具有以下特点: ·可伸缩性:加入更多的处理器或计算机可提高群集的计算能力,一般的桌面机每秒能够处理几千个请求,而传统的IA服务器每秒能够处理几万个请求。那么对于需要每秒处理几十万个请求的企业来说,如果不采用集群技术,唯一的选择就是购买更加高档的中、小型计算机。如果这样做,虽然系统性能提高了十倍,但其购买价格和维护费用就会上升几十倍甚至更多。 ·高度的可用性:群集具有避免单点故障发生的能力。应用程序能够跨计算机进行分配,以实现并行运算与故障恢复,并提供更高的可用性。即便某一台服务器停止运行,一个由进程调用的故障应急程序会自动将该服务器的工作负荷转移至另一台服务器,以保证提供持续不断的服务。 ·易管理性:群集以单一系统映射的形式来面向最终用户、应用程序及网络,同时,也为管理员提供单一的控制点,而这种单一控制点则可能是远程的。 随着计算机应用地位的逐渐提升,系统安全和重要性的日益增加,基于Win2000的负载均衡必将会有着极为广阔的应用前景。 Win2K集群技术 一、集群

曙光集群用户使用手册

1. 登录和文件传输 登录方式为ssh,与telnet功能类似,推荐的登录工具为putty或者Secure Shell (https://www.wendangku.net/doc/732992751.html,/html/download/ser/20070917/35112.html,绿色版无需安装) 在地址栏输入本集群的登录地址(node1对应的局域网IP),点击“打开”,就会出现登录窗口,输入用户名、密码即可。 文件传输为sftp,与传统ftp类似,但其协议更安全可靠,推荐工具为filezilla。 (https://https://www.wendangku.net/doc/732992751.html,/p/filezilla/download?filename=FileZilla_3.3.2_win32.zip,绿色版无需安装)

输入登录地址222.222.21.29,输入用户名和密码,端口填22(本软件支持ftp,端口为21),点击快速连接,即可使用,操作办法与常用ftp工具类似。

2. 图形窗口支持 Linux推荐使用vnc。vnc可以将用户的操作状态保持在服务器端,即使断开连接也不会影响到正在进行的操作、计算等。 登录到linux服务器中,在命令行运行vncserver。第一次运行时需要输入VNC登陆用的密码: 根据提示输入新的vnc密码。此密码与用户登录密码无关,将在登录vnc时需要。 此处提示的node1:2即为vnc成功打开的端口。 运行vncclient,输入登录服务器地址和端口号,点确定,输入前面设置的密码,即进入了图形窗口。

注意: 1、在第一次启动了vncserver之后,vnc的连接一直可用,全部图形窗口保持在Linux 服务器上。因此,只在每次服务器重新启动后运行一次vncserver即可,由于用户较多,请勿启动多个。 2、如果需要使用node2的图形界面,可执行ssh -X node2。 3. 作业提交 3.1. Fluent 3.1.1. 图形方式运行 首先通过VNC登陆到图形界面,如果没有Terminal的话在桌面点击左键选择Xterm,输入以下命令即可运行:

高可用性集群解决方案设计HA

1.业务连续 1.1.共享存储集群 业务系统运营时,服务器、网络、应用等故障将导致业务系统无常对外提供业务,造成业务中断,将会给企业带来无法估量的损失。针对业务系统面临的运营风险,Rose提供了基于共享存储的高可用解决方案,当服务器、网络、应用发生故障时,Rose可以自动快速将业务系统切换到集群备机运行,保证整个业务系统的对外正常服务,为业务系统提供7x24连续运营的强大保障。 1.1.1.适用场景 基于共享磁盘阵列的高可用集群,以保障业务系统连续运营 硬件结构:2台主机、1台磁盘阵列

主机 备机心跳 磁盘阵列 局域网 1.1. 2.案例分析 某证券公司案例 客户需求分析 某证券公司在全国100多个城市和地区共设有40多个分公司、100多个营业部。经营围涵盖:证券经纪,证券投资咨询,与证券交易、证券投资活动有关的财务顾问,证券承销与保荐,证券自营,证券资产管理,融资融券,证券投资基金代销,金融产品代销,为期货公司提供中间介绍业务,证券投资基金托管,股票期权做市。 该证券公司的系统承担着企业的部沟通、关键信息的传达等重要角色,随着企业的业务发展,系统的压力越来越重。由于服务器为单机运行,如果发生意外宕机,将会给企业的日常工作带来不便,甚至

给企业带来重大损失。因此,急需对服务器实现高可用保护,保障服务器的7×24小时连续运营。 解决方案 经过实际的需求调研,结合客户实际应用环境,推荐采用共享存储的热备集群方案。部署热备集群前的单机环境:业务系统,后台数据库为MySQL,操作系统为RedHat6,数据存储于磁盘阵列。 在单机单柜的基础上,增加1台备用主机,即可构建基于共享存储的热备集群。增加1台物理服务器作为服务器的备机,并在备机部署系统,通过Rose共享存储热备集群产品,实现对应用的高可用保护。如主机上运行的系统出现异常故障导致宕机,比如应用服务异常、硬件设备故障,Rose将实时监测该故障,并自动将系统切换至备用主机,以保障系统的连续运营。

曙光IPMI系统管理平台用户使用指南

曙光I P M I系统管理平台 用户使用指南 目录

概述 IPMI是智能型平台管理接口(Intelligent Platform Management Interface)的缩写,它是管理企业级服务器系统中所使用的采用的一种工业标准。它为服务器的监控提供了一种智能的管理方式,用户可以利用IPMI监视服务器的物理健康特征,如温度、电压、风扇工作状态、电源状态等。它能够不依赖操作系统独立运行,即使系统本身的运作不正常,或是由于任何原因而无法提供服务,IPMI仍可正常运作。它适用于Windows、Linux、Solaris或其它混合型操作系统。 ?智能平台管理接口(IPMI) 智能平台管理接口(IPMI)定义了一系列的统一的基于接口的信息,这些信息包括监视器系统硬件健康(风扇速度、温度、电压、电力供应等等)、控制系统组件、和用于以后测试用的关于重要系统事件存储的数据。IPMI提供了远程平台管理功能。 ?基板管理控制器(BMC) 在IPMI 中关键的组成部件是基板管理控制器(BMC),BMC 芯片集成于服务器的主板上。BMC 在IPMI 架构中负责监视和控制系统的可管理设备。BMC 通过智能平台管理总线(IPMB)连接着许多传感器。一个子集有12C 总线。系统软件与BMC 之间的通信用一个keyboard controller style(KCS) 接口。 BMC 具有以下功能: 1.通过系统的串行端口进行访问 2. 故障日志记录和 SNMP 警报发送 3.访问系统事件日志 (System Event Log ,SEL) 和传感器状况 4.控制包括开机和关机 5.独立于系统电源或工作状态的支持

浪潮报表使用规范概述

浪潮报表使用规范 一、 报表使用操作流程 二、操作讲明 系统治理接收报表格式 报表格式、公 进行报表数据 定制、维护报 报表数据计算 报表数据审核 帐表数据核对 一般操作集团报表 报表格式定制 发送报表格式

A 集团报表 集团报表统一由集团系统治理员定制(定制报表方法与GS3.5软件系统相同),定制完成后转出报表格式,发送下级单位接收即可。 B 系统治理员 B-1 转入报表格式: 将集团下发的报表格式公式执行“转入”操作。内容包括格式、计算公式、校验公式、报表类不、标准编码信息。 功能位置 进入报表模块,选择【报表操作】菜单下的【报表转入】功能。 操作步骤 进入该功能后,显示窗口如图所示。

选择【选择文件】按钮,系统弹出如下图所示对话框。 选择差不多存在的转出文件即可。现在,系统显示如图所示。

选择要转入的报表名称,也能够选择【全选】,转入内容,点击【转入】完成对报表的更新操作。 B-2 报表格式、公式爱护: 【报表启封封存功能】提供了对报表格式和公式的爱护。通常情况,多个操作员对相同的报表会有各种操作权限,可能刚刚定义好的报表会被其他不了解情况的操作员改变。报表封存功能确实是针对那个问题提出来的,它能在灵活使用报表定义功能的同时,有效保证报表格式和公式的安全性和正确性。 功能位置 进入报表模块,选择【报表操作】菜单下的【报表启封封存】功能。 操作步骤 进入该功能后,系统显示界面如图所示。

项目讲明: 【格式封存】:有不爱护、低级爱护、中级爱护、高级爱护四个选项。 其含义如下: ①不爱护:没有限制; ②低级爱护:禁止用户修改格式区、数据区、行数、列数、标题行数、表头行数、表体行数,插入行列、删除行列; ③中级爱护:除差不多爱护信息不同意修改外,另:标题的内容、副标题的内容、表头内容、格式的内容、合并单元格、小数位数、数据类不、是否爱护,单元格对应的指标代码、设置行对应标准类不、列对应标准类不不同意修改; ④高级爱护:除中级爱护的内容不同意修改之外,另:行高、列

曙光负载均衡系统用户手册

负载均衡产品用户手册

声明 本手册的用途在于帮助您正确地使用曙光公司产品(以下称“本产品”),在安装和第一次使用本产品前,请您务必先仔细阅读随机配送的所有资料,特别是本手册中所提及的注意事项。这会有助于您更好和安全地使用本产品。请妥善保管本手册,以便日后参阅 本手册的描述幵不代表对本产品觃栺和软、硬件配置的仸何说明。有关本产品的实际觃栺和配置,请查阅相关协议、装箱单、产品觃栺配置描述文件,或向产品的销售商咨询。 如您不正确地或未按本手册的指示和要求安装、使用或保管本产品,或让非曙光公司授权的技术人员修理、变更本产品,曙光公司将不对由此导致的损害承担仸何责仸。 本手册中所提供照片、图形、图表和揑图,仅用于解释和说明目的,可能与实际产品有些差别,另外,产品实际觃栺和配置可能会根据需要不时变更,因此与本手册内容有所不同。请以实际产品为准。 本手册中所提及的非曙光公司网站信息,是为了方便起见而提供,此类网站中的信息不是曙光公司产品资料的一部分,也不是曙光公司服务的一部分,曙光公司对这些网站及信息的准确性和可用性不做仸何保证。使用此类网站带来的风险将由您自行承担。 本手册不用于表明曙光公司对其产品和服务做了仸何保证,无论是明示的还是默示的,包括(但不限于)本手册中推荐使用产品的适用性、安全性、适销性和适合某特定用途的保证。对本产品及相关服务的保证和保修承诺,应按可适用的协议或产品标准保修服务条款和条件执行。在法律法觃的最大允许范围内,曙光公司对于您的使用或不能使用本产品而収生的仸何损害(包括,但不限于直接或间接的个人损害、商业利润的损失、业务中断、商业信息的遗失或仸何其他损失),不负仸何赔偿责仸。 对于您在本产品乊外使用本产品随机提供的软件,或在本产品上使用非随机软件或经曙光认证推荐使用的专用软件乊外的其他软件,曙光公司对其可靠性不做仸何保证。 曙光公司已经对本手册迚行了仔细的校勘和核对,但不能保证本手册完全没有仸何错误和疏漏。为更好地提供服务,曙光公司可能会对本手册中描述的产品乊软件和硬件及本手册的内容随时迚行改迚和/或修改,恕不另行通知。如果您在使用过程中収现本产品的实际情冴与本手册有不一致乊处,或您想得到最新的信息或有仸何问题和想法,欢迎致电我们或登陆曙光公司服务网站垂询。

曙光Gridview2.0安装维护手册2.0

Gridview2.0 安装维护手册

Gridview2.0安装维护手册 目录 1、系统安装 0 1-1、安装条件 0 1-2、 GRIDVIEW2.0安装前设置 0 1-3、 GRIDVIEW2.0安装 (5) 1-3- -1、管理节点安装 (5) 1-3- -2、计算节点安装 (7) 1-4、安装后的验证 (8) 1-4- -1、管理节点验证 (8) 1-4- -2、计算节点验证 (9) 2、系统卸载 (10) 2-1、管理节点卸载 (10) 2-1- -1、卸载步骤—计算中心版 (10) 2-1- -2、卸载步骤—数据中心版............................ 错误!未定义书签。 2-2、计算节点卸载 (10) 2-2- -1、批量卸载—计算中心版............................ 错误!未定义书签。 2-2- -2、手动卸载—计算中心版............................ 错误!未定义书签。 2-2- -3、批量卸载—数据中心版............................ 错误!未定义书签。 2-2- -4、手动卸载—数据中心版............................ 错误!未定义书签。 3、系统维护 (11) 3-1、配置文件 (11) 3-1- -1、安装配置文件 (11) 3-1- -2、 PORTAL相关配置文件 (12) 3-1- -3、告警预处理相关配置文件 (12) 3-1- -4、 LOG配置文件 (13) 3-1- -5、采集相关配置文件 (13) 3-1- -6、 HIBERNATE配置文件 (16) 3-1- -7、作业调度管理进程配置文件 (18) 3-2、设备信息导入及参数设置 (19) 3-2- -1、设备信息导入 (20) 3-2- -2、采集参数设置 (22) 3-2- -3、告警参数设置 (22) 3-2- -4、设备使用配置 (23) 3-3、运行状态检查 (24) 3-3- -1、采集器运行状态检查 (24) 3-3- -2、告警预处理服务运行状态检查 (25) 3-3- -3、 TOMCAT服务运行状态检查 (25) 3-3- -4、作业调度管理进程状态检查 (25) 3-4、故障处理 (25) 3-4- -1、网络故障 (25) 3-4- -2、应用程序故障 (25) 3-5、系统日志 (26) 3-5- -1、采集系统日志 (27) 3-5- -2、告警预处理系统日志 (28)

计算机集群技术的解释

【赛迪网独家特稿】集群技术是使用特定的连接方式,将相对于超级计算机便宜许多的计算机设备结合起来,提供与超级计算机性能相当的并行处理技术。早在七十年代就有人提出可以使用这种集群技术完成并行处理,但是由于受到当时网络交换技术的限制,集群系统在性能上与其他并行处理系统相距甚远,直到网络技术逐渐成熟的今天,它才具备了与超级计算机相匹敌的能力。 什么是集群 集群(Cluster)技术是指一组相互独立的计算机,利用高速通信网络组成一个计算机系统,每个群集节点(即集群中的每台计算机)都是运行其自己进程的一个独立服务器。这些进程可以彼此通信,对网络客户机来说就像是形成了一个单一系统,协同起来向用户提供应用程序、系统资源和数据,并以单一系统的模式加以管理。一个客户端(Client)与集群相互作用时,集群像是一个独立的服务器。 计算机集群技术的出发点是为了提供更高的可用性、可管理性、可伸缩性的计算机系统。一个集群包含多台拥有共享数据存储空间的服务器,各服务器通过内部局域网相互通信。当一个节点发生故障时,它所运行的应用程序将由其他节点自动接管。在大多数模式下,集群中所有的节点拥有一个共同的名称,集群内的任一节点上运行的服务都可被所有的网络客户所使用。 集群的特点 1.提供强大处理能力的高性能计算机系统:计算机集群可以通过负载均衡、并行处理、时间片处理等多种形式,将多台计算机形成高性能计算机集群。对用户端(Client)而言,计算机集群则是一个单一的系统,可以为用户提供高性能的计算机系统,而用户不用关心有多少计算机承担了系统实现的任务,而只需要关注系统的整体处理能力。因此,计算机集群可以用多台普通性能的计算机组成具有高性能的计算机系统,承担只有超级计算机才能胜任的工作。 2.提供高可用性的计算机系统:通过计算机集群技术组成的系统,可以确保数据和应用程序对最终用户的高可用性,而不管故障属于什么类型。即当计算机集群中的节点计算机出现软硬件故障的时候,高可用性集群提供了对软件和硬件失败后的接替。它将服务器镜像到备用系统或节点中,当主节点上的系统崩溃时,冗余节点就从替补角色转换到正式角色,并自动投入应用,从而保证了系统运行的不间断。

曙光IPMI系统管理平台用户使用指南

曙光IPMI系统管理平台 用户使用指南 目录 概述 IPMI是智能型平台管理接口(IntelligentPlatformManagementInterface)的缩写,它是管理企业级服务器系统中所使用的采用的一种工业标准。它为服务器的监控提供了一种智能的管理方式,用户可以利用IPMI监视服务器的物理健康特征,如温度、电压、风扇工作状态、电源状态等。它能够不依赖操作系统独立运行,即使系统本身的运作不正常,或是由于任何原因而无法提供服务,IPMI 仍可正常运作。它适用于Windows、Linux、Solaris或其它混合型操作系统。智能平台管理接口(IPMI) 智能平台管理接口(IPMI)定义了一系列的统一的基于接口的信息,这些信息包括监视器系统硬件健康(风扇速度、温度、电压、电力供应等等)、控制系统组件、和用于以后测试用的关于重要系统事件存储的数据。IPMI提供了远程平台管理功能。 基板管理控制器(BMC) 在IPMI中关键的组成部件是基板管理控制器(BMC),BMC芯片集成于服务器的主板上。BMC在IPMI架构中负责监视和控制系统的可管理设备。BMC通过智能平台管理总线(IPMB)连接着许多传感器。一个子集有12C总线。系统软件与BMC之间的通信用一个keyboardcontrollerstyle(KCS)接口。 BMC具有以下功能: 1.通过系统的串行端口进行访问 2.故障日志记录和SNMP警报发送 3.访问系统事件日志(SystemEventLog,SEL)和传感器状况

4.控制包括开机和关机 5.独立于系统电源或工作状态的支持 6.用于系统设置、基于文本和操作系统控制台的文本控制台重定向 IPMI的相关配置 获取/配置IP地址等信息 IPMI必须配置IP址、子网掩码、网关等信息后才能进行远程管理,配置的方式有以下几种: 在BIOS下进行配置 在启动时按del键(有些为F2键)进入BIOS界面。 选择“Advanced”-“IPMIConfiguration”-“SetLANConfiguration”对IP、掩码、网关和MAC进行设置。IP的分配方式可以选择静态“static”或动态分配“dhcp”。注:各种BIOS界面可能会稍有区别,大同小异。以下为另一种界面: 设置完毕后按F10保存退出。 用DOS工具进行获取/配置 用IPMICFG软件获取。可用IPMICFG在DOS命令行下获取、配置IP等信息。 在windows操作系统下配置 在windows系统下,可以使用工具直接对ipmi地址进行配置 1)通过以下命令查看IPMI设备通道信息 Ipmitool–imsLanprint0查看0通道信息。 Ipmitool–imsLanprint1查看1通道信息。 该命令会列出IPMI的配置信息,包括IP,子网掩码,MAC地址等 一般情况下,IPMI在0或1通道。上示图例中,IPMI设备在1通道。 注:–imsLanprint将列出所有通道的信息。出现上图所示信息,则表明设备支持IPMI。 2)配置IP获取方式为静态方式 –Imslanset1ipsrcstatic 注:该命令行中“1”为通道号,请根据实际情况修改。下同。 3)配置IP地址 –I 4)配置子网掩码 –I 5)配置网关 –I 6)查看配置是否生效

Linux高可用集群系统的结构和原理分析

收稿日期:2007-09-15 第一作者简介:左 婷(1979-),女,吉林省四平市人,现为吉林师范大学信息网络中心研究实习员. 2007年11月 吉林师范大学学报(自然科学版) .4第4期Journal of Jilin Normal University(Natural Science Edition)Nov.2007 Linux 高可用集群系统的结构和原理分析 左 婷1,吴会军2 (1.吉林师范大学信息网络中心,吉林四平136000;2.吉林省水文水资源局,吉林长春130000) 摘 要:通过对目前常用Linux 平台上高可用集群系统的软、 硬件基本结构和工作原理的分析与研究,构建容易扩展、高可用、易维护和管理、高性价比的计算机系统. 关键词:L inux;高可用集群系统;结构;原理 中图分类号:T P393 文献标识码:A 文章编号:1000-1840-(2007)04-0115-02 目前,很多国际知名软件公司和计算机厂商都推出了 自己的集群产品,其中值得一提的是T he H igh A vailability L inux Project 的开放源代码Heartbeat,已经同商业集群软件 一样成熟,而且较后者应用更为灵活.本文将着重介绍SuSE L inux Enterpr i se Server 10平台上Heartbeat2.0.8组成结构 和工作原理.1 Linux 高可用集群系统的基本概念伴随着集群技术的发展,出现了一些关于集群系统的概念和术语.(1)集群资源和集群资源代理.在集群系统中,所有由集 群控制和管理,并将其以单一和统一的形式提供给客户端用 户使用的计算机资源称为集群资源,例如:一种服务、一个 IP 地址、一个磁盘驱动,甚至可以说:除了节点,其它任何软 硬件资源都可以成为集群资源.而集群资源代理是为了控制 和管理某一集群资源而编写的代理程序脚本,集群软件通过 特定集群资源代理来操控某一集群资源,Heartbeat 套件本 身已经包含了一些常用资源代理,开发人员也可以自己按照 一定的规范编写;(2)指定协调者(也称主节点).主节点除了 具有其它一般节点具有的集群节点基本功能外,还负责对整 个集群系统的状态进行监控、分析和转换,对集群系统下达 集群指令,协调各节点的操作等,实际上是整个集群系统的 大脑!,显然一般情况下,整个集群系统只有一个主节点,但 当某些特殊情况发生时,例如主节点不再是集群中的节点, 主节点将发生迁移,即位置发生了变化,另一个节点将代替 它成为主节点;(3)ST ON IT H.英文 Shoot T he Other Node In T he Head !的缩写,代表一种将错误操作的节点进行隔离 的技术,为了防止错误操作的节点对集群资源进行破坏性控 制和操作,使其不断重新启动或关机,从而使其无法取得对 集群资源的控制权;(4)裂脑和仲裁.在某种情况下,由于软 硬件失败导致各节点无法相互确定彼此的状态时,整个集群将被分裂为几个部分,每个部分都想取得对集群资源的控制权,以保证集群的高可用,这种对集群资源的竞争将严重破坏集群资源的完整性和一致性,甚至导致整个集群瘫痪、硬件被损坏的严重后果,这种情况称为裂脑.为了防止裂脑的发生,由仲裁协议决定哪个部分来取得对集群资源的控制 权,为了继续保证系统的高可用,一般将控制权交给节点数 超过原集群节点数一半的部分,同时将其它节点进行隔离; (5)单点故障(失败).单点故障是指由于系统中某一组件的 故障或运行失败从而导致整个集群系统瘫痪和应用服务完 全停止,因此,在高可用集群的构建中应尽量避免单点故障.2 Heartbeat 的主要进程Heartbeat 的所有集群功能都是由它的进程和它们之间相互通信来具体实现的.(1)集群资源管理器(CRM ,Cluster Resource M anager).CRM 是集群系统中最主要的管理进程,它负责对整个集群资源的管理和约束,包括资源的配置及相互间依赖关系,并决定资源运行的状态、位置和时间等.另外它还负责监控本地资源管理器完成这些工作,CRM 通过与系统的每一个组件通信来相互作用和协调操作,CRM 通过heartbeat 通讯模块进行节点间通讯,从CCM 接受当前集群的成员信息,指令ST O NI TH Daremon 如何工作,负责记录系统日志等;(2)策略引擎(PE,CR M Policy Eng ine).PE 是CRM 的一个组件,只能在主节点上运行.PE 的功能是根据当前集群的状态及集群资源的约束配置计算出集群的下一个状态,即为T E 生成将要执行的计划和策略;(3)执行引擎(T E,CRM T ransi tion Engine).T E 也是CRM 的一个组件,只能在主节点上运行.T E 的功能是按照P E 生成的集群状态变化计划和策略,指令集群节点上的LRM 对具体的集群资源进行操作;(4)?115?

4、浪潮gs管理软件日常操作手册

浪潮管理信息系统培训 学 习 资 料 中铁二十局集团有限公司2011年4月四川·乐山

目录 1 系统管理、基础设置 (6) 1.1 客户端配置要求: (6) 1.1.1 采用何种操作系统 (6) 1.1.2 IE浏览器 (6) 1.1.3 ACTIVEX控件的下载 (11) 1.2 软件登录前注意事项 (12) 2 初始化步骤、要点说明 (15) 2.1 用户与职责定义 (15) 2.1.1 系统登录 (15) 2.1.2 职责的定义 (16) 2.1.3 用户的定义 (16) 2.2 基础设置 (16) 2.2.1 部门定义 (16) 2.2.2 员工定义 (17) 2.2.3 往来单位定义 (17) 2.2.4 核算项目定义 (17) 2.2.5 科目定义 (17) 2.2.6 科目核算关系定义 (18) 2.2.7 余额初始 (18) 2.2.8 实时余额同步 (19)

2.2.10输出格式定义(凭证打印格式) 19 2.2.11系统设置 19 2.2.12会计期间维护 20 2.3 报表管理 (20) 2.3.1 新建报表 (20) 2.3.2 新建数据单元 (20) 2.3.3 报表与数据单元关联 (21) 2.3.4 报表格式升级 (22) 2.3.5 报表另存为excel格式 (22) 2.4 固定资产 (23) 2.4.1 卡片初始 (23) 2.4.2 资产增加 (23) 2.4.3 资产减少 (24) 2.4.4 资产变更 (24) 2.4.5 大修理记录 (25) 2.4.6 固定资产计提折旧 (25) 2.4.7 固定资产模块月结 (25) 2.5 工资 (26)

曙光DS800-G25磁盘阵列用户手册V1.1

DS800-G25 用户手册 DAWNING INFORMATION INDUSTRY CO.,LTD.

声明 本手册的用途在于帮助您正确地使用曙光公司服务器产品(以下称“本产品”),在安装和第一次使用本产品前,请您务必先仔细阅读随机配送的所有资料,特别是本手册中所提及的注意事项。这会有助于您更好和安全地使用本产品。请妥善保管本手册,以便日后参阅。 本手册的描述并不代表对本产品规格和软硬件配置的任何说明。有关本产品的实际规格和配置,请查阅相关协议、装箱单、产品规格配置描述文件,或向产品的销售商咨询。 如您不正确地或未按本手册的指示和要求安装、使用或保管本产品,或让非曙光公司授权的技术人员修理、变更本产品,曙光公司将不对由此导致的损害承担任何责任。 本手册中所提供照片、图形、图表和插图,仅用于解释和说明目的,可能与实际产品有些差别,另外,产品实际规格和配置可能会根据需要不时变更,因此与本手册内容有所不同。请以实际产品为准。 本手册中所提及的非曙光公司网站信息,是为了方便起见而提供,此类网站中的信息不是曙光公司产品资料的一部分,也不是曙光公司服务的一部分,曙光公司对这些网站及信息的准确性和可用性不做任何保证。使用此类网站带来的风险将由您自行承担。 本手册不用于表明曙光公司对其产品和服务做了任何保证,无论是明示的还是默示的,包括(但不限于)本手册中推荐使用产品的适用性、安全性、适销性和适合某特定用途的保证。对本产品及相关服务的保证和保修承诺,应按可适用的协议或产品标准保修服务条款和条件执行。在法律法规的最大允许范围内,曙光公司对于您的使用或不能使用本产品而发生的任何损害(包括,但不限于直接或间接的个人损害、商业利润的损失、业务中断、商业信息的遗失或任何其他损失),不负任何赔偿责任。 对于您在本产品之外使用本产品随机提供的软件,或在本产品上使用非随机软件或经曙光公司认证推荐使用的专用软件之外的其他软件,曙光公司对其可靠性不做任何保证。 曙光公司已经对本手册进行了仔细的校勘和核对,但不能保证本手册完全没有任何错误和疏漏。为更好地提供服务,曙光公司可能会对本手册中描述的产品软件和硬件及本手册的内容随时进行改进或更改,恕不另行通知。如果您在使用过程中发现本产品的实际情况与本手册有不一致之处,或您想得到最新的信息或有任何问题和想法,欢迎致电400-810-0466或登录曙光公司服务网站https://www.wendangku.net/doc/732992751.html,垂询。 商标和版权 “SUGON”及图标是曙光信息产业股份有限公司的商标或注册商标。 “曙光”及图标是曙光信息产业股份有限公司的商标或注册商标,文中“曙光信息产业股份有限公司”简称“曙光公司”。 “Intel”、“Xeon”图标是Intel公司的注册商标。 “Microsoft”、“Windows”、“Windows Server”及“Windows Server System”是微软公司的商标或注册商标。 上面未列明的本手册提及的其他产品、标志和商标名称也可能是其他公司的商标或注册商标,并由其各自公司、其他性质的机构或个人拥有。 在本用户手册中描述的随机软件,是基于最终用户许可协议的条款和条件提供的,只能按照该最终用户许可协议的

曙光服务器备份还原软件用户使用指南

曙光服务器备份还原软件 (DAWNING Server Backup and Restore Software) 用户使用指南 一、简介 曙光服务器备份还原软件是专为曙光服务器用户开发的一款基于硬盘和分 区的备份还原软件,实现了硬盘及Windows、Linux系统分区的本地及网络备份还原功能。具体支持的机型请查看软件光盘中的兼容列表。 二、主要功能特性 1、支持硬盘和分区的备份还原; 2、支持硬盘到映像文件(将分区或整个硬盘备份为一个映像文件,或将映 像文件还原到所对应的分区或硬盘)和硬盘到硬盘(硬盘或分区的对拷)两种模式; 3、支持本地和网络两种备份还原模式。网络备份还原支持 NFS和SSHFS两 种模式,可实现跨平台的系统备份还原; 4、一次可支持多个硬盘、分区备份还原; 5、支持多种主流文件系统,包括FAT1 6、FAT32、NTFS、EXT2和EXT3。 三、使用指南 启动计算机后,将光盘放入光驱中,进入BIOS,选择从光驱引导。重启服务器后,会自动引导进入备份还原软件图形界面。 本软件的备份还原模式分为硬盘/映像和硬盘/硬盘两种。下面我们将从这两方面分别介绍如何使用该软件备份还原分区和硬盘。 硬盘/映像 备份 1、选择操作类型 进入备份还原软件图形界面后,首先显示“选择操作类型”界面,如图1所示。选择操作类型和备份还原模式。在这里,我们选择操作类型为“备份”,备份还原模式为“硬盘/映像”。 点击【帮助】,可查看本操作的帮助信息。

点击【关于】,可查看本软件的版本信息。 点击【退出】,可退出系统重新启动计算机。 点击【下一步】,进入“备份方式设置”界面。 图1 “选择操作类型”界面 2、备份方式设置 图2 “备份方式设置”界面 如图2所示,用户可以选择硬盘/映像的备份方式。本软件提供四种方式,分别为本地硬盘到本地映像文件、本地硬盘到远程映像文件、本地分区到本地映像文件和本地分区到远程映像文件。 点击【下一步】,进入“网络信息设置”界面。

华师大高性能计算集群作业调度系统简明手册

华师大高性能计算集群作业调度系统简明手册 华师大高性能计算集群采用曙光的Gridview作业管理系统,其中集成了torque+Maui,是十分强大的作业调度器。下面将依次介绍华师大的的作业调度系统的设定,使用,以及相关作业调度命令 一:华师大作业调度系统队列策略设定 由于华师大的超级计算中心共分三期建设,其作业调度设定较为复杂: CPU 节点名 (pestat 可查看) 节点Core 个数 队列备注 第一期E5450 b110-b149 b210-b229 8(2*4) mid1,huge 第二期E5640 b310-b339 b410-b439 8(2*4) mid2, hugeA(需申请) 其中hugeA队列提交后 需经批准 第三期X5675 ,GPU(c2050 ) a110-a149 a210-a249 a310-a339 a410-a447 12(2*6) mid3,small,ser ial,gpu hugeB(需申请), shu(私有队列) itcs(私有队列) 其中hugeB队列提交后 需经批准 shu和itcs为私有队列, 不向公共用户开放 在命令行输入cchelp 可以查看详细的华师大的作业调度系统策略,如下 二:作业调度系统的使用

华师大计算中心共有两个登陆节点login(59.78.189.188)和login1(59.78.189.187),供用户登陆提交相关作业。一般来说,可直接使用命令行提交作业。不过为了规范和易于管理,建议使用PBS脚本进行作业提交,提交命令为qsub **.pbs(pbs脚本文件)。 下面将简要的分别给出串行作业和并行作业的PBS样本(已放至/home/目录下),仅供参考,更多高级功能,请自行查阅相应手册。 1.串行作业pbs脚本样本 #PBS -N test \\表示该作业名称为test。 #PBS -l nodes=1:ppn=1 \\表示申请1 个节点上的1 颗CPU。 #PBS -j oe \\表示系统输出,如果是oe,则标准错误输出(stderr)和 标准输出(stdout)合并为stdout #PBS –q serial \\表示提交到集群上的serial 队列。 . /job>job.log 为提交的作业。 2.并行作业PBS脚本样本

高可用集群模块

https://www.wendangku.net/doc/732992751.html,nderSoft Normal 联鼎软件 高可用集群模块介绍 作者:市场部 上海联鼎软件股份有限公司 https://www.wendangku.net/doc/732992751.html, 版权所有

目录 第一节概述 (2) 第二节产品优势 (2) 2.1全新体系架构 (2) 2.2智慧系统健康与可用性评价体系 (2) 2.3深度应用侦测代理 (3) 2.4强大的故障分级处理 (4) 2.5增强的跨平台集群系统集中管理 (4) 2.6支持虚拟化环境 (5) 2.7集群按业务分组,单组集群支持多达64个节点及64个任务 (5) 2.8首创智能预警体系 (6) 2.9丰富的集群备援模式 (6) 2.10更高级别的监测准确度,更快速的切换速度 (6) 第三节产品关键功能 (6)

第一节概述 全新的高可用集群模块是landerVault体系中负责保护关键业务应用免遭软、硬件故障影响的应用软件。应用创造性的“故障分级”概念,融入“智能感知”系统,彻底颠覆传统高可用集群系统简单的二元化故障判断方式,将传统高可用系统仅对“故障”所引起的结果(如宕机)做出反应提升为对“故障”的成因(系统健康指标)进行监控与分析,配合独特的“故障预警”机制,在核心系统即将发生严重影响业务持续运作情况前及时发出“预警”,并在必要的情况下自动执行精确而迅速的故障隔离及应用转移,将故障事后处理提升为故障事前预知,充分保障用户核心应用7×24小时持续可靠运作,可支持多达64个节点的应用,并为局域网(LAN)或广域网(WAN)上的客户机提供高可用性的服务。 第二节产品优势 2.1全新体系架构 创新的LanderCluster的体系结构,以面向“对象”为核心,对象包括:IPAddress,Alias,Volume,Process,Service,CPU,Memory,Network等,每个对象都有自己的属性、方法、事件。集群容器(Container)是一个大的接口池,集群负责管理这些对象的生命周期,为每一个对象提供接口服务。 2.2智慧系统健康与可用性评价体系 高可用集群模块在业界首次提出了创造性的“系统健康评价体系”并加以应用,我们认为对系统的可用性判断必须是持续的,大量的情况证明系统从“可用”转向“不可用”并非是瞬

相关文档
相关文档 最新文档