CIOAge.com IT推动创新
IBM倪敦:有效信息管理架构基础设施(2)
文: CIOAge 评论 ( 0 ) 条 ( 0 ) 砖 ( 0 ) 好 论坛 博客
阅读提示:CNET·ZOL讯 2008年5月15日上午,在北京JW万豪酒店地下一层多功能厅召开了“企业级存储,构建新一代企业级数据中心”——2008 IBM企业信息架构论坛,参加本次会议的嘉宾有IBM系统与科技事业部存储平台总.....

下面我详细讲一下我们存储管理的解决方案。作为IBM存储架构管理解决方案核心就是IBM TotalStorage Productive Center (TPC),这个解决方案是一系列的产品构成的,作为现在的TPC有两大部分,一部分是TPC Stantard,这是一个标准的存储架构管理的平台,能够实现存储的资源管理、故障监控、性能管理、事件管理。第二部分是TPC专门做大型数据中心、做DR数据复制和远程的管理,作为存储架构管理,这点比较清晰。

倪敦:这是我们做的一个项目的例子,在这个例子中,我们可以看到,作为一个完整的存储架构管理,首先包括存储资产管理,概述方面:

第一部分存储资产管理,包括磁盘阵列、交换机、镜像磁盘阵列的状态,同时报警出现在主要设备发生的主要的重要事件、主要违反的事件有哪些,

第二部分是存储资产和容量的评估,首先要评估出现有的资产能否支撑现有的系统运行的需要,比如两、三个月以后现有的系统还够不够。哪些业务系统存储增长量最大,哪些系统由于业务失误有大量的空间没有使用,这样可以很好地调整我们的业务系统。在2.2我们可以看到,必须做出存储趋势分析,支撑存储运维的需要。

第三部分是存储变更管理,作为IT管理变更管理是很关键的一块,如果不能很好地做变更管理,经常发生一些不可控关键性的故障,现在整个IT运维发生的故障70%,都是在变更过程中发生的人为操作。所以我们必须考虑存储的变更管理。

第四部分就是性能分析,很关键,当存储系统建设之后,我必须怎么样评估它日常运维的状态,哪些可能是一些瓶颈,哪些运行的状态很好,基于存储系统要做性能分析、负载分析。后端还包括我们做的DR,不仅包括生产中心的存储系统监控,同时还包括容灾中心这些镜像存储系统的监控,如果不能很好地监控镜像存储系统,可能灾难发生的时候,我们会发现镜像数据错误的,比如I/O的峰值造成问题,当灾难发生的时候会造成整个数据的不可用。

下面我们分几个部分来看一下TPC如何实现存储管理的解决方案:第一部分,我们的存储拓扑管理必须能够形成分层、深入的拓扑的分层。在这个过程中,我们必须能够生成从服务器、交换机、磁盘阵列再深入到每一个磁盘阵列的卷,这样一个磁盘的拓扑。在这里我们看到,这是我们的基于交换机的拓扑的关系。第二部分是我们从交换机端口到服务器的连接关系。第三部分看到分层次Inside到磁盘阵列内部的分层次的内部磁盘阵列划分的连接状态。

第二部分在整个的存储拓扑管理中,不仅能够生成这种拓扑,同时要生成关联关系,不能单独看到这个层次,要看到层次之间的连接以及可能带来的问题。在这里面我们要构建端到端的拓扑的连接状态,在这里我们可以看到,从我们服务器数据通道通过哪个HPA卡连接到哪个交换机的端口,同时连接到磁盘阵列控制器的端口,以及连接到哪一个磁盘卷组,在这样的过程中,随时点击查询到每一个状态信息,分析磁盘阵列数据访问通道中所运行的状态。(见图),这是我们通过TPC能够实现的,比如我们选中一个服务器,在这里可以直接看到逻辑卷是哪些,卡是哪些,交换机,磁盘的记忆卡是哪些,这样可以由针对性的从复杂的数据中心,比如十几个高端阵列有几百台服务器,选择哪个服务器可以把它单独连接状态列出来,查询和监控它的状态,同时看到实时的性能状态,这样很容易就分析出数据传输通道中性能的瓶颈,还有故障高发期在哪个阶段,可以提前预测发现可能在哪个阶段发生问题。当问题没有发生之前,我提前就会把一些设备更换或者重新划分一些区,重新做一些卡,重新划分出一些存储空间,这样提前解决可能会发生的存储故障。

底下还有类似事件窗口的东西,可以把所有数据传输通道都显示出来。在这里面我们可以看到,为什么TPC能够实现异构的存储管理?其核心就是基于现在开放的XMi-S的标准,TPC是完全按照XMi-S标准设计的平台,2003年的时候管理的系统很少,2008年所有主流厂商都支持SMIS新的设备。这样基于TPC可以很容易地进行数据中心的管理,我们可以看到在这个架构中右边是我们所要管理的设备,现在主流设备无论是磁盘阵列、存储交换机都是基于SMIS管理存储的,像基于SMP管理的存储方式很难更加深入全面管理存储系统了。在SMIS有四个点,这四个点从磁盘阵列、设备进行关联,同时根据CIMOM查询信息,通过CIMOM和XMi-S来传输。

下面,我们看到作为性能管理这块,因为以前刚开始上存储管理的时候,很多客户非常关心性能管理,其实性能管理只是整个存储管理中的一小部分,关注于性能管理很难做一个非常完整的存储管理。这边我们看到通过TPC做性能管理能够实现从磁盘阵列到Subsystem到端口以及违规事件,这样一个详细的管理,通过采样频率和持续时间定期收集数据,同时免费带一个DB2和Tivoli储存起来,这样可以根据我们的需要随时把它调出来,生成相关历史状态的报告,做一个对比分析,尤其在做项目中客户很喜爱做的是不同磁盘之间的对比分析,或者不同磁盘阵列中的对比分析,或者同一个磁盘阵列在某一个时间点的对比分析。尤其在一个大型的数据中心中,很关键的就是可能它的卷,它的信息会有上千条,这样的话我们通过TBC很关键的改变做出选出其中很重要的或者性能高峰或者很关心的设备,在这里面TPC能够生成由高到低或者是TOP10,或者是TOP25这样一个报表,这样能够使系统管理员每天发现系统管理中最关键的性能瓶颈或者已经达到关键点的设备的状态。

这里面我们可以首先生成典型指标的性能能负载Top报告,同时我们查询对比他们之间的状态,这样同时跟业务部门的专家相沟通,比如在某一个时刻业务系统是否有一些特殊的需求,某一时刻业务系统是否做过一些批处理的工作,这样可以看出高峰期是正常还是异常的,如果是异常的话,经过下一步的操作,我们看怎么调整我们的存储系统。基于TPC我们能够生成所有基于存储系统的关键性的性能报告,包括基于控制器,包括主要存储信息的性能的报告。

我们看到,在IBM的存储架构解决方案中,有一个很大的优势就是异构性,在这里可以看到不仅包括IBM磁盘阵列,包括主要的第三方厂家的磁盘阵列。在第三方磁盘阵列方面也不存在很大的困难,同时在存储架构管理中很关键的一点是能够进行带库的管理,生成带库的逻辑拓扑图,带库管理是很大的问题,比如有几千盘磁带的带库,通过带库的控制面板,很难查询出来5000盘带子处于哪些槽位,一目了然的生成一个列表,看它的状态是怎么样的,这些带子什么型号的,十几个驱动器状态怎么样,微码是多少,哪些需要升级哪些不需要升级,这样通过TpC还包括一个带库的管理,直接生成带库的逻辑拓扑,把整个的存储管理构成完整的拓扑,不存在逻辑管理的孤岛。

在这里我们看到,作为存储管理,刚才讲的拓扑、它的性能以及异构的管理,但是作为所有系统管理中,最核心的一点就是事件管理,因为无论是我们的网络管理、业务管理、服务器、应用监控管理核心都是把我们的状态转化成相关的事件,把事件汇总进行关联分析,对存储管理中面临的都是相同的问题。基于TPC的存储架构解决方案,可以把主要的存储事件生成出来并发到事件管理平台,包括磁盘阵列事件、交换机事件、违规违例的事件,通过集成比如通过Tivoli标准的事件管理平台,而通过高低端结合的新方式,第一能够高速处理所有的事件,因为每天存储管理的事件有上万条,系统管理人员每天看上万条根本发现不了其中的关系,第二就是做事件的关联分析,把相关联的事件故障组合在一起,生成一个故障事件,这样的话,可以使系统管理员把每天上万条事件缩减到几十条关键性事件,根据事件处理我们的问题就可以了。

共3页: 上一页 [1] 2 [3] 下一页
【内容导航】
已有0人发表看法
我来说两句
验证码: (如果看不清请点击图片进行更换.)   匿名
最新评论更多..
服 务 CIO 推 进 信 息 化
主编推荐
最近更新
热门文章
中国CIO周刊
浪潮通软助力建峰化工信息化展现CIMS之舞 浪潮通软助力建峰化工信息化展现CIMS之舞
建峰化工CIMS工程的立项,获得了重庆市经委和科委的支持,两个机构分别向该工程拨款10万元和6万元人民币。虽然这部分资金与建峰化工CIMS工..
做好教育信息化需先行 浙大网络的S+S体验 做好教育信息化需先行 浙大网络的S+S体验
浙江大学网络信息系统有限公司是国内最大的教育软件专业开发商、教育电子商务提供商之一,占据国内校校通、城域网软件平台50%以上市场份额..
洞察
揭秘:中小化工企业拒绝ERP的四个理由 揭秘:中小化工企业拒绝ERP的四个理由
拥有43个行业、3000多家大企业、2~3万家中小企业的化工行业,其信息化水平究竟如何呢?前不久记者采访了中国化工信息中心副主任李中。李..
SaaS概念要落地 软件提供商不能任意定价 SaaS概念要落地 软件提供商不能任意定价
软件领域任何字母都可能组合成新的名词,进而上升到概念的高度,SaaS也不例外。2003年SaaS提出,顷刻间概念飞遍了各个角落,然而,概念不..