随着应用与技术的发展,数据中心的建设规模出现两极分化的特征:一方面,业务集中与资源共享等趋势推动数据中心向规模化方向发展,另一方面,小型数据中心在解决资源瓶颈的问题以及提供差异化服务方面的作用日趋明显。

IT系统的集中规模化建设与垂直化分布特征,对基础设施的管理提出了全新的要求,这些要求集中体现在融合统一、持续高可用、经济性运营、可服务等方面,并已成为数据中心可持续发展的关键KPI,而以此为基础的数据中心基础设施管理(DCIM)成为了精细化运营建设的关键内容。

1 为何需要建设精细化运营

早期的数据中心管理侧重“监测”,管理对象单一,网络简单,烟囱化管理特征明显,无法支撑业务的可持续发展。物联网、M2M、云技术的发展,使得大量设备连接成为可能,基础设施日趋整合,数据规模、复杂性增加,呈现出如下特征:

1、领域产业链聚合,海量硬件与软件连接,资源的统一管理是基本诉求;

2、保障连续供电、连续供冷,构建内耗最小、功效大的资源服务中心以应对资源集中、成本控制带来的挑战,成为IDC建设、过程运营需要面对的共同课题;

3、供电、冷却能力、机柜空间等资源的大化利用,成为降低TCO、延长数据中心建设周期的有效方法;

4、同时,DCIM管理与工具快速的渗透到数据中心基础设施管理的E2E流程中,为自动化、智能化的高效运维与精细化管理提供了基本的技术条件;

建设完整的数据中心涉及基础设施,技术与系统架构,应用与数据,业务与流程,组织与运营等全方位内容。藉由基础设施的运营管理,减少数据中心运营和管理成本,提高数据中心的易用性、持续可用性和灵活扩展性,保护投资、提升回报率,帮助用户实现IT创新甚至业务创新,是IDC精细化运营的基本诉求。

2 满足要求的精细化运营框架

数据中心建设是不同领域产业链的整合,基础设施呈现出异构、领域差异化特征,需构建一个普适的管理模式,实现统一、融合的管理,以确保业务发生变化时,对系统进行自动调优,实现高效、准确的管理。

2.1 统一、融合的管理

技术、业务、流程的发展和演进,推动数据中心管理目标和功能不断发展。

数据中心的基础设施管理已经从基本的动环管理演进为DCIM,且范围逐渐延伸到BMS、IT资源领域。

管理体系已经由孤立的资源监控、系统及网络,向着统一、融合,面向服务、流程自动化方向发展。

管理功能从数据收集、发现、实时监控,向历史数据分析、决策分析、自动响应方向发展。采集实际的数据以及对数据的分析、统计、报告,给出执行策略是差异化竞争力的关键。

统一、融合的管理,要求有统一的数据模型,实现多源数据相同框架的管理;要求基于开放的平台与体系架构,为系统管理工具选型提供更高的灵活性。

2.2 实现与业务关联的架构

IDC机房管理系统的目标是保障基础设施的持续高可用性,为业务系统安全、可靠地运行提供保障。

调查发现,在众多的机房中,尽管已经部署了一定的监控工具,但是这些监控工具都是针对某一个系统或资源设计的,系统相互独立,无法很好的集成(如制冷系统、供配电系统、服务器网络设备之间的管理往往由不同的厂家提供,相互独立)。

由于缺乏集成的管道和框架,其监控的管理信息不能共享,导致误报警和报警重复等现象。同时,由于这些工具都只是面向基础设施的监控,即使发现问题,也不能将问题与真正的业务联系起来,也就不能判断此问题对业务的影响,同时无法判断解决问题时的优先级顺序,使影响关键业务的问题被延迟,甚或被忽略,从而无法达成SLA的关键诉求。

因此,一套能实时监控系统、部件运行状态,准确地判断对业务影响的系统是实现数据中心智能化管理的基础。要实现基础设施的关联管理,提升运营服务水平,要求:

1、系统能够将基础设施的管理与业务流程连接;

2、系统能够将所有不同的管理工具进行统一和集成,实现信息共享;

3、系统能够根据共享的信息,建立起业务的关联视图。

精细化的运营要求管理工具可将自动化和智能化融入到业务流程中,实现主动式监测和管理,专注于满足业务增长提出的可用性、容量规划和资源利用效率需求。

2.3 基于ITIL的最佳实践

基础设施管理解决方案不仅关注基础设施本身,而且还包括组织内部的组织流程、指令规范、 业务。 如何将组织流程、规范及业务融合到管理系统中,实现数据整合,提升运营服务品质是ITIL的基本理念,是数据中心对外提供服务的基础。

ITIL提供了一个业务与技术相结合的框架,是IT服务管理的成功实践总结、指导,已经成为事实上的行业标准,借鉴ITIL,运营可以以一种受控、有序的方式向最终用户提供服务。

ITSM是建立在ITIL基础上的数据中心管理与运营服务系统,包括如下几个阶段:基础监控、融合集成、主动预防、自动优化等,是一个渐进过程,处于不断的优化系统与技术的动态演进中。

20141110018

图 1  基于ITIL实践的IDC管理阶段模型

基础监控,是IDC管理的起点,通常以数据采集、故障监控和修复重大故障所需时间作为评估标准,往往是事件触发式的、被动式的。

在融合集成阶段,对基础设施管理评估标准为:所管理资源的可用性、在故障管理系统中关闭故障所需时间。要改善这些评估指标,离不开对业务流程化、最佳实践方案的反馈与循环改进。

在主动预测阶段,保障业务系统的可用性和SLA,是支撑主动、高效管理的动因。对资源的性能进行评估、分析,并利用相关领域的技能与知识,对系统资源性能、问题、容量做主动式管理,对资源的优化配置提出建议,是该阶段实践的主要内容。

自动优化阶段,系统会自动调整资源配置,以优化性能。业务策略、业务优先级及SLA会支配基础构架优化的行为,如基于业务均衡的IT资源(VM)与基础设施层的高效节能联动、基于容量管理的负载均衡与资源优化配置等。

自主阶段,使用先进的成本与收益模型、性能与业务响应及时性等来实现业务自动化保障、业务快速部署、资源的大化利用,实现IDC建设的弹性扩展。

3 持续构建精细化运营系统

数据中心基础设施精细化运营的真正潜力在数据,数据中有效信息分布在不同的解决方案与DCIM工具中,信息的整合贯穿运营的每个环节,是实现精细化运营、构建竞争力、改变市场格局的有效手段。实现数据中心的精细化运营,可遵从ITIL的服务理念,围绕数据中心持续高可用、资源大化利用以及服务运营持续构建。

3.1 高效,持续高可用

通过系统的监控和管理,确保基础设施的持续高可用性;通过数据的采集与分析,提升资源的利用率;通过自动化的运维模型,提升管理效率,降低成本,实现业务服务的敏捷化。

精细、广泛的管理

基础设施的精细化、广泛的管理,建立在统一、完备的管理模型基础之上,DMTF发布的通用信息模型CIM框架提供了操作系统、应用程序、网络和设备管理的基本模型,但要实现基于业务、应用的管理,则需要对模型做合适的扩展,以满足运营的基本要求。

在构建高效、持续高可用的运营系统的过程中,满足ITSM管理要求统一的数据模型的基本要求包括:

1、自动的数据采集,设备管理、传感网络可持续采集和集中处理数据。

2、具有虚拟现实的建模能力,包括IT与基础设备在内的资源,可准确的反应现场的配置。

3、所见即所得,可视化的变更、配置,深入到CRAC、行、机架等级,实时可见的能力,可避免主观臆断的移动、添加、以及改变数据中心的配置。

4、可持续跟踪IT资产的财务数据(购买日期、成本)以及物理数据(机架中的位置)的变化,实现生命周期内的资产管理。

5、数据中心的能力规划与预测,集中式的电源、散热、空间、网络占用计算可预知机架能力变化,提高资产利用率。

借助统一的数据模型、组件化及网络构建能力,DCIM能够管理分散的、不断增加的成组应用,支持、收集开局、扩容、迁移、退网等场景下的配置、变更信息,并进行相关处理,提供相关信息,支持决策。用户可在一个集中可视化视图中,以一种更直观、有效的方式来反映当前部件状态并执行控制任务。

关注中国IDC圈官方微信:idc-quan 我们将定期推送IDC产业最新资讯

查看心情排行你看到此篇文章的感受是:


  • 支持

  • 高兴

  • 震惊

  • 愤怒

  • 无聊

  • 无奈

  • 谎言

  • 枪稿

  • 不解

  • 标题党
2024-01-09 16:53:00
市场情报 中兴通讯分布式存储+ DPU,加速数据中心转型
存储技术在不断地创新、完善、加速演进,以更好地满足业务的存储需求,但同时也使得存储协议和文件系统越来越繁重。 <详情>
2023-11-17 10:35:56