随着云计算与大数据技术的广泛应用,数据中心产业正飞速发展,数据中心的规模也越来越大,几十上百万台服务器的超大规模数据中心已经屡见不鲜。面对庞大的设备规模、复杂的系统架构、苛刻的安全要求,越来越多的专家认为,未来的数据中心只有借助各种新技术新方案,只有做到自动化、智能化,才能提高数据中心的运维效率,做到高效、安全的运营。
一、什么是数据中心资产管理
1、为什么数据中心要进行资产管理?
数据中心是目前为止IT行业最复杂的系统,其内部涵盖了数十个专业领域,数百个细分行业,上千种不同品牌和类型的产品。这些来自不同厂家和品牌的物理产品就是数据中心的“资产”。“U位资产”特指安装在数据中心机柜内部的IT硬件产品,如服务器、存储、网络设备等,这些产品是数据中心的核心部件,它们担任了数据中心的数据采集、处理、传输、储存的功能,是保证整个数据中心运行的核心资产。
随着数字时代的来临,数据中心也从早期的生产辅助系统变成了整个社会生产与生活的中心。但面对着成千上万的IT设备,运维人员普遍面临着设备变更频繁、资产查询困难、盘点耗时耗力、故障上报不及时、空间规划不合理、资源利用率不高、运营成本高等问题。数据中心资产管理的重要性和严峻性越发突出,只有管理好这些核心资产才能真正让数据中心发挥出最大的作用,为企业生产和我们的生活做出贡献。(本文关于数据中心资产的描述中,如无特别说明,将主要指针对机柜内使用的“U位资产”)
2、数据中心资产管理的难点和现状
数据中心根据用途可分为自用型和运营型数据中心。
对于各企业的自用型数据中心来说,大多面临着设备复杂、运维人力和运维水平不足、管理水平不高等问题。因为历史遗留问题的存在,数据中心资产往往也成了一笔糊涂账。更严重的是,很多时候因为管理不善,运维人员自己也不清楚机房中有哪些设备,甚至不知道哪些服务器是正在使用的,哪些服务器是可以下架报废的。这不仅造成了极大的能源和物资的浪费,也给数据中心带来了数不清的安全隐患。
对运营型数据中心来说,数据中心的运营商向用户提供机柜位置或设备托管租赁服务,从而收取租金来获利。用户的变化导致了数据中心内的设备总是处于变动之中,而只有实时了解数据中心的实际使用情况,数据中心的运营商才能及时的为用户提供所需的服务。但运营型数据中心普遍规模较大,传统依赖人力的资产统计和盘点方式会浪费大量的时间,并因此提高数据中心的运营成本。
因此,相对于传统人工管理方式,自动化的资产管理技术可以显著降低数据中心运营难度、减少运营开支、提升服务水平、提高安全可用性。
二、数据中心资产管理技术简介
传统的数据中心资产管理大多是通过设备SN号、设备条形码等来进行资产标识,并通过人工记录或手动扫描的方式来记录设备的位置和资产信息。当设备位置和状态出现变动时,运维人员必须在管理系统中手动更新信息,否则就会导致后台数据和实际使用情况不一致,给运维工作带来风险。目前国内数据中心的资产管理大多还停留在人工方式的阶段。
数据的采集:
数据中心的自动化资产管理技术,通常采用“设备电子标签+采集控制模块”的方案进行数据采集与管理。
电子标签通常固定在IT资产的外表面上,用于记录设备的相关信息,并通过主动或被动的方式发射信号给自动读取系统。
采集模块接收到信号后,将设备的资产信息和位置信息传输给管理系统进行处理,从而实现对资产信息的实时监控和及时更新。
数据的处理:
根据采集到的资产和位置信息,数据中心资产管理系统通常可实现以下功能:
1、资产物理位置的实时监控;
2、资产的实时盘点;
3、机柜空间使用情况实时监控;
4、资产异动实时告警。
数据中心的资产可以使用独立的管理系统进行管理,也可以将资产管理作为某一项功能,集成到数据中心的基础设施管理平台中。目前很多数据中心管理平台都支持资产管理功能,并基于上述主要功能不断衍生出诸如容量管理、生命周期管理等新的功能。国内大多数DCIM、3D可视化等软件企业都可以提供相应的数据处理平台。
自动化资产管理技术的难点,主要集中在资产数据的采集上,也就是设备电子标签以及对应的读取方式上。从历史发展来看,电子标签技术主要可以分为三个阶段:
1、电路连接传输方式(又称接触式)
这种技术诞生于上世纪80-90年代,电子标签内部一般采用接触式ID/IC芯片,接触式ID/IC卡工作时是通过IO连接线路连接电源和数据线,一般有数个接触点连接到电路上。目前国内部分厂家采用的单总线接触式电子标签EIC(1-wire技术)就属于此类技术。
电子标签采集信息后,必须通过连接线路进行传输。在使用时,电子标签必须插入到读取系统的接口处,形成稳定的电气连接,然后才能采集到信号。目前该技术的芯片供应厂家较少,已处于逐渐淘汰阶段。
优点:定位比较准确,不会造成位置偏差。
缺点:电子标签接触点松动、氧化、灰尘和油污都可能造成接触不良,无法传输信号;抗静电能力差,容易受静电影响造成电路故障,所以一般产品故障率高使用寿命较短、后期维护成本高;据了解,因技术落后,很多芯片供应商已经停产,目前芯片供应商全球只有一家(美国达拉斯半导体),不具备大规模推广使用的条件。
2、RFID无线传输方式(又称非接触式)
RFID非接触式电子标签技术使用了无线数字通信技术来传输数据,无需IO连接线路连接,有效的解决了接触式电子标签维可靠性低、触点故障率高、容易受静电击穿等问题。RFID非接触式技术的主流产品是工作频率为13.56MHZ、符合ISO14443A/B国际标准的 RFID电子标签和阅读器,目前已经广泛应用于全球金融银行卡、手机NFC、办公和住宅、酒店等等领域。
但是在数据中心高密度的U位(每个U只有44.45mm)管理应用场景中,RFID技术会出现临近的读卡器误读、传输距离容易受到电磁环境干扰、读取信号的距离不稳定等问题。所以采用RFID技术方案的U位产品,其数据准确性通常只能做到80%左右,难以做到100%准确。
除此之外,无源RFID电子标签要依赖读卡器发出的电磁场来提供能量工作。只有当读卡器发射功率达到一定能量时才能驱动无源RFID电子标签工作,而由于机房内部的IT设备众多、电磁干扰多,而且场强变化大,无源RFID电气与读卡器的有效读卡距离不稳定。所以安装标签的时候每个标签与读卡器的距离需要严格的调试,即使调试好后,在以后的使用过程中容易出现标签读不到的情况。(比如地铁卡经常会刷不到)
优点:产业链较成熟,应用广泛;无线传输方式,不受电气连接稳定性干扰,不存在接触不良问题。
缺点:定位不准确,做不到100%数据准确;容易受到复杂电磁环境干扰产生误读;有效读取距离不稳定,需要现场进行产品调试。
3、改进型RFID方式
前两种技术诞生于不同的年代和领域,在数据中心实际应用中均出现了不少问题,并不能完全满足数据中心场景的复杂应用。因此,近年来又出现了针对数据中心场景的改进型RFID电子标签技术。此类技术以数码人于2013年发明的MC-RFID无源主动式技术为代表,下面以此技术进行介绍。
采用这种技术时,读卡器一般不会主动发射信号。只有当电子标签与读卡器接触后,两者距离小于一定距离(一般2毫米以内),读卡器才会主动发射信号来读取电子标签内的芯片数据。而在读取完毕后,读卡器会进入休眠状态,不再发射信号,直到下次再次被激活(标签脱离或接受到指令)。这种技术不依赖电气连接传输数据,不受接触点氧化、松动、接触不良的影响;同时避免了传统RFID一直发射信号对设备的干扰。通常电子标签会采用磁铁吸附的方式安装到指定U位的读卡器上,所以也不会出现临近读卡器误读的情况。
优点:定位准确,不会产生误读数据;不受触点氧化、接触不良影响,可靠性高;不会干扰机房设备运行;长期工作性能稳定,后期维护不需要二次调试。
缺点:可能价格较高。
目前国内U位资产管理产品采用的技术主要有上述三种,前两种因技术难度低、出现年代早,目前相关产品较多,但因实际使用效果不佳,未能大规模普及。第三种技术虽然出现较晚,但性能优异,目前发展较快。
三、如何选择数据中心资产管理产品?
1、产品功能选择
对于U位资产管理产品来说,除了最基本的物理位置定位之外,通常还具备多种功能,用户可以在实际使用中根据自身的需要进行合理选择。
资产管理功能:资产管理是最基本的产品功能,通常包括定位、变更、查询等操作。
l 实时定位-可以对资产物理位置进行实时准确定位,精确到机柜内每一U位,准确率要达到99.99%以上;
l 自动变更-资产物理位置发生变化时,如上架、下架、迁移等,系统可以及时更新资产物理位置信息,无需手工记录;
l 资产查询:维护人员可以根据资产编号、设备型号或其他已记录信息,快速查询定位到设备的具体安装位置,方便现场人员及时维护;
l 资产盘点:通过资产管理系统,可以快速(秒级)实现数据中心全网资产自动盘点,准确性可达100%;
l 库存管理:通过资产管理系统,可以对数据中心设备库存进行管理,实时查询不同设备的使用状态,存放位置等信息。在设备状态发生变化时,系统可以自动记录,无需手动修改。
安全管理功能:安全管理同样是用户比较关心的问题之一,通常包括自动告警、授权等操作。
l 机柜内安全管理:在U位资产出现异常时,管理系统可以及时进行现场声光告警,并通过操作系统、短信、邮件等多种方式通知维护人员。异常状况一般有:
l 非法下架-未经过授权的设备下架,系统可自动产生告警;
l 位置侵占-设备安装在未获得授权的U位时,系统可自动产生告警;
l 标签损毁-电子标签在遭到人为故意损毁时(如撕毁、剪断),系统可自动产生告警;
l 离线告警-因为网络状况或其他原因,后台管理系统无法与现场监控设备通讯时,U位检测设备在设备位置变动时也应能自动产生声光告警;
l 非授权告警-其他非授权操作,系统均应自动产生告警。
除此之外,还有用户希望具备区域(机柜外部)安全管理的功能:在受控资产进出某个区域时,系统应该自动进行信息记录或给出相关告警。区域管理功能通常可以和库存管理相结合,实时对资产的存放位置、使用状态进行监控。
容量与环境管理功能:即对机柜的空间使用情况、机柜内的温湿度环境等数据进行实时统计和查询。
l 容量分析-资产管理系统可以对每个机柜以及整个机房的U位空间使用情况进行统计和分析,方便运维人员统筹规划;
l 容量查询-根据不同IT设备的所需U位空间,可以在系统中快速查询到实际可安装位置(实际使用中通常用户还会结合供电容量、制冷容量进行进一步的位置匹配);
l 环境监控-可以对机柜内的温度、湿度等环境参数进行实时监控,在出现异常时(如温度过高、湿度过高等)及时进行告警;
其他运维与运营管理功能:作为整体管理平台的重要组成部分,资产管理系统可结合现有的维护流程,帮助用户提升运维效率,节省运营成本。
l 设备信息录入-结合手持终端,资产管理系统可以实现设备上架后的信息快速录入,后台数据自动更新;
l 声光定位-当需要对某台设备进行维护操作时,可通过后台管理系统,对具体U位下发指令,产生声光告警,引导维护人员快速找到该设备;
l 远程可视化管理-可实现远程可视化管理,无需进入机房即可对全网设备使用情况、机柜使用情况进行统计,管理系统支持多平台操作;
2、产品外观设计选择
U位资产管理系统一般由电子标签、采集模块(又称资产条)、管理系统三部分组成。
电子标签的要求:电子标签一般由“资产条连接端 + 连接绳 + 服务器连接端”三部分组成。
l 电子标签应采用无源长寿命设计,从而实现整个生命周期的免维护。
l 服务器连接端应能快速固定到服务器等IT资产的外表面上,固定牢固不易脱落(通常采用3M胶固定)。
l 连接绳采用可伸缩设计,方便用户调整不同的安装距离。
l 因机柜内安装位置狭窄、光线不足等问题,所以资产条连接端不能采用USB、连接端子等插接方式(不方便操作),可采用磁吸附等方式,方便在实际使用中快速固定;
l 表面应打印有二维码等全球唯一标识,方便手持终端等设备快速进行扫描识别。
对采集模块(资产条)的要求:
l 为方便运输和备件存储,采集模块应采用模块化设计,可根据实际机柜高度进行不同组合安装,如5U模块、6U模块等。不建议使用单一整条设计,如42U、47U等;
l 采集模块尺寸应尽量小巧轻便,方便在不同机柜内部的安装,一般厚度不超过20mm,宽度不超过50mm;
l 采集模块每一U位应与实际使用位置一一对应;
l 每U位都要有独立指示灯可以显示不同状态。一般要提供在位、离位、故障、预占位、状态指示等至少5种以上色彩,并支持用户自定义设置;
l 安装位置隐蔽,安装后不影响开关门操作,不影响服务器上下架操作;
l 如需要使用额外控制器对采集数据进行处理,则控制器本身不应占据太多空间。
管理系统差异较大,这里不做赘述。不同客户的要求也不尽相同,一般除了主要功能外,还需要界面美观、操作简便、可支持不同终端进行访问等。
3、技术方案选择
l 整体技术方案:如上所述,目前U位资产管理的电子标签主要有三种技术,综合考虑下应选择第三代改进型的RFID技术,避免采用高故障率、准确率低、抗干扰能力差的技术;
l 通讯传输方案:通常每个机柜会部署一套资产管理硬件,资产信息采集后通过有线或无线方式传输给管理平台。目前业界主流是采用有线方式进行传输,也有少量产品通过ZigBee等无线方式传输;
l 系统供电方案:对于采集模块一般有PDU供电、POE供电、电池供电三种方式。PDU供电一般需要占用机柜内一个或多个PDU端口;POE供电一般由交换机网线直接给采集模块供电,使用比较简单,不需要占用PDU端口;电池供电不需要占用PDU端口,但要考虑实际电池的使用寿命,一般机柜较多的情况下,电池定期更换可能会占用较多时间。用户可根据实际情况进行选择;
l 信息存储方案:电子标签根据内部可存储的信息量,目前主要有两类:
1、仅存储一个固定标签ID号。ID号对应的设备资产信息必须通过与管理平台的数据库关联后,才能在系统中进行查询和读取,这种标签一般不支持用户写入信息;
2、可存储一定字节信息(通常500~1000字节)。通常这类电子标签的内部芯片可根据用户自定义存储包括资产设备品牌、型号、托管单位、MAC 地址、IP 地址、存放起止日期、入库时间、机房信息、机柜信息、存放人员等关键信息。这种标签内的信息可以反复读写,同时支持离线管理,用户可通过手持终端直接读取芯片内部储存的信息,而不需通过网络从后台读取数据。
l 信息处理方案:资产信息的处理方式目前主要有集中式和分布式两种。对于集中式设计,各机柜内部署的采集模块和电子标签仅负责信息的采集和传输,由集中控制器来统一负责处理信息,接入的机柜数量越多,系统响应速度越慢;对于分布式设计,各机柜内自带独立控制器,除了采集和传输数据,同时也对大多数信息进行处理,仅仅将处理结果传输给管理平台。响应速度基本不受机柜数量的影响。对于几十柜的中小型数据中心,两种设计方案的响应时间相差不大,100柜以上规模数据中心,建议采用分布式设计来提升响应速度。通常来说,在资产位置发生变动时,系统给出告警的响应时间应小于3秒。
l 组网与协议:资产管理硬件大多支持IP组网,厂家一般会提供通用协议如TCP/IP,Modbus等。目前也有少量产品采用无线方式组网,如ZigBee等。
l 扩展端口:部分用户可能会希望资产管理采集模块同时也能收集机柜内部的温湿度等信息,所以采集模块有时也需要提供RS485等扩展接口。
4、其他:产品专利、应用规模等
除上述选择方式外。用户在实际使用中还应考虑其他方面。
l 技术专利:数据中心行业发展迅速,各种新技术层出不穷,难免有技术侵权、仿冒产品的存在。而用户大多是知名企事业单位,一旦采用仿冒产品可能会引发一系列的法律纠纷,同时影响自身声誉。建议采用正规厂家提供的产品,在项目采购中也应要求供应商提供相关技术专利,并在合同约束条件中规避此类风险;
l 应用规模:数据中心资产自动化管理领域属于新兴行业,目前该领域发展迅速,新技术新产品不断出现。从使用安全角度考虑,建议用户在采购时应注意选择已经规模化部署的成熟产品,谨慎选择新进入厂家的初代产品。
四、总结
据Gartner报道,全球每年数据中心领域的投资已达到1900亿美元,大型、超大型数据中心、边缘数据中心在未来几年中仍会保持高速增长,但随之而来的资产管理问题也日益突出。笔者相信,在未来数据中心的发展中,U位资产管理技术将会快速进步并在越来越多的数据中心中发挥不可替代的作用。
下表总结了数据中心U位资产管理产品的主要选择标准,用户可根据需要使用。
U位资产管理产品速选表: