太阳集团tcy8722(中国)有限公司

太阳集团tcy8722时代智能运维平台
发布时间:2021-03-18 11:52  发布作者:admin

方案/产品概述


1. 概述
大数据时代,数据中心的业务也呈现出持续增加的趋势,新技术、新工具的引入导致其信息系统更加复杂,运维管理也更加困难,主要表现在:
1、数据中心内需要管理的对象越来越多,缺乏统一的管理平台。
2、缺乏制度化的运维经验积累途径。
3、运维所需的监测数据配置管理困难。
4、难以对公有云和私有云中的资源进行统一管理。
5、缺乏对某一类具有共性的问题处理进行归类分析的手段。
6、服务器和网络设备如何实现零配置部署。
7、对脚本的管理越来越难。
8、业务的自动部署难。

太阳集团tcy8722时代智能运维平台实现企业数据中心IT资源对象,如网络、虚拟化、操作系统、数据库、中间件等,从配置、交付、监控、操作及分析各运维场景的自动化,全面提升数据中心技术运维的工作效能。

 


产品特点

l 资产全方位的管理,自动发现网络设备拓扑,网络资源统一管理。
l 多种方式实现设备链路监控。可自定义重点设备告警监控配置。可自动化实现运维报告(日报、周报、月报,等)。
l 业务部署和网络配置自动化管理。
l 定义专家知识库,可实现告警自动化处理。
l 服务器零配置部署。
 

产品功能

1. 资产管理
l 全方位的资产管理
· 数据中心:数据中心/机房/机柜
· 物理实体:服务器/虚拟服务器/存储/网络设备/链路/数据库/中间件
· 备件:Disk/hba卡/hca卡/网卡/ssd卡等
· 逻辑实体:标签/凭证/公共网络资源
· 其他:文档/供应商/磁盘划盘

 
l 全视角设备管理
· 设备配置的保存和恢复
· 性能和告警配置:告警阈值、告警屏蔽
· 对象管理工具:终端、其他管理工具
· 对象信息的增删改查
· 批量设备信息的导入/导出

 
l 链路管理
· 链路状态监控
· 链路信息手动配置
· 链路信息自动查询
· 链路信息详情


 
l 网络公共资源管理
· 公共资源统一管理
· 资源分配方式灵活(手动分配&自动分配)
· 公共资源分配可定制(数据中心&机房)


 
l 标签管理
· 重点设备监控
· 评估运维人员的KPI
· 厂家设备性能评估


 
2. 性能告警监控
l 性能监控
· 监控所有具备性能特性的对象
· 支持多种图形的展示方法:热图、折线图、柱状图、饼图、状态面板、日志信息等
· 支持基于时间轴的放大和缩小
· 支持不同时间段的性能比较
· 支持图标和日志的时间范围联动显示
· 支持自由的数据钻取和分析


 
l 告警事件处理
· 当前告警的消息分发、处理和查询
· 历史告警
· 告警屏蔽

 
l 专家知识库
· 提供运维经验积累平台
· 丰富的告警处理过程记录,为运维人员提供解决问题的思路和处理步骤


 
3. 业务部署
l 基于业务的资源编排自动化

 

l 基于业务链的资源编排
· 面向业务的资源编排。基于租户的VPC业务需求,实现不同可用区、不同数据中心、不同安全策略的自动化部署,实现策略定义和业务编排
· 拖拽体验,所见即所得。提供界面化的业务拖拽编排能力,满足各种个性化的业务网络互通需求。
· 异构设备的统一管理。将虚拟对象,映射到不同厂商的设备或云平台,屏蔽了下层设备的差异。


 
4. 其他应用场景
l 脚本管理
· 脚本集中管理。
· 脚本执行管理。脚本的运行参数、运行在那个服务器、运行方式管理。


 
l 拓扑展示
· 物理设备多元化监控方式。通过SNMP TRAP/Syslog等多种方式对用户全网设备进行监控告警;通过不同颜色显示网元或链路的不同状态;用户可以通过拖拽的方式调整图标位置,按自己喜欢的方式调整拓扑图显示。
· 虚拟网络/物理网络拓扑,尽在掌握。分层显示虚拟和物理网络;逻辑网元和物理网元的关系一目了然。


 
l 日志分析
· 安全日志
· 操作日志
· 运行日志


 
l 控制台
· 整体把控数据中心的运行状态
· 可基于客户的需求灵活定制
· 可轮播展示多区域拓扑信息和监控信息


 
l 服务器零配置部署
· 事先针对不同的操作系统建立配置文件和操作系统image
· 服务器安装的操作系统版本可控
· 减少运维人员的重复劳动

 

典型应用案例

国家质量监督管理总局广州机房自动化运维

随着业务需要而不断发展,广州数据中心需要管理对象的数量、规模及复杂度均呈现指数级增长,传统人工干预、保姆式管理监控与故障处理的方式无法满足要求,难免会出现这样那样的问题,靠人工发现不仅速度慢,而且容易误判,此时统一纳管平台是数据中心越来越迫切的需求,客户通过太阳集团tcy8722智能运维设备统一纳管平台,实现设备管理的规范化、配置管理的精细化,对机房内的设备进行全生命周期管理,通过系统、科学的管理方式,全面提高技术保障水平。
· 建设基础架构监控子系统,对IT资源的性能数据、事件数据进行采集,通过多种直观方式、多个视角对整个IT系统运行的综合、全面、集中监控展现,以达到及时了解目前IT环境中各个组件的运行状况的目的。
· 建立多渠道告警机制,实现告警信息、级别及监控点限值的自定义管理,可通过多种渠道对运维人员进行告警通知。
· 实现机房可视化管理,可展示机房设备位置及详细信息,可通过搜索定位设备的机柜位置和U高,同时可进行位置变更操作。
· 初步建设运维自动化系统,以减轻广州灾备中心机房运维过程中所面临的压力,使日常运维操作标准化,最大程度的减少人为失误,降低人力成本,提高运维的效率和质量。