科技创新推动数字经济跨越式发展,迫切需要数字政府、智慧城市协同发力。2023年,在H省审计厅组织的全省信息化专项审计中,审计组了解到部分政务云存在闲置,与云资源利用的高效性和经济性原则背道而驰,于是省审计厅以政务云资源高效利用为重点方向,通过审计调查摸清各地政务云现状,发现“租比建贵”“用少租多”“低需高配”等闲置浪费现象较为突出,通过研判分析问题原因,提出意见建议,促进政务云管理有据可依,让有限的财政资金真正地用在刀刃上。
初识虚无缥缈的“云”
政务云是指运用云计算技术,统筹利用已有的机房、计算、存储、网络、安全、应用支撑、信息资源等,为政府部门提供全面的基础设施、支撑软件、应用系统、信息资源、运行保障及信息安全的综合服务平台。目前,各地党政机关已逐步由自建机房转变为以政务云方式统一管理公共信息平台,旨在实现政府业务的集约化运行和资源的优化配置,进而提升政府资金的使用绩效、公共服务和社会管理能力。
在2023年H省审计厅组织的全省信息化专项审计中,审计组发现某单位政务云资源闲置浪费现象较为突出,某信息系统租用的云资源存储空间超过10TB,实际全年使用量却仅为数百GB。管理单位与用云单位相关工作人员对政务云“由建转租”规律性认识不够,缺乏专业技术知识,监管不到位,当年实际按租用空间付费,与云资源利用的高效性和经济性原则背道而驰。基于这一发现,省审计厅数据处决定以问题为导向,将政务云资源高效利用作为重点方向,按照“高站位、小切口”的创新模式,通过审计调查摸清各地政务云现状,分析问题原因并提出意见建议。
政务云审计可促进政府资金的合理使用,预防云资源滥用与浪费现象的发生。通过云资源绩效审计能够评估政务云项目的实际效果,帮助云资源管理部门优化资源配置,提高服务效率。然而,政务云审计涉及的技术复杂性较高,政务云服务具有动态性和弹性特点,云服务的资源分配和使用情况会根据需求实时变化,这些对审计工作的及时性和灵活性提出了挑战。探究这朵“云”实属不易。
抓住踪迹难寻的“云”
3月上旬,调研组组长老陈带着业务骨干小尹与技术专家小刘前往J市政务服务和数据管理局开展座谈。会上,J市政务云主要负责人马主任介绍了信息化系统建设运维、政务云建设及政务云资金等基本情况。据悉,2019年3月J市政务云管理的职能划转到大数据中心,新成立的J市数据局挂牌,J市政务云由政府投资公司出资建设统一云管机房,将全市所有委办局的信息系统全部迁移,用云单位提出信息系统的硬件资源需求后,由大数据中心统一汇总再与云服务商签订合同,在投资期合同结束后,以上年最终的资源量和开通量为依据重新招标签订合同,并且按季度付费,确保服务质量,年终还要聘请第三方机构开展结算审计。与以前自建机房相比,全市机房硬件由一个服务商统一管理,出现故障统一响应,极大节约了人力资源开支。由建转租之后,全市各单位系统通过云资源统一管理,每年可以节约费用达千万元级。
听完介绍后,老陈说道:“我们想再了解下云资源在‘管’层面的相关情况,是否出台政务云管理制度,有没有采取措施控制资源的申请与使用,有没有出现闲置浪费现象?”
云资源服务商高工迅速答复:“我们有专门的云管理平台,技术人员会定期通过云平台后台数据抓取相应的信息,向大数据中心提供云资源使用情况月报,反馈全市各信息系统支撑服务器的资源使用情况,并且在用云单位申请资源时,我们一般会砍掉一半的资源需求再开通,当他们系统运行占用率高的时候我们才会增加资源,所以我们开通资源已经是最节约的状态了。”
调研组技术专家小刘问:“现在主流的云管理平台有华为云、阿里云、腾讯云和紫光云等,你们使用的是哪家?麻烦你们登录并演示一下。”高工登录后,小刘对平台技术人员提出了一连串云管理平台核心技术指标相关问题:平台能否展示全市有多少个信息系统上了政务云,后端涉及多少台服务器,可否看到平均利用率、最大利用率、最小利用率等指标,平台可追溯最早的资源信息是什么时间,对运行超过高低阈值的资源是否有提醒,资源运行情况可否导出,等等。经过座谈,调研组摸清了云管理平台相关情况,取得了服务商现场导出的近12个月云资源使用情况表及大数据中心盖章的云资源服务月报。
调研组拿着数据立马开展了基础性比对,小尹发现云服务商的运维月报“只报高、不报低”,只提醒资源使用率排名较高的前20台云服务器需要进行扩容,而对使用率低的云服务器情况未在月报中进行反馈。小刘迅速检索了12个月的云资源使用情况表,发现不足1%的云服务器计算资源接近最高预警值,70%的计算资源使用率均值不足20%,甚至有的计算资源利用率不足1%,这些情况运维月报中均未反映。另外,还发现部分新开通的云服务器初期利用率极低。基于以上发现,老陈建议:“新系统上线时用户少、数据少,所需资源少,估计都是按系统设计的满负荷状态申请资源,怪不得各部门申请时就要砍一半呢。按照目前J市的资源真实利用率来看,再砍三刀都不嫌多,我们现在就以现场导出的资源利用率表,分别测算一下近一年CPU、内存和存储是否存在闲置浪费情况。”
存储资源会随着使用时间不断增长,使用空间越来越多,闲置空间越来越少。调研组参考云资源管理先行地区计量计费标准,很快拟定了存储资源计量方案,即当天实际用量加15%冗余作为应开通量,超出应开通量部分算作闲置量。调研组对CPU与内存合理用量标准展开了激烈的争论,因为这两个指标每分每秒的利用率都在变化,到底该选择平均利用率,还是最大利用率作为服务器稳定运行的核心衡量指标,审计组对此存在较大分歧。
“采用平均使用率会将日间的正常使用率与夜间的低谷使用率中和,会拉低日间政务系统密集办公期间系统承受的实际压力均值,得到的并非真实的政务云资源平均使用率。采用最大利用率可能会导致一个偶然的峰值取代其他所有平均值。例如,一个人的正常心率是80次/分钟,但如果某天他进行了一次100米短跑,心率可能会上升到180次/分钟,我们不能以这次的180次/分钟作为他一个月心率的代表,因为这会使数据失真。那么,我们应该使用哪种指标来计算呢?”小刘首先提出了这个棘手的问题。中午的讨论尚未得出结论,下午调研组继续前往已经更名的J市数据局研究云管理平台后台的相关指标。
当技术人员展示到一个特定指标时,老陈提出了疑问:“等一下,这个CPU最大峰值均值是什么意思?”高工解释道:“这是指在监测总周期中,将每个监测频次内CPU的峰值使用率累加,然后除以监测总周期内的采集次数,得到的结果计算出最大峰值均值。”调研组三人相视一笑,立刻明白了最大峰值均值是最适合评价周期内计算资源需求量的指标。于是,调研组迅速要求J市数据局重新提供近一年每台云资源服务器的开通与关停时间、CPU核数、内存量、存储量、峰值均值等指标数据。
在确定了数据定性方法后,调研组通过反复计算与核定,迅速完成了对所有利用率较低的云资源服务器资源闲置的定量工作。
拨开烟雾笼罩的“云”
在与J市数据局沟通前,调研组进行了沟通模拟。小尹一针见血地指出:“合同约定非常明确,服务商需要定期向大数据中心提供使用率情况,并提出合理的动态配置调整建议。而实际上,服务月报只反馈高使用率,不反馈低使用率的情况,一味要求甲方增加资源配置,导致甲方计算资源只增不减,这是问题的本质。”
老陈提醒道:“J市尚未出台政务云相关的管理办法,甚至全省都没有可参照的标准性依据,我们的方向没有问题,但计算依据可能会受到质疑。”
“国内政务云资源管理先行地区已出台相应的地方标准,比如W市对CPU、内存、硬盘分别进行了使用率均值的阈值设置,使用率峰值的平均值低于30%,原始配置要减半,处于30%至85%时维持不变,大于85%才增至原配置的1.5倍。又如省外的B市、C市等地,也都有相关的规定,我们省内的兄弟地市也有类似标准,都是为了实现资源动态调配,考虑我省实际,发挥政务云的最大优势,集约管理、降本增效,结合多种指标及算法得到定量结果。”小刘介绍算法。
老陈继续说道:“我们可以从结果中选取几个案例,厘清责任边界。哪些闲置是用云单位导致的,哪些是云服务商反馈不到位导致的,哪些是服务商反馈后数据局未落实管理责任导致的,这些都需要考虑清楚。”
按照安排,调研组开始与J市数据局进行正式沟通。小刘在介绍完算法后,开始讲案例、摆事实:“在进行数据核对、费用重算的过程中,我们发现三类突出现象。一是停而未关,如A项目涉及的一个临时性信息系统,项目2022年10月已经完工并结项,项目办已撤销,该系统应同期停用下线,但截至目前系统还在租用资源,实际系统当前只用于存放数据。数据局多次提醒用云单位迁移数据,但用云单位迟迟未实施,资源一直无法下线。二是用短租长,如某查分系统每年仅需线上运行1个多月,该时段内仅2天左右时间访问量较大,其余时间均无任何访问需求,但按照最高访问量标准开通全年资源,云服务商月报中未将该系统情况全面反馈。三是低需高配,如某系统涉及的服务器集群,在系统初设中明确,稳定运行3年后存储预计会达到30TB,该系统在部署时划分15TB存储空间,但实际该系统每月数据增量不足40GB。截至目前,该系统运行半年数据不足300GB。”
“各类情况最终回到合同上来,需要谨慎研究合同对甲乙方涉及云服务计时、计量、计费及权责分工,这些是定责的关键。”老陈接着小刘的话,在调研组情况反馈会议上详细阐述,并将省内外各地关于云资源的管理制度及细则向大家进行了介绍。听完意见反馈后,J市数据局工作人员和云服务商当即认清存在的问题,并表态立行立改,收集学习行业规范,制定与本市实际相适应的操作细则。
在一个月的时间里,调研组走访了多个地市,收集了相关数据,摸清了实际情况。经过详细的研讨,出具了一篇聚焦强化源头治理、规范管理、提升政务云资源的财政资金绩效的专项调研报告,准确、清晰地描述了政务云管理方面的漏洞,深度挖掘了问题产生的原因,提出了专业意见建议。省数据局、财政厅联合发文,要求全省持续整改,省数据局随即启动了全省政务云管理指导意见的制定工作。政务云从“无人问”到“有人管”,有限的财政资金真正地用在了刀刃上。
案例总结
该审计调查项目为开展政务云审计提供了方法,总结如下:
一是对新事物进行了细致入微的审慎研判。审计项目开展之初,认真总结以往信息化审计项目方法和经验,从大量的数据中找到资源利用率这个突破口。同时,关注行业性信息,积极与政策接轨,锁定“政务云”这个抓手。
二是摆脱传统审计思维,充分发挥大数据审计优势。本案例中,审计组从信息化工作模式中找落脚点,以结果为导向,抓牢客户需求和云资源弹性伸缩特征的平衡点,充分发挥大数据审计优势,贯通数据要素,让用云的主观体感变为可以量化的财政指标。
三是政策制度的量化计算依据充分、科学严谨。审计过程中,政务云调配规则尚无全国性、省级标准,部分现行地区的参考阈值就显得格外重要。审计组收集了能够查询到的全部信息,并与云服务商进行充分沟通,确认计算方法,得出的结果得到多方认可,同时也为区域标准的拟定提供了参考。
作者:何勇 胡惊雷 刘颖
扫一扫在手机打开当前页面