在这之前当告警发生时,运维人员需要快速查阅大量产品和技术文档、或是召开多方视频会议进行故障根引排查。该系统聚焦全网一朵云的问题分析与解决,目前主要为保障总部云平台运维运营提供支撑,并向全网开放试用。如今国网信通公司率先实现云平台运维智能诊断体系革新,使得繁杂的运维工作流程得到简化。
这一创新背后,是国网云运维团队一场自我迭代的探索,也是能源领域数字基础设施平台运维智能的变革创新。
能源行业智能化转型(创意图,非真实场景)
践行"人工智能+"行动,打造智能运维新标杆
当前,国家正在推进构建新型能源体系和加快建设新型电力系统,而电力系统“双高”、“双峰”的特性也越发突出,电网体系亟需通过技术手段加速智化升级,以应对复杂的电力调度、负荷预测、营销服务等多领域降本提效需求。
2020年起,国家电网建成了由阿里云飞天企业版云计算平台“一云多Region”能力提供支撑的、覆盖全国的超大型云计算平台,正是为了更好的支撑各种场景日益增长的智能化需求。面向能源革命与数字革命深度融合的时代命题,国网信通公司云运营中心积极落实公司关于“能源数字化智能化发展”和“人工智能+”的政策要求和相关工作部署,依托于光明电力大模型及国网云智能运维体系,联合阿里云共同构建了国家电网智能运维大模型「国网云智」,以全链路、全方位的智能化能力支撑总部运维工作,并在后续向全网开放试用,该运维系统于2025年6月正式上线。
「国网云智」以"专业性+可靠性+规范性"三大智能化能力为核心,实现了"运维知识智能问答-线上问题精准定位-检修方案智能生成"智能,开创性实现云平台运维效率与质量双提升。标志着我国能源领域云平台智能运维方面的重要突破,为保障国家能源安全注入科技新动能。
突破运维技术瓶颈, 构建三大核心能力
聚焦全网一朵云的问题分析与解决,国网信通公司云运营中心构建了三大能力体系:
运维知识智能问答-智能知识中枢破解专业壁垒
国网云平台涉及的服务器数量多、产品组件丰富、业务系统庞大,不容有失。而日常的运维场景中,专业知识分散于海量文档与人员经验,新员工需数月培训才能独立操作,故障应急时跨部门协调耗时耗力。
「国网云智」通过阿里云大模型应用工具链搭建智能问答平台,实现高效的大模型检索增强生成。依托国家电网多年专业运维团队沉淀的专业语料智能知识库,并通过“问题补齐+命中策略+特定提示”方式提高问题准确率,创新应用基于RAGAS 改良后的RAG评测方法,为语料评测优化提效,让运维人员通过语言交互,即可所见即所得的获取运维所需专业知识。使运维领域各种产品技术文档和复杂的技术原理"看得见、学得会、用得上",实现全栈云产品知识覆盖率与召回率达80%。
云平台运维人员实现知识获取效率跃升,确保技术规范动态同步,为运维决策提供即时、标准化的知识支撑,也大大降低了人员培养成本。
线上问题精准定位-4K诊断体系重塑处置流程
云平台体系庞大,一个故障常涉及多个系统耦合问题,传统排查依赖人工逐层筛查日志,流程冗长且跨区域诊断标准不一。
依托于"问题现象-关键报错-排查方案-处理方案"四位一体4K(Key Elements,关键要素,指通过关键要素定义一个问题场景)诊断体系和大模型智能诊断引擎能力,「国网云智」将异常定位效率提升40%。
对于高复杂性的云平台架构,智能诊断体系的建立,搭建了从问题定位到问题解决的高效处理链路,推动故障处理流程规范化,减少了人为经验差异影响,也显著提升复杂问题处置效率,实现智能一体化运维。
同时,在诊断的过程中,还持续积累“处置案例”库,形成可复用的诊断知识资产,为持续优化算法提供了高质量数据集。
检修方案智能生成-助力智能检修,推动标准升级
国网云平台每年大量的检修任务,包括日常的运维和升级操作,需要遵守安全生产规范要求,严格依照检修方案执行,但人工编制检修方案不仅仅耗时耗力,且复杂场景下易遗漏关键风险点,也难以快速响应突发性运维检修需求。
「国网云智」系统深度融合智能生成技术,通过自主学习国网云运维标准规范、数万份历史运维检修方案,实现风险分析自动化、方案生成智能化。通过智能检修方案生成,让云平台标准化检修方案编写效率提升40%,切实筑牢安全生产防线。
实现检修流程强一致性管控,规避人为疏漏风险,同时支持分钟级方案输出,有效提升应急响应能力与安全生产水平。
领航行业创新发展,谱写智慧能源新篇
作为国网信通公司云运营中心与阿里云协同创新的典范,「国网云智」的成功研发具有重大行业意义:
- 开创电力行业云平台智能运维新范式,深度整合大模型技术与二十余年行业知识资产,率先实现云平台智能运维体系革新;
- 构建行业级技术标准体系,输出覆盖运维诊断、方案生成等环节技术规范,形成可复制的能源运维和安全生产流程范式;
- 通过持续优化故障响应机制、提升云平台运维效率,全面推动电网运维服务向智能化、标准化进阶,培育智能电网发展新动能。
未来,「国网云智」将在现有成果基础上,深化智能问答、线上问题定位等多场景应用,持续提升系统稳定性与服务响应效率。
当前全球正在处于新一轮产业革命浪潮中,人工智能技术已经成为核心驱动力,也是构建新型电力系统的关键支撑力量,在提升电网灵活性、智能性及可靠性方面展现出显著价值。
国家电网于2024年12月发布了光明电力大模型,其千亿参数规模支撑了从电网规划、客户服务等多个方面的全链条智能化升级,展现了AI作为新型电力系统"超级大脑"的战略价值。
「国网云智」与阿里云的协同创新,构建"可观、可测、可控"的国网云智能运维新体系和新机制,正是基于光明电力大模型技术成果上的又一次探索,不仅为能源安全与绿色转型、为新型电力系统建设提供核心驱动力,也为"人工智能+能源"落地创新提供了生动的实践样板。