电力+AI,「国网云智」重构电网运维的"超级大脑"

简介: 在深夜,当城市楼宇渐入梦乡时,在国网信通公司云运营中心还有一批运维工程师默默守护着大家微弱的灯光、此起彼伏的沟通声、咔咔的键盘敲击声响彻着每个工位。当某系统的异常警报亮起时,工程师迅速利用「国网云智」定位问题,屏幕上即刻弹出详尽的排查方案及解决方案;而另一侧的监控员框选闪烁的告警区域,系统已自动锁定故障点,并在生成检修方案上标注了对应的工具清单和操作优先级。

在这之前当告警发生时,运维人员需要快速查阅大量产品和技术文档、或是召开多方视频会议进行故障根引排查。该系统聚焦全网一朵云的问题分析与解决,目前主要为保障总部云平台运维运营提供支撑,并向全网开放试用。如今国网信通公司率先实现云平台运维智能诊断体系革新,使得繁杂的运维工作流程得到简化。


这一创新背后,是国网云运维团队一场自我迭代的探索,也是能源领域数字基础设施平台运维智能的变革创新。

image.png

能源行业智能化转型(创意图,非真实场景)


践行"人工智能+"行动,打造智能运维新标杆

当前,国家正在推进构建新型能源体系和加快建设新型电力系统,而电力系统“双高”、“双峰”的特性也越发突出,电网体系亟需通过技术手段加速智化升级,以应对复杂的电力调度、负荷预测、营销服务等多领域降本提效需求。


2020年起,国家电网建成了由阿里云飞天企业版云计算平台“一云多Region”能力提供支撑的、覆盖全国的超大型云计算平台,正是为了更好的支撑各种场景日益增长的智能化需求。面向能源革命与数字革命深度融合的时代命题,国网信通公司云运营中心积极落实公司关于“能源数字化智能化发展”和“人工智能+”的政策要求和相关工作部署,依托于光明电力大模型及国网云智能运维体系,联合阿里云共同构建了国家电网智能运维大模型「国网云智」,以全链路、全方位的智能化能力支撑总部运维工作,并在后续向全网开放试用,该运维系统于2025年6月正式上线。


「国网云智」以"专业性+可靠性+规范性"三大智能化能力为核心,实现了"运维知识智能问答-线上问题精准定位-检修方案智能生成"智能,开创性实现云平台运维效率与质量双提升。标志着我国能源领域云平台智能运维方面的重要突破,为保障国家能源安全注入科技新动能。


突破运维技术瓶颈, 构建三大核心能力

聚焦全网一朵云的问题分析与解决,国网信通公司云运营中心构建了三大能力体系:


运维知识智能问答-智能知识中枢破解专业壁垒

国网云平台涉及的服务器数量多、产品组件丰富、业务系统庞大,不容有失。而日常的运维场景中,专业知识分散于海量文档与人员经验,新员工需数月培训才能独立操作,故障应急时跨部门协调耗时耗力。


「国网云智」通过阿里云大模型应用工具链搭建智能问答平台,实现高效的大模型检索增强生成。依托国家电网多年专业运维团队沉淀的专业语料智能知识库,并通过“问题补齐+命中策略+特定提示”方式提高问题准确率,创新应用基于RAGAS 改良后的RAG评测方法,为语料评测优化提效,让运维人员通过语言交互,即可所见即所得的获取运维所需专业知识。使运维领域各种产品技术文档和复杂的技术原理"看得见、学得会、用得上",实现全栈云产品知识覆盖率与召回率达80%。


云平台运维人员实现知识获取效率跃升,确保技术规范动态同步,为运维决策提供即时、标准化的知识支撑,也大大降低了人员培养成本。


线上问题精准定位-4K诊断体系重塑处置流程

云平台体系庞大,一个故障常涉及多个系统耦合问题,传统排查依赖人工逐层筛查日志,流程冗长且跨区域诊断标准不一。


依托于"问题现象-关键报错-排查方案-处理方案"四位一体4K(Key Elements,关键要素,指通过关键要素定义一个问题场景)诊断体系和大模型智能诊断引擎能力,「国网云智」将异常定位效率提升40%。


对于高复杂性的云平台架构,智能诊断体系的建立,搭建了从问题定位到问题解决的高效处理链路,推动故障处理流程规范化,减少了人为经验差异影响,也显著提升复杂问题处置效率,实现智能一体化运维。


同时,在诊断的过程中,还持续积累“处置案例”库,形成可复用的诊断知识资产,为持续优化算法提供了高质量数据集。


检修方案智能生成-助力智能检修,推动标准升级

国网云平台每年大量的检修任务,包括日常的运维和升级操作,需要遵守安全生产规范要求,严格依照检修方案执行,但人工编制检修方案不仅仅耗时耗力,且复杂场景下易遗漏关键风险点,也难以快速响应突发性运维检修需求。


「国网云智」系统深度融合智能生成技术,通过自主学习国网云运维标准规范、数万份历史运维检修方案,实现风险分析自动化、方案生成智能化。通过智能检修方案生成,让云平台标准化检修方案编写效率提升40%,切实筑牢安全生产防线。


实现检修流程强一致性管控,规避人为疏漏风险,同时支持分钟级方案输出,有效提升应急响应能力与安全生产水平。


领航行业创新发展,谱写智慧能源新篇

作为国网信通公司云运营中心与阿里云协同创新的典范,「国网云智」的成功研发具有重大行业意义:

  • 开创电力行业云平台智能运维新范式,深度整合大模型技术与二十余年行业知识资产,率先实现云平台智能运维体系革新;
  • 构建行业级技术标准体系,输出覆盖运维诊断、方案生成等环节技术规范,形成可复制的能源运维和安全生产流程范式;
  • 通过持续优化故障响应机制、提升云平台运维效率,全面推动电网运维服务向智能化、标准化进阶,培育智能电网发展新动能。


未来,「国网云智」将在现有成果基础上,深化智能问答、线上问题定位等多场景应用,持续提升系统稳定性与服务响应效率。


当前全球正在处于新一轮产业革命浪潮中,人工智能技术已经成为核心驱动力,也是构建新型电力系统的关键支撑力量,在提升电网灵活性、智能性及可靠性方面展现出显著价值。


国家电网于2024年12月发布了光明电力大模型,其千亿参数规模支撑了从电网规划、客户服务等多个方面的全链条智能化升级,展现了AI作为新型电力系统"超级大脑"的战略价值。


「国网云智」与阿里云的协同创新,构建"可观、可测、可控"的国网云智能运维新体系和新机制,正是基于光明电力大模型技术成果上的又一次探索,不仅为能源安全与绿色转型、为新型电力系统建设提供核心驱动力,也为"人工智能+能源"落地创新提供了生动的实践样板。

相关文章
|
3天前
|
存储 人工智能 自然语言处理
DeepSeek R1+Open WebUI实现本地知识库的搭建和局域网访问
本文介绍了使用 DeepSeek R1 和 Open WebUI 搭建本地知识库的详细步骤与注意事项,涵盖核心组件介绍、硬件与软件准备、模型部署、知识库构建及问答功能实现等内容,适用于本地文档存储、向量化与检索增强生成(RAG)场景的应用开发。
104 0
|
3月前
|
资源调度 运维 容灾
中国广电云,全国首个多Region2.0架构升级正式完成并亮相2025CCBN!
2025年4月25日,中国国际广播电视信息网络展览会(CCBN)在北京圆满落幕,在中国广电集团的展台上,阿里云支持建设的“国家文化专网基础设施——中国广电云”接待国家广电总局领导及广电传媒行业专家的参观指导,安全自主、文化特色、全国覆盖、产业智能等中国广电云的鲜明特点给莅临展位的行业同仁留下了深刻的印象。
111 4
|
6月前
|
供应链 安全 Cloud Native
阿里云飞天企业版获【可信云·容器平台安全能力】先进级认证
阿里云飞天企业版容器系列产品获中国信息通信研究院【可信云·容器平台安全能力】先进级认证,这是飞天企业版容器产品获得《等保四级PaaS平台》和《 云原生安全配置基线规范V2.0》之后,本年度再一次获得行业权威认可,证明飞天企业版的容器解决方案具备符合行业标准的最高等级容器安全能力。
189 8
阿里云飞天企业版获【可信云·容器平台安全能力】先进级认证
|
2月前
|
运维 容灾 安全
国网安徽电力与阿里云联合完成行业首个全场景容灾演练
在安徽合肥的一座不起眼的数据中心里,一场没有硝烟的“战役”悄然打响。这不是一次普通的系统升级,而是一场关乎全省电网稳定运行的关键演练——这是一场关于数据、系统、故障和时间的较量,将验证电力系统背后的数据中心在碰到故障时,是否能够做到“不停电、不掉线”。 这场演练的主角,是我们身边默默守护万家灯火的电力人——国网安徽电力以及背后的技术团队,大家的目标是在极端情况下保障电网云平台稳定运行,确保每一台服务器、每一套业务系统“永不宕机”。这次演练,不仅是加速构建新型电力系统、增强电网“灵活可靠”的一次探索,也是能源电力行业迈向智能化、数字化过程中的一次真实实践。
110 11
|
2月前
|
人工智能 运维 安全
十年同行,阿里云飞天企业版支持中国企业扎根全球
今天,在阿里云主办的「2025中企出海大会」上,阿里云飞天企业版(Apsara Stack)正式发布最新国际化产品与服务能力,全面助力中企出海和国际市场。阿里云专有云应急服务负责人张淑芬在大会发表“飞天企业版-本地化专有云计算服务”主题演讲,深入解读飞天企业版面向中企出海的三大核心产品解决方案,以及阿里云在全球化部署与生态合作方面的实践成果与战略布局。
121 1
|
2月前
|
人工智能 城市大脑 运维
2025数字中国建设峰会:阿里云+AI深入千行百业
近日,第八届数字中国建设峰会在福州召开。峰会期间,阿里云及通义大模型服务政企的一批领先成果被重点展示。
295 1
|
3月前
|
人工智能 开发工具
阿里云AI Stack全量适配Qwen3模型,企业级部署效率全面升级
2025年4月29日的凌晨5点,阿里全新一代模型通义千问Qwen3正式发布并全部开源8款「混合推理模型」,包含: 6款Dense模型:0.6B、1.7B、4B、8B、14B、32B。 2款MoE模型:Qwen3-30B-A3B和旗舰版Qwen3-235B-A22B。 阿里云AI Stack已适配全量Qwen3模型,可快速部署实现Qwen3模型的开箱即用!
198 4
|
3月前
|
存储 人工智能 安全
阿里云双项入选首批智算一体化权威评估 以AI Stack加速政企智能化升级 ——万卡智算集群服务推进方阵(ICCPA)第三期沙龙在京举办
2024年4月9日,中国信通院主办的智算集群服务沙龙第三期在京召开。阿里云凭借领先的AI技术能力,成为首批通过《面向大模型的智算一体化解决方案》评估的云厂商,并入选行业应用案例。会上,阿里云AI Stack赋能政企大模型高效落地,提供软硬一体推理优化框架,支持主流开源模型快速适配,助力企业构建高性能私有化AI服务,已在政务、金融等领域广泛应用。
184 6
|
3月前
|
人工智能 运维 监控
阿里云携手神州灵云打造云内网络性能监测标杆 斩获中国信通院高质量数字化转型十大案例——金保信“云内网络可观测”方案树立云原生运维新范式
2025年,金保信社保卡有限公司联合阿里云与神州灵云申报的《云内网络性能可观测解决方案》入选高质量数字化转型典型案例。该方案基于阿里云飞天企业版,融合云原生引流技术和流量“染色”专利,解决云内运维难题,实现主动预警和精准观测,将故障排查时间从数小时缩短至15分钟,助力企业降本增效,形成可跨行业复制的数字化转型方法论。
123 6
|
10月前
|
人工智能 安全 专有云
2024云栖大会专有云产品技术论坛开放报名
飞天企业版是阿里云为政企客户构建的企业级专有云平台,与阿里云公共云同根同源。面向智能时代,飞天企业版再次升级。本论坛将系统介绍飞天企业版在一云多芯、一云多算等方面的最新能力升级,并围绕智算场景,分享底层平台支撑能力和上层智能应用实践,为政企打造新一代稳定安全、开放智能的大规模AI基础设施,助力智能化应用在政企全面落地。
208 8