【文字实录】星环科技 王耀锋:基于国产基础软件的水电数据底座方案与实践 ——2023年发电企业数字化转型研讨会(智慧水电)

 

主持人:

    数字化转型里面,转型基础就是数字底座,上午有专家谈到数字化转型的构建思路,实际上对于底座,尤其是相关安全方面并没有深入的讲解。今天下午请到形环信息科技(上海)股份有限公司电力行业解决方案高级专家王耀锋给我们重点讲解“基于国产基础软件的水电数据底座方案与实践”,欢迎王总。
    
    王耀锋:谢谢主持人,各位领导,各位嘉宾,大家下午好!上午分享了很多数字化转型相关的业务场景,AR、VR等等。我们在水电行业里面做数字化转型的时候,从上到下,从数据底座再到数据应用,我们还要额外讨论一下单独去考虑数据底座要怎么样建设,我这边主要是分成三块介绍。
    一、数据底座建设情况。
    我们目前做数据化转型,大部分在三区、四区,三区意思是管理信息化,四区就是我们做的AR、VR、智能巡检、无人机等都在四区,三区、四区数据如何收上来,如何高效收上来这就是我们今天讨论的话题。有三点,入库性能,端的数量规模不断扩大,未来很多水电公司会采购大量的AI设备,数据规模也会不断增长,所以我们未来数据接入需求也会增长,每秒钟会产生百万级别,甚至千万级别实时的流式数据。我们发现很多客户在做数据接入的时候,很多时候是“T+  1”,前一天数据第二天接到三区,然后再去做分析,这种以天为单位无法支撑实时场景,就像前面嘉宾讲到实时的分析、场景,实时诊断和预警这种场景很难满足。所以我们需要采取新的技术,把我们分布在一区、二区以及四区这种海量的实时数据高效接入到三区数据底座里面去,数据底座就要完成海量数据的实时接入。第二是大量存储空间。第三,高效算力。还有最重要的一点是要为上层各种各样数字化应用场景提供易用的接口。
    这是我们建议整体数字化底座的框架,一般一区或者四区的数据都会在感知层,各种各样的生产设备,通过边缘计算或者超级网关的方式把这些数据接入到电网或者是电厂三区里面去进行存储。这里要求单节点接入规模必须要非常的高,百万级别,五近似线性扩展,使用多工厂等等。要具备分析能力,我也跟很多电厂朋友聊过,他们目前在三区侧存实时数据基本上采取大数据平台,放在数据库里,首先压缩比低,效率也不高,所以会在实时库里放一下,所以在三区会形成双数据湖的架构,就会造成大量的资源浪费,我们建议的方案是最好有一个这样的数据库,把全场景都解决掉,支撑各种各样的场景。
    这是我们设备接入的架构,可以形成数据流和控制流双向协同和云边协同,通过边缘计算等方式把电厂设备通过协议接入云端,云端进行建模管理后再把数据模型下发到边缘端,边缘端在反控设备,给解析提供各种各样的建议。这里除了时序数据外,也可以对流媒体数据进行统一接入和边缘计算。
    接下来是整个实时数仓,接入就要构建实时数仓,首先要求非常快,整个入库性能,要求整个数据底座至少达到百万级的级别,入库之后要马上查到我们的数据,数据入库过程中需要跟生产侧相应做高效的交互,实现流批一体化的监视。
    基于实时数仓建设后,就会形成智能决策大脑,所有数据都基于数仓建设后,数仓里面可以支撑平常数据查询,做分析,做机器学习算法,做检索等等,基于大脑构建知识图谱,进行运行指标在线监测、故障预警等等各种各样的场景,这是星环数据底座的架构,数据进来后可以实时跟我们三区关系性数据进行关联分析,同时一区数据进来后进行非机构化数据解析,实时数据订阅等等,进来以后就可以处理,这时就可以做各种各样实时预警工作。
    二、数据底座的实践。
    第一个场景是我们在广西某个水电企业做的大数据生态云平台,整个方案也规划的比较大,从整个数字电厂边缘侧、无人化电厂,到中间的能力共享层、技术中台、数据中台,以及上面业务的规划,到实现电厂无人管理,运营智慧化的目标。
    这是具体的分层,我们在那个里面做的数据底座整体的分层就会非常的清晰,IaaS层提供计算资源、存储资源、网络资源的基础设施。PaaS是微服务治理、开发运维一体、敏捷开发平台、大数据等。SaaS提供典型基础能力平台支撑,构建各种各样的应用,元宇宙、数字孪生等各种各样新的技术应用。
    第二个应用场景是某个区域能源公司做的数据底座功能架构,或者说技术架构,那边要求完全国产化,底层操作系统、服务器都必须得用国产的服务器,上面假设了一层通用云原生大数据操作系统,,再上面一层是为区域公司数据底座提供数据开发工作,数据资产管理,数据服务,人工智能开发等等,还有知识图谱应用,最后一体化云平台的开发。
    这是数据电厂,我们按照电厂实际情况进行梳理,进行了规划,把时序数据、关系数据、非结构化数据统一到数据水,进行多元数据异构。面向结构化的数据进行主题建模,叫DWD层,电厂生产技术、人力资源、财务资产、安全环保、规划发展等等构建九大主题域,在上一层进行汇总,维度建模层,科目汇总、项目维汇总等等,在上一层应用集市尺建模,数据分析宽标等,在上一层数据应用,生产智能化、管理协同化、决策数字化、服务生态化。右边做了两套标准,一个是数据标准体系和数据安全标准体系,保障我们数据的分级分类安全脱敏。
    这是我们在那边的一个整体数据流转的架构,基本上实现了电厂侧,下面大概有17、18家电厂,电厂侧所有数据通过采集程序,实时接口介入到时序数据库里面,在这里对数据进行全量的存储,同时数据进入三区数据底座后,会在流计算平台里面预制一些预警、故障诊断模型,只要来数据就可以电厂的故障。同时实时数据库会跟关系型数据库进行关联分析,我们叫序关分析。实时数据库里面指标也可以存在数据集市层,供查询。一般时效性比较高可以走流处理链路,BI分析可以走时序加工最后再到BI指导应用。还有一体化应用,拖拉拽各种各样的报表、填报系统可以走OLTP数据库进行存储查询使用。AI会从数据湖底层等提取数据,建模,然后做各种各样的应用。
    第三个应用是新能源集控中心做的一些场景。这也是实时数仓在新能源方面的应用,跟水电也比较像,比如说做了区域监控中心一体化大数据应用,实现集团、分子公司、区域公司、各厂站之间的管理、监视、控制信息纵向管彤,实现三个系统之间数据横向集成,集成到整个大数据底座上去,支撑集控中心层运行监控、生产管理、经营管控等等各种各样的业务。
    这是光伏领域的一些应用场景,可以做光伏厂站数据集成,我们在某一个民营的发电厂里,大概有42个电站,300多万点位数据,全部实现实时接入到三区管理的数据中台里面。接入后做了大量的应用,大屏做了4-5个,几百个报表,基于RIV实时的曲线对光伏生产实时故障进行建模,做预警预测。
    新能源集控中心风机自动运行,采用大数据内存计算技术,融合风机、能量管理平台的全量全样本数据进行实时海量高并发计算,基于这些知识库可以把它内置到风机里去,不断形成风机故障状态辅助判断,自动化的控制等等。
    这是风机设备混合感知,这也是基于大数据技术、物联网技术、AI技术融合的一个方式。我们现在一区控制时序数据可以做故障预警算法等等,互联网区这块,基于现有AI、VR技术,或者是基于语音诊断、图像诊断、无人机巡检等各种各样的技术,实现智能方面的图像分析。两边做一个结合,我时序数据跟流媒体数据,或者是传统数据挖掘的状态分析,跟我们AI状态分析进行一个结合,做一个混合的状态感知和故障预警。能够更高效去发现风机运行的故障,大型设备的运行故障。
    第四块的应用,就是在很多工业互联网领域,工业互联网平台也是业务管理决策的神经中枢与基础底座,以大数据和系统融合为基础,将各个部门海量信息资源进行整合共享,让高价值情报信息快速传递,深度融合5G、大数据、云计算、AI等各方面前沿技术,可以将信息、技术、设备等进行有机结合,担当起监测中心、治理中心、指挥中心、决策中心、展示中心五大职责,最终实现智能感知、智能处置、智能考评、智能改进的场景。
    最后是应用,是我们在其他行业做的实时数仓的案例,我们在国家邮政局接入全国所有的快递信息,快递数据实时进入到我们集团的平台里面去,针对我们邮政里面的三多的问题进行实时预警诊断,发现问题实时进行决策。
    三、星环科技能力介绍。
    最后打一个广告,介绍我们公司国产化的情况。星环从创立之初一直坚持做大数据基础软件开发商,围绕数据集成、存储、治理、建模、分析、挖掘等全生命周期提供基础软件的服务。去年登录科创板,大数据技术从2013年创立之初,我们结合开源的特性,不断去发展,比如2014年的时候,我们把整个大数据计算引擎架构在系统上,所有数据库底层的代码,自有率超过70%,这也是经过工信部电子五所出具的代码扫描报告,不含任何高风险协议。与国产化上下游生态,底层操作系统,CPU、服务器,上面一层中间件、应用厂商形成国产化适配,可以打造从底往上的整套互联网化体系。
    最后是国产化替换方面,我们在中国邮政集团方面,全球首家替换了TERADATA,前一段时间TERADATA退出中国,也是因为国内很多企业替换国外知名数据仓库的软件公司。最后是星环服务体系,提供从平台建设、数据治理业务分析、咨询规划一整套的服务能力。
    我们用户方面,国产化数据底座在全国各个行业里面得到了推广,目前累计已经有1000多家用户,包括在电力领域的电投、三峡等等。
    我今天分享就是这些,感谢大家!

 

注:文字实录未经专家整理核实,仅作参考使用,具体解释权归本次会议主办方所有。

未经授权,请勿转载

打造公司的核心竞争力,成就专业的行业品牌,提供有价值的行业服务。

首页    【文字实录】星环科技 王耀锋:基于国产基础软件的水电数据底座方案与实践 ——2023年发电企业数字化转型研讨会(智慧水电)