视频 | 龙源电力集团运行数据分析及优化中心李韶武:风人风语话数据

<数据猿导读>

在本次《G20能效引领计划下的能源大数据》活动中,龙源电力集团运行数据分析及优化中心李韶武以《风人风语话数据》为主题发表了精彩演讲,李韶武表示:风电虽是清洁能源的主力军,跟火电及其他传统能源相比还具有一定差距,待到2020年,整个风电行业将实现大的突破

10月18日,由数据猿联合中关村大数据联盟、青域基金、中国工业节能与清洁生产协会余热利用专业委员会、百分点集团共同主办的《G20能效引领计划下的能源大数据》活动在北京成功举办。

活动现场主持人:数据猿创始人牟蕾

与会分享嘉宾有:

中国大数据产业联盟常务秘书长 张涛

中国国电龙源电力集团(北京)风电工程技术有限公司运行数据分析及优化中心主管工程师 李韶武

能源基金会工业节能项目主任、中国工业节能与清洁生产协会余热利用专业委员会 指导委员会主任 何平

青域基金 合伙人 牟颖

百分点集团能源行业架构师 董继军

通用电气中国数字创新坊 能源行业战略活动总监 秦川

北京思诺环能科技有限公司 创始人 杨超

沈阳昊宸科技有限公司 总经理 王昱涵

云智环能科技(北京)有限公司 总经理 张隽永


视频版

视频内容

文字版

以下内容为“龙源电力集团运行数据分析及优化中心李韶武”分享,并由数据猿编辑整理发布:

李韶武:首先为大家介绍我们集团的示意图,每一个中心都代表了风电场,在我们的印象中,所有的风电场都是处在比较偏僻的地方。至于风电场是什么样的呢?

我们龙源在戈壁拥有一个风电场,不仅可以看到很多风机、黄羊,还可以挖锁阳,锁阳号称是戈壁滩的人参。除此之外,我们在呼伦贝尔大草原、西藏等多地都拥有自己的风电场,同时西藏风电场也是中国首个藏区风电场,附近的景色十分迷人。

其次是风电场实时的示意图,一个风电场一般情况下是5万的容量,33台风机,这些风机分布在整个风电场里面,我们可以明显感觉到,风电场和其他发电企业存在很大差异。

“风机”跟“飞机”只有一字之差,事实上其构造也跟飞机非常相似,都需要有像机翼一样的叶片,这个叶片旋转吸收风能,风能转化成机械能,再由机械能转化成电能,把电能输入给电网,这就是风机对能源的转化过程。

从外观看,风机的构成并不复杂,仅仅是由三只叶片、一根机舱以及一个塔架组成的,但其实里面是非常复杂的系统。每一个风机都是自成系统,因此需要采集到时时刻刻的数据,并把这些数据收集下来。

下面先给大家展示三个小的案例:

案例一

风电行业采集数据的频率是1秒钟采集一次,实时数据展示都是每秒的数据,每10分钟把这些数据处理完之后,存到数据库里面。在小风速的时候,比如在2米每秒以下的情况下,风机没有发电;而风速比较高的时候,同样也没有发电。这是因为我们风机里面存在切入风速和切出风速,只有在切入和切出之间,风机才是正常的运转状态。此外,当风速已经超过3之后,它还有很多点是处在没有发电的状态,这个我们称之为停机状态。

以前在我们风电领域,有一个指标叫可利用率,就是说正常的运行时间比上总的时间,这称之为可利用率,可以帮助我们一目了然地发现风机是否在运转。可是运营商更多关注的是整个性能和它停机的存储电量。

案例二

再给大家举一个例子,这里有一个1.5兆瓦的风机,1.5兆瓦,换一个说法就是1500千瓦。比如说现在风速是10米,刮一小时就可以得到1500度电。在6米每秒的时候,它的功率只有大概300度每小时,7米的时候可能是400度。

我们现在一个风电场就拥有多台风机,像汽车一样,同一个型号的汽车,或者说同一个型号的风机,它的性能是不是一样的呢?这就需要从数据中来寻找答案,我们这里展示了三个风机的性能,每一个颜色表示一个风机。

不同颜色,可以看出来性能有很大的差异,我们把发电性能分为两部分:即风机之间发电性能的一致性和它的稳定性,对于运营商来说是非常重要的。当我们发现它的一致性出现问题的时候,就想知道它背后是什么原因导致它发生了这些问题?

风电领域,除了刚才跟大家说到的风速和功率之外,我们还收集了很多其他传感器的数据。风电领域里面有非常重要的两个参数,一个是叶片的旋转速度,一个是叶片的角度。

旋转速度其实跟飞机的角度是相类似的,飞机在上升和下降的时候,它的机翼和风的速度是有差异的,这个角度被称为桨区角,风机发电性能不一样,跟它控制策略的参数的差异是一样的。

案例三

除了看风机之间的差异之外,一个风机本身发电性能出现了,但一些点在正常的发电性能之外,这个时候就应该对这些点单独进行分析,要看看它是什么原因,导致发生了这些问题。当一些点都集中在区域的上方时,这个参数我们称之为齿内箱油温,由于齿内箱油温高,导致风机发电性能受到限制。像这样会损失很多电量,也是运营商极力避免的事情。

我们对数据的分析,除了刚才利用可视化的方式之外,还尝试从其他的角度着手。我们会看这些发电性能数据随时间的变化情况,同时我们还会从3D效果的展示上,看是不是能够快速的发现一些问题。

上面给大家简单介绍了风电场的基本情况,和风机的情况。下面进入主题:《风人风语话数据》。

我们龙源是目前国内最早从事风电运营的发电企业,拥有超过11000台机组,分布在200个风电场,全国24个省份都有风电场。在中国每6台风机中,其中就有一台是属于龙源的,风电发出的电里面,每4度里面,有1度属于龙源。我们现在也是国内和世界上最大的风电运营商。

刚才也提到了,运营商非常关注性能损失和停机的损失。我们刚才也通过一台一台手动的形式,用可视化的方法,把这些问题查找出来。当我们面对整个集团一万多台风机的时候,采用这种方式肯定不行。于是就想能不能找到一个更加方便的解决方案,帮助我们自动实现这个问题。

怎么去解决呢?我们一般会考虑到整个风机,它感受到多少风,应该发多少电量出来。如果没有能够正常发出电量,就称之为损失电量,这些损失电量又分为性能问题损失的和停机损失的。

风机的数据是非常异常的,它不像我们想的那么干净和整洁,因此我们在去年做了一个事情,把整个集团的一万多台风机的发电性能的模式做了一个聚类和分析,可以看到一共有8种模式,这8种模式下,每一个不在正常状态的都表示了电量的损失,以及效益上的损失。因此我们非常想知道,哪些因素导致它发生了改变?什么时候发生改变?

因此就有了数据分析的两个重点:我们要先找到发生问题的时间,再找到发生问题的原因。为了找到发生问题的时间,我们用了一个方法,叫变点分析法,该方法目前在金融领域等被广泛应用。这个方法是把风机比较重要的参数,跟性能有关系的,比如说时间、风速、功率,做时间排列,然后自动识别出这些性能在什么时候发生的改变。

我们是2014年把它做出来的,2015年投入运用。2014年在我们集团发生了一件非常有意思的事情。当年在江苏省有一个风电场,买的国内最有名的风机制造厂商的风机,买了之后,前一个星期它的发电性能非常非常好,但是三个月之后,它的性能反复出现问题,有时候特别好,有时候特别差,包括我们的领导,也包括风机厂家都不知道原因是什么。

领导说你们要不然分析一下,我们就把这个数据拿过来,用变点分析法分析了一下,之后发现9个点发生了改变,后来我们又把这些数据跟天气数据进行比对,发现所有的点都跟下雨天对应,什么意思?当下完雨之后,风机的性能马上上升,只要不下雨,性能马上下降。

我们发现这个问题之后,跟厂家一块去现场进行勘察,发现叶片设计的不是很合理,叶片对污染物的敏感性特别高,只要是积累了脏东西之后,性能马上下降,因此我们后来做了一些别的尝试,在2015年把这个方法投入了实际运行。

我们前面也提到了,机组之间的一致性有时候会出现差异。为了分析整个集团的数据,我们做了功率属性异常机组问题挖掘。它是基于系统本身的问题和我们主要关注的一些重要的参数,我们在这里面做了数据之间的分析,并建立了数据分析的模型。

还有机组本身的差异,像这样的发电性能的图,当我脱离正常点之外,它背后一定有一些参数出现了差异。发展这些方法,主要是为了告诉我们,我们能够在什么时间点发现这些性能发生了改变,它背后的原因是什么。

我们刚才说的都是跟性能分析有关系的,我们还有很多停机的问题,今天由于时间原因,就不多做介绍了。这些分析的方法也好,案例也好,都是离散的。我们为了整个集团运用,开发了一个系统,叫效能分析系统。

后面有很多数据,包括我们整个风电行业几乎所有的数据源,一共有8个,同时这个系统提供性能分析和故障分析,能够帮助集团公司,帮助省公司,帮助风电场,发现集团公司内应该关注哪些异常的省份,应该关注哪些异常的风电场,风电场内可以找到异常的风机,并且找到异常原因。

一个运行分析数据部门,每天做这么多分析,并且分析出那么多问题,其实并没有用,因为没有创造出价值。我的发电量还是那样没有提升,这个怎么办?我们想能不能从数据分析中,找到优化的方向,找到优化方向之后,做完了优化,还要评估一下,它是不是真的提升了,这些都是跟数据分析有关系的。

我们在2013、2014年做了很多分析,积累了大量的数据和样本的结果,我们把23个风电场的性能问题进行了分析,并统计了其占全厂的比例。说到性能不佳的原因,其中最应该关注的只有4类,这4类占到所有的75%:第一个是方向标的,第二个组建高温,第三个是控制参数,最后是叶片安装角度。通过这些,发现了我们应该优化的方向是哪里。

前面说了很多数据模型,这些数据模型需要强大的计算能力,尤其是在我们面对很多数据量的时候,我们每一个风电场,每年大概可以产生3T到30个T的数据,整个集团每年的数据量大概是100T到上千个T左右,除了计算能力之外,我们还需要把结果进行统计,通过这些统计发现我们优化的方向,指导我们进行生产和运行。这个就是根据我们前面所发现的那些跟性能有关的问题,所找到的优化的方向。

说完了性能问题,下面就是刚才没有说的停机的问题了,当机器发生故障,就停机了。一般说停机这一块,是针对现场故障问题。我停机时间比较长,停机时机不对,什么叫时机不对?比如说小风电的时候,希望它停,不希望它大风电停。针对这些,我们从大数据的角度做了一些分析。比如说像停机时间长的,我们开发了三个系统:远程基础设施系、智能诊断系统和备件定额存储系统。

说到故障诊断系统,我们收取的都是知识库的数据,也就是一些不能够直接处理的非结构化数据。我们收集了整个集团的所有机型的所有故障数据,把它形成了一个统一的故障数的形式,帮助现场人员快速定位,并快速进行反馈。因为现在每个厂家在这一块的故障数不一样,做完统计数之后,就可以让所有集团用统一的语言进行交流。

我们每一个风电场还制订了备件的消耗需求,可以帮助风电场科学地制定备件消耗的存储计划。

我们在故障运行这一块用了很多大数据的技术,风机什么时候坏,做一个运行就知道了。现在在风电领域有一个更重要的问题是大部件的预警。像叶片、齿轮箱、发电机、便电器,这些都是大部件,因为它本身的更换成本非常高,价值也非常高,所以对大部件的预警是非常关键的。在2014、2015年,我们集团发生了比较多起的大部件组坏事件,其中叶片和齿轮箱占80%以上。

多年前在山东某一个风电场,当时这个风电场不是建立在非常偏僻的地方,而是在公路边上。叶片损坏之后,就直接掉下来了,旁边就是一个公路,差一点砸到过往的行人和汽车,由于这个事情,整个风电场停运了小半年。一个风电场停运小半年,我们损失了3000到5000万的电量,就是1500万到2500万,所以说,像这样的事情在整个风电领域是时有发生的,对这个需求也是非常大的。

于是我们就想能够把大部件预警的技术做出来,我们一开始尝试了很传统的数据分析方式,尝试了三个月,整个集团很多人都在做这个事情,但是没有出来。后来就跟我们合作方一起,尝试大数据的更深入学习,以及跟机翼学习有关的一些模型,后来我们把整厂的26个参数都拿了出来,然后利用全新的机翼学习模型,就把这个事情做出来了。

刚开始是用单机去跑的,单机跑完之后,出现了一个哭笑不得的事,算出来了很高兴,可是我们跑一台单机需要23个小时,肯定不能这么干,因为我们都是实时的。所以我们就用大数据技术,成功地把时间提到我们可以接受的程度。

拥有这样的大部件预警技术之后,能够提前预知叶片要坏的时间,并做好充足准备。同时该技术还跟我们的风光预测系统结合,可以提前预知什么时候刮什么风,并作出相应的更换或者无休计划。

现在在风电领域有很多像技改,风机发现性能都没有达到最优效果,可能是设计的问题,也有可能是别的问题。有的厂家没有那么强的技术实力,所以我们开发了一个优化,优化完了要评估。其实就是一个合同能源管理的雏形,比如说一个厂家给我们做优化,做完了优化,我们算完了收益之后,是要跟人经济分成的,这一块也需要用到大量的数据,而且在这一块,我们要算的结果要更加的精准,所以也用到了很多数据分析的技术。

我们刚才说的都是风机刚装完,对以前的历史数据进行处理,看看已经存在的一些问题。除此之外,在风电领域最重要的是监视的数据,那都是实时的数据。监视的数据量更大,需要更多的跟大数据有关的技术。

我们集团在2014年的时候,对大数据不是很理解,当时就想大数据能不能在风电圈存活下来?我们有没有必要用?因此一开始做分析的时候,就是简单的可视化软件,算一下就行了。

后来发现这个数据量是非常巨大的,而且我们不仅用到传统的分析数据,还有很多别的数据,比如CMS系统、配件系统、故障诊断系统,这些系统不仅收集了风机和设备的数据,也有很多人的数据,所以数据多样性这个特点目前在风电领域还是比较显著的。有了这样的数据之后,需要强大的计算能力,才能把数据和结果呈现出来,这个数据量也是非常巨大的。

在整个风电领域里面,我们是一个全生命周期的管理。因为我们是运营商,不是太关心技术,我们关心的是我投了钱之后,能够得到足够的收益。如果现在出3个亿,想建一个风电场,需要选择风能源最好的地方建,建完之后,还要在风电场的这些机位上,找到最合适的机位,还要选择最合适的设备,什么是合适的设备?不是说贵就是好。既需要好,还需要它稳定,还需要它备件便宜、故障率低,生产期的事情做好,才能最大化的提高收益。

给大家举一个简单的例子。像天气预报,大家觉得这只有气象局可以做,事实上,在整个风电圈里面,有三四家都可以做到这一块,他们可以清楚知道哪些地方风资源比较好,哪些地方风资源比较差,可以拿这个来选风电场,做微观选址,找合适的机位。但数据量是非常巨大的。

举一个简单的例子,像江苏省,4个江苏省大概是38万平方公里,我们如果需要测量一年的数据,大概要用到96000个课时,会产生20个数据,像整个中国,这个数据每年都是1000个T,而且精度还比较差,如果我们定义成20米,这个数据量的规模可想而知。

运营商最关注的还是发电量,风电虽然说是清洁能源的主力军,但跟火电以及其他传统能源相比还具有一定差距,所以我们最终关注的还是度电成本。2020年,整个风电装机比现在将翻一番,能源也要翻一番,希望以后在大数据的建设时期,我们能够跟各位去探讨更多的算法,去研究更多的模型,去开发更多的系统,也希望跟合作方和各位一起共同进步,谢谢大家!

来源:数据猿

原文发布于微信公众号 - 数据猿(datayuancn)

原文发表时间:2016-10-20

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏大数据文摘

深度 | MIT最新研究:完爆可穿戴设备,AI算法通过无线电波追踪睡眠质量(附论文)

28540
来自专栏BestSDK

如何消除用户疑虑,提升转化率?

找到参照物和使用场景比数值精确更重要 之前网上选购台灯,台灯的设计、功能都挺满意的,但是有个问题让我停止了下单动作,如下图。 ? 因为这个台灯不能调整灯光亮度,...

30680
来自专栏互联网数据官iCDO

如何对本地企业网站进行竞争力评估?

这个问题的答案就在于竞争分析。你必须将企业A与企业B进行对比,以确定竞争对手的优势和劣势,然后进行有根据的猜测,以了解谷歌在特定搜索字词排名中最重要的影响因素是...

11330
来自专栏腾讯研究院的专栏

下一代互联网发展概述

张孝荣  腾讯研究院总监 王一博  腾讯研究院助理研究员  下一代网络,又称新一代网络。从广义上来说,泛指下一代融合网,泛指不同于当前的,大量采用新技...

41740
来自专栏腾讯大讲堂的专栏

让设计有感知

用户体验设计很多时候是一件看起来有点玄奥的东西,工作中会有这样的讨论 “我觉得这个方案不好。” “但我觉得OK。” “我觉得图片放右边比较好,美观。” “但我觉...

29570
来自专栏区块链领域

Datawallet与DCC(Distributed Credit Chain)建立合作伙伴关系

2018年5月23日于纽约,全球领先的C2B区块链数据交易平台Datawallet宣布,与Distributed Credit Chain(DCC)建立合作伙伴...

12020
来自专栏腾讯研究院的专栏

数字化的真我

image.png 推荐语: 去年四五月的某段时间,我到乡下去了几趟。广东的春天总是阴雨绵绵的,去年的雨季尤其漫长,各种鲜绿的草类长得也尤其繁盛,比...

21560
来自专栏量子位

Google数据集搜索神器上线,和搜索论文一样简单 | 还不去训练网络?

现在啊,许多领域的科学家,每天呼吸的不是空气,是数据集。没有数据集,他们就活不下去。

13120
来自专栏机器人网

无人机导航靠视觉识别 成本比GPS低?

无人机在飞行时一般需要依靠GPS系统来进行导航,不过有些情况GPS信号并不是时刻可用,而且由于GPS信号校准问题都会造成导航不准确。来自墨西哥墨西哥国家天体物理...

303100
来自专栏挖数

这家日活8000万的羞羞网站,公布了这些重口味的羞羞数据

著名的大型性教育科普网站Pornhub每年都会发布一次数据,在其最新发布的2017年度数据中,有以下有趣的点:

30410

扫码关注云+社区

领取腾讯云代金券