帮助评估海上风电场场址的新统计技术

麻省理工学院的科学家们开发了一种新的统计技术,该技术能够比现有技术产生更好的风速预测,从而节省了电力公司在评估海上风电场场址方面的时间和金钱。

当一家电力公司想要建立一个新的风电场时,它通常会聘请顾问在拟议的地点进行风速测量八至十二个月。这些测量值与历史数据相关联,并用于评估该站点的发电量。

在本月晚些时候举行的国际人工智能联合会议上,麻省理工学院的研究人员将展示一种新的统计技术,该技术可以比现有技术产生更好的风速预测,即使仅使用三个月的数据也是如此。这可以节省电力公司的时间和金钱,尤其是在评估海上风电场的站点时,因为维护测量站的成本特别高。

麻省理工学院计算机科学与人工智能实验室(CSAIL)的研究科学家Kalyan Veeramachaneni说:“我们与风能行业的人进行了交谈,发现他们使用一种非常非常简单的机制来估算现场的风能。” )和新论文的第一作者。Veeramachaneni说,尤其是,该行业的标准做法是使用所谓的高斯分布(基本统计数据中熟悉的“钟形曲线”)对风速数据的相关性进行建模。

“这里的数据是非高斯的;我们都知道,” Veeramachaneni说。“您可以为其拟合钟形曲线,但这并不是数据的准确表示。”

通常,风能顾问会在拟议站点的风速测量值与同一时期在附近气象站进行的风速测量值之间找到相关性,那里的记录可以追溯到几十年前。基于这些相关性,顾问将调整气象站的历史数据,以提供新站点的风速近似值。

相关模型是统计中称为联合分布的模型。这意味着它不仅代表在一个站点进行特定测量的概率,还代表在另一站点进行该特定测量的概率。Veeramachaneni说,风能行业顾问通常将联合分布的特征描述为高斯分布。

不同的曲线

Veeramachaneni与他的同事(CSAIL的首席研究科学家Una-May O'Reilly和马德里的Rey Juan Carlos大学的Alfredo Cuesta-Infante)一起开发的模型的第一个新颖之处在于,它可以将更多超过一个气象站。在他们的某些分析中,研究人员使用了来自15个或更多其他地点的数据。

但是它的主要优点是它不仅限于高斯概率分布。此外,它可以使用不同类型的分布来表征来自不同站点的数据,并且可以以不同的方式将它们组合在一起。它甚至可以使用所谓的非参数分布,其中的数据不是通过数学函数描述的,而是通过采样的集合描述的,这与数字音乐文件由连续声波的离散采样组成的方式非常相似。

该模型的另一个方面是,它可以发现数据集之间的非线性相关性。根据某种距离测量,标准回归分析(通常在风能行业中使用)可确定最接近数据点散射的直线。但是通常,曲线会提供更好的近似值。研究人员的模型考虑到了这种可能性。

验证

研究人员首先将他们的技术应用于从麻省理工学院博物馆顶部的风速计收集的数据,该博物馆正试图在其屋顶上安装风力涡轮机。一旦他们证明了模型的准确性,便将其应用于风电行业一位主要顾问提供给他们的数据。

Veeramachaneni和他的同事仅使用该公司特定风电场站点的三个月历史数据,就可以预测未来两年的风速,其准确度是使用八个月数据的现有模型的三倍。从那时起,研究人员通过评估计算关节分布的替代方法来改进他们的模型。根据对新博物馆报道的科学博物馆数据的进一步分析,他们的修改方法可以使预测的准确性提高一倍。

南洋理工大学电气工程学助理教授贾斯汀·道维尔斯(Justin Dauwels)是“ copulas”(麻省理工学院研究人员用来耦合不同类型概率分布的统计技术)的专家。Dauwels说:“ Veeramachaneni的团队提出了一种非常适合大型实际应用的模型。”“通过精确地描述非高斯统计量,基于copula的模型胜过了经典的高斯模型,从而通过更少的测量就可以在测试位置提供准确的边际分布。这种方法具有很强的实用价值,我坚信它将适用于许多其他现实生活中的问题。”

研究论文:风资源估算的Copula图形模型

图像:荷西·路易斯·奥利瓦雷斯(Jose-Luis Olivares)

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。