1.本发明属于
光伏功率预测领域,具体地,涉及一种分布式光伏
用户发电功率短期预测方法及装置。
背景技术:
2.随着经济社会发展,石油、煤炭传统能源日益衰竭,急需加大光伏等替代新能源的使用和推广力度,其中分布式光伏具有数量大、投资少、建设快等特点,近年来发展趋势突飞猛进,与此同时,光伏电源对电网电压、配电网安全运行的隐患也逐渐显现,实际建设中仍存在超容发电、过压并网、安全盲区等问题,迫切需要依托成熟的电力系统实现对光伏用户发电情况的实时可观和精准可测,助力低压分布式光伏规模化发展,进一步提升低压分布式光伏用户服务水平。
技术实现要素:
3.为解决现有技术中的不足,本技术提供一种分布式光伏用户发电功率短期预测方法及装置,首先借助光伏能源站采集
数据,通过地址经纬度计算光伏用户与能源站的地理距离,选择合适的阈值后,完成光伏用户气象数据和发电数据融合,并根据发电功率预测时间精度需求,进一步处理气象数据和电力数据匹配对,提取出用户辐射、温度等气象特征和合同容量等电力特征,最后再根据用户历史发电功率趋势类化光伏用户,分别构建不同光伏发电效率下的基于支持向量回归算法的光伏发电功率预测模型,最终实现基于气象数据的分布式光伏用户发电功率预测。
4.为了实现上述目标,本发明采用如下技术方案:
5.一种分布式光伏用户发电功率短期预测方法,所述方法包括以下步骤:
6.步骤1:获取光伏能源站气象数据,包括能源站基础档案数据和日常检测太阳辐射明细数据;并
7.获取用电信息采集系统中光伏用户的电力数据,其中包括档案数据、发电功率、发电示数;
8.步骤2:通过地址经纬度转化,计算光伏用户与气象站的实际地理距离,选择相应的阈值,实现气象数据和电力数据的匹配;
9.步骤3:根据对发电功率预测的时间精度要求,对步骤2中的历史气象数据和电力数据处理成相应特征数据对;
10.步骤4:基于步骤1中的光伏用户历史发电功率数据,对用户进行分类,区分不同发电效率下的用户;
11.步骤5:根据不同发电效率下的用户,基于步骤3中的特征数据对,提取用户气象特征和电力特征,建立不同效率下的光伏用户发电功率预测模型,实现分布式光伏用户发电功率的短期预测。
12.优选地,所述步骤2中,为建立气象数据和电力数据的匹配关系,以光伏能源站档
案地址为基准,匹配该能源站附近对应终端台区,再进一步匹配台区底下所有的光伏用户,选定合适的距离阈值,则该阈值范围内光伏用户的气象数据等价于该范围最近的光伏能源站采集数据。
13.优选地,所述在步骤3中,光伏用户的发电功率数据采集频度分别有日级别、小时级别、分钟级别,而光伏能源站气象数据采集频度为一分钟一次,为实现光伏用户发电功率和气象数据在时间维度上保持一致,按照功率预测的所需时间精度,对原始气象数据进行转换和提取,构建数据对。
14.优选地,所述步骤4中,相同辐射数据下的用户之间,因安装角度、设备问题导致其发电功率不同,基于用户历史的发电功率数据,构建高维历史功率特征矩阵,类化光伏用户。
15.优选地,在步骤4中,基于用户历史的发电功率数据,构建高维历史功率特征矩阵,类化光伏用户,或通过聚类,实现用户分批建模,分别构建不同光伏发电效率下的光伏用户发电功率预测模型,或基于用户历史发电功率,提取出每个用户在不同时间发电效率特征,作为后续建模的用户个性化属性特征。
16.优选地,所述步骤5具体包括以下步骤:
17.所述步骤5具体包括以下步骤:
18.s501:对原始数据处理,修补或舍弃负值、缺失值;
19.s502:提取气象数据特征,包括太阳水平面总辐照度、法向直射辐照度、温度、风向、风速、气压;
20.s503:针对不同发电效率类化后的光伏用户,分别构建对应的基于支持向量机算法的光伏发电功率预测模型,实现基于气象数据的光伏发电功率预测。
21.所述步骤s503中,寻拟合训练集样本的模型f(x),通过构建光伏用户发电功率真实值与模型预测值的损失函数,当损失函数最小,模型则最优;具体包括以下步骤:
22.s5031:基于训练集样本,寻光伏用户发电功率预测模型f(x).
23.训练集样本数据为{(x1,y1),(x2,y2),
…
(xm,ym)},其中xi为第i个光伏用户t时刻的d维气象特征和电力特征矩阵,yi为对应时刻的发电功率,寻模型f(x)=w
t
x+b,使得f(x)与y尽可能接近,其中w=(w1,w2,
…
wd)为法向量,b为位移项,w1,w2,
…
wd均为待确定的模型参数;x包括x1,x2,
……
xm,y表示光伏用户发电功率;
24.s5032:构建模型目标函数和损失函数;
25.支持向量目标函数为:
26.约束条件:st:|y
i-w
t
x
i-b|≤ε,i=1,2,
…m27.其中损失函数为:
28.s5033:模型参数求解,给出参数最优解。
29.本发明还提出一种分布式光伏用户发电功率短期预测装置,所述装置包括:
30.气象数据采集模块:获取光伏能源站气象数据,包括能源站基础档案数据和日常检测太阳辐射明细数据;
31.电力数据采集模块:获取用电信息采集系统中光伏用户的电力数据,其中包括档
案数据、发电功率、发电示数;
32.数据匹配模块:通过地址经纬度转化,计算光伏用户与气象站的实际地理距离,选择合适的阈值,实现气象数据和电力数据的匹配;
33.数据处理模块:根据对发电功率预测的时间精度要求,对历史气象数据和电力数据处理成相应特征数据对;
34.用户类化模块:基于光伏用户历史发电功率数据,对用户进行分类,区分不同发电效率下的用户;或通过历史发电功率提取出每个用户不同时刻发电效率矩阵,作为用户个性化属性;
35.预测模块:根据不同发电效率下的用户,基于特征数据对,提取用户气象特征和电力特征,建立不同效率下的光伏用户发电功率预测模型,实现分布式光伏用户发电功率的短期预测。
36.进一步地,本发明还提出一种终端,包括处理器及存储介质;所述存储介质用于存储指令;所述处理器用于根据所述指令进行操作以执行根据本发明所述方法的步骤。
37.进一步地,本发明还提出一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现本发明所述方法的步骤。
38.相当于现有技术,本技术所达到的有益效果:
39.1、本发明获取用采系统的光伏用户发电数据和气象能源站光伏数据,通过地址经纬度计算两点实际地理距离,选择合适阈值后,实现了气象数据和发电数据的融合,并获取1分钟采集频度的高精度气象数据,为光伏出力预测奠定数据基础。
40.2、本发明考虑到相同辐射数据下的用户之间,因安装角度、设备等问题导致其发电功率不同,故通过用户历史的发电功率数据,类化光伏用户,有效解决单一模型对特定用户预测偏差过大问题。
41.3、本发明针对光伏出力预测问题,根据不同预测精度需求,分别处理气象数据和电力数据匹配对,并基于用户历史发电负荷趋势类化光伏用户,建立不同光伏发电效率下基于支持向量回归算法的发电功率预测模型,
42.4、本发明考虑到的类化模型,一种是类化用户,对用户分批建模,另一种是根据历史发电功率数据,分别提取出每个用户在不同时间发电效率特征,作为后续建模的用户个性化属性特征,使得模型具备实时更新性和用户专属性。
附图说明
43.图1是本发明一种分布式光伏用户发电功率短期预测方法的流程步骤图。
具体实施方式
44.下面结合附图对本技术作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本技术的保护范围。
45.如图1所示,本发明的一种分布式光伏用户发电功率短期预测方法,包括以下步骤:
46.步骤1:获取光伏能源站气象数据,包括能源站基础档案数据和日常检测太阳辐射明细数据。
47.本发明实施例中获取了江苏省新能源站数据,包括风电气象数据、光伏气象数据、新能源站档案信息。
48.风电气象数据基础字段包括气象站名称、采集时间点、温度、湿度、测风塔风速和风向等,采集频度为一分钟一个点,一天1440个点。
49.光伏气象数据基础字段包括气象站名称、采集时间点、水平辐照度、法向辐照度、散射辐照度、平均风速、气压、温度等,采集频度也是一分钟一个点,一天1440个点。
50.新能源站档案信息数据字段包含能源站名称、经纬度地址等。
51.获取用电信息采集系统中光伏用户的电力数据,其中包括档案数据、发电功率、发电示数等;
52.基于步骤1中的能源站档案数据,本发明实施例选取光伏站最密集的扬州宝应县作为研究对象。
53.进而导出用电信息采集系统中扬州宝应县地区的所有光伏用户的电力数据,包括基本档案数据和日发电历史功率等。
54.档案数据包括用户编号、合同容量、所属台区编号、台区地址、用户地址等。
55.日发电功率数据为光伏用户发电关口表的历史发电功率信息,数据采集频度有1小时一个点和15分钟一个点。
56.步骤2:通过地址经纬度转化,计算光伏用户与气象站的实际地理距离,选择合适的阈值,实现气象数据和电力数据的匹配;
57.为建立气象数据和电力数据的匹配关系,以宝应县光伏能源站档案地址经纬度为基准,通过经纬度计算两点之间实际地理距离,匹配该能源站附近对应终端台区,再进一步匹配台区底下所有的光伏用户,选定合适的距离阈值,即可认为该阈值范围内光伏用户的气象数据等价于该范围最近的光伏能源站采集数据。
58.步骤3:根据对发电功率预测的时间精度要求,对步骤2中的历史气象数据和电力数据处理成相应数据对。
59.光伏用户的发电功率数据采集频度分别有日级别、小时级别、分钟级别,而光伏能源站气象数据采集频度为一分钟一次,为实现光伏用户发电功率和气象数据在时间维度上保持一致,需按照功率预测的所需精度,对原始气象数据进行转换和提取,构建数据对。
60.在实施例中若是对小时级别的发电功率进行预测,则需把光伏气象数据切分成60*24数据矩阵,每60维气象数据对应一维功率数据。
61.步骤4:基于步骤1中的光伏用户历史发电功率数据,对用户进行分类,区分不同发电效率下的用户。
62.相同辐射数据下的用户之间,因安装角度、设备等问题导致其发电功率不同,故基于用户历史的发电功率数据,构建高维历史功率特征矩阵,类化光伏用户,有效解决单一模型对特定用户预测偏差过大问题。
63.本实施例中使用的宝应县满足条件光伏用户,以用户历史每日的发电功率曲线作为类化标准,将用户最终分成三类,发电效率等级为低、中、高。
64.步骤5:根据不同发电效率下的用户,基于步骤3中的特征数据对,提取用户气象特征和电力特征,建立不同效率下的光伏用户发电功率预测模型。
65.s501:原始数据处理
66.光伏用户发电功率数据存在负值、缺失和0值,针对缺失数据,根据缺失量大小,对其进行舍弃或者修补;针对负值数据,判断是电流倒走还是采集错误,对其进行删除和还原。
67.本实施例中使用的1小时采集频度的发电功率数据,约有1%左右的数据缺失,针对缺失数据,按用户-天数-缺失比例层层审核,将8点-15点功率缺失率高于10%的直接剔除,10%以内缺失点用前后点均值插值。
68.针对负值数据,理论上光伏用户发电表的功率≥0,若功率出现负数且绝对值在0.1内,可认为正常回流现象,直接将其替换成0,若负数绝对值超过0.1则认为数据错误,直接删除整条数据。
69.针对0值处理,若功率0值出现在早上7点之前或晚上6点之后,属于正常现象,若一天功率全为0,说明该用户未使用光伏设备或数据采集失败,直接剔除整个用户的所有数据。
70.s502:数据特征提取
71.根据光伏能源站气象数据提取出气象数据特征,包括太阳水平面总辐照度、法向直射辐照度、温度、风向、风速、气压等。
72.根据光伏用户的电力档案数据提取出合同容量等特征。
73.针对小时精度的功率预测准备数据,提取后的特征包括小时平均水平面总辐照度、小时平均法向直射辐照度、小时平均温度等,其中小时平均法向直射辐照度和合同容量特征跟用户发电功率相关性达0.93、0.78,而气压相关性为0.01,后面建模时直接剔除该特征。
74.s503:模型建立
75.针对不同发电效率类化后的光伏用户,分别构建对应的基于支持向量回归算法的光伏发电功率预测模型,实现基于气象数据的光伏发电功率预测。
76.本实施例说明中选取前面步骤中发电效率低一类光伏用户开展预测工作。
77.s5031:基于训练集样本,寻光伏用户发电功率预测模型f(x)
78.将步骤s502计算后的样本特征匹配对,按照9∶1比例随机切分成训练集和测算集,训练集样本数据为{(x1,y1),(x2,y2),
…
(xn,yn)},其中xi为光伏用户t时刻的d维气象特征和电力特征矩阵,yi为对应时刻的发电功率。寻模型f(x)=w
t
x+b,使得f(x)与y尽可能接近,其中w=(w1,w2,
…
wd)为法向量,b为位移项,均为待确定的模型参数。
79.s5032:构建模型目标函数和损失函数。
80.假设能容忍预测值f(x)与真实值y之间最多有ε的偏差,当且仅当|f(x)-y|>ε时候,才计算损失函数。
81.支持向量目标函数:
82.约束条件:st:|y
i-w
t
x
i-b|≤ε,i=1,2,
…m83.其中损失函数为:
84.s5033:模型参数求解。
85.通过引入松弛变量,和对偶问题转化,模型改写成
86.目标函数
87.约束条件改为st:
88.其中和为第i个样本对应的松弛变量,可允许部分样本落到间隔带外,使得模型更稳健;c为模型正则项的常数系数,可使得该模型包容部分不满足约束条件样本,泛化能力更强,m为样本总数。
89.c越大,意味着对离点的惩罚就越大,最终就会有较少的点跨过间隔边界,模型也会变得复杂;而c设的越小,则较多的点会跨过间隔边界,最终形成的模型较为平滑。而ε越大,则对离点容忍度越高,最终的模型也会较为平滑。
90.引入拉格朗日乘子
91.问题转化为:
[0092][0093]
对上述l,分别求w,b,偏导为0,转化成对偶问题后用smo算法求出最终可得模型参数w、b,
[0094][0095][0096]
当训练数据无法线性拟合时,通过映射函数使得xi→
φ(xi),并采用高斯核函数将模型解转变为其中高斯核函数为k(x,z)=exp(-g||x-z||2)。
[0097]
模型建立中参数调优至关重要,使用高斯核函数训练svr模型时,准确率强依赖于参数惩罚因子c和不敏感系数g,c越大,模型越复杂,训练集越准确,但泛化能力越弱,g越大,则模型支持向量越少,模型越复杂。通过网格优化算法,设置合适的步长,全局搜索使得测试集准确率最优的参数c和g分别为1.0和0.8,此时可使得测试集光伏用户小时级发电功率预测值与真实值平均误差率为9.5%。
[0098]
本发明还提出一种分布式光伏用户发电功率短期预测装置,所述装置包括:
[0099]
气象数据采集模块:获取光伏能源站气象数据,包括能源站基础档案数据和日常检测太阳辐射明细数据;
[0100]
电力数据采集模块:获取用电信息采集系统中光伏用户的电力数据,其中包括档案数据、发电功率、发电示数;
[0101]
数据匹配模块:通过地址经纬度转化,计算光伏用户与气象站的实际地理距离,选择合适的阈值,实现气象数据和电力数据的匹配;
[0102]
数据处理模块:根据对发电功率预测的时间精度要求,对历史气象数据和电力数据处理成相应特征数据对;
[0103]
用户类化模块:基于光伏用户历史发电功率数据,对用户进行分类,区分不同发电效率下的用户;或通过历史发电功率提取出每个用户不同时刻发电效率矩阵,作为用户个性化属性;
[0104]
预测模块:根据不同发电效率下的用户,基于特征数据对,提取用户气象特征和电力特征,建立不同效率下的光伏用户发电功率预测模型,实现分布式光伏用户发电功率的短期预测。
[0105]
进一步地,本发明还提出一种终端,包括处理器及存储介质;所述存储介质用于存储指令;所述处理器用于根据所述指令进行操作以执行根据本发明所述方法的步骤。
[0106]
进一步地,本发明还提出一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现本发明所述方法的步骤。
[0107]
综上所述,本技术提供了一种基于负荷分类的分布式光伏用户发电功率短期预测方法及装置,首先借助光伏能源站采集数据,通过地址经纬度计算光伏用户与能源站的地理距离,选择合适的阈值后,完成光伏用户气象数据和发电数据融合。并根据发电功率预测时间精度需求,进一步处理气象数据和电力数据匹配对,提取出用户辐射、温度等气象特征和合同容量等电力特征,最后再根据用户历史发电功率趋势类化光伏用户,分别构建不同光伏发电效率下的基于支持向量回归算法的光伏发电功率预测模型,最终实现基于气象数据的分布式光伏用户发电功率预测。
[0108]
本发明申请人结合说明书附图对本发明的实施示例做了详细的说明与描述,但是本领域技术人员应该理解,以上实施示例仅为本发明的优选实施方案,详尽的说明只是为了帮助读者更好地理解本发明精神,而并非对本发明保护范围的限制,相反,任何基于本发明的发明精神所作的任何改进或修饰都应当落在本发明的保护范围之内。
技术特征:
1.一种分布式光伏用户发电功率短期预测方法,其特征在于:所述方法包括以下步骤:步骤1:获取光伏能源站气象数据,包括能源站基础档案数据和日常检测太阳辐射明细数据;并获取用电信息采集系统中光伏用户的电力数据,其中包括档案数据、发电功率、发电示数;步骤2:通过地址经纬度转化,计算光伏用户与气象站的实际地理距离,选择相应的阈值,实现气象数据和电力数据的匹配;步骤3:根据对发电功率预测的时间精度要求,对步骤2中的历史气象数据和电力数据处理成相应特征数据对;步骤4:基于步骤1中的光伏用户历史发电功率数据,对用户进行分类,区分不同发电效率下的用户;步骤5:根据不同发电效率下的用户,基于步骤3中的特征数据对,提取用户气象特征和电力特征,建立不同效率下的光伏用户发电功率预测模型,实现分布式光伏用户发电功率的短期预测。2.根据权利要求1所述的一种基于负荷分类的分布式光伏用户发电功率短期预测方法,其特征在于:所述步骤2中,为建立气象数据和电力数据的匹配关系,以光伏能源站档案地址为基准,匹配该能源站附近对应终端台区,再进一步匹配台区底下所有的光伏用户,选定合适的距离阈值,则该阈值范围内光伏用户的气象数据等价于该范围最近的光伏能源站采集数据。3.根据权利要求2所述的一种分布式光伏用户发电功率短期预测方法,其特征在于:所述在步骤3中,光伏用户的发电功率数据采集频度分别有日级别、小时级别、分钟级别,而光伏能源站气象数据采集频度为一分钟一次,为实现光伏用户发电功率和气象数据在时间维度上保持一致,按照功率预测的所需时间精度,对原始气象数据进行转换和提取,构建数据对。4.根据权利要求3所述的一种分布式光伏用户发电功率短期预测方法,其特征在于:所述步骤4中,基于用户历史的发电功率数据,构建高维历史功率特征矩阵,类化光伏用户。5.根据权利要求4所述的一种分布式光伏用户发电功率短期预测方法,其特征在于:在步骤4中,基于用户历史的发电功率数据,构建高维历史功率特征矩阵,类化光伏用户,或通过聚类,实现用户分批建模,分别构建不同光伏发电效率下的光伏用户发电功率预测模型,或基于用户历史发电功率,提取出每个用户在不同时间发电效率特征,作为后续建模的用户个性化属性特征。6.根据权利要求1所述的一种分布式光伏用户发电功率短期预测方法,其特征在于:所述步骤5具体包括以下步骤:s501:对原始数据处理,修补或舍弃负值、缺失值;s502:提取气象数据特征,包括太阳水平面总辐照度、法向直射辐照度、温度、风向、风速、气压;s503:针对不同发电效率类化后的光伏用户,分别构建对应的基于支持向量机算法的光伏发电功率预测模型,实现基于气象数据的光伏发电功率预测。
7.根据权利要求6所述的一种分布式光伏用户发电功率短期预测方法,其特征在于:所述步骤s503中,寻拟合训练集样本的模型f(x),通过构建光伏用户发电功率真实值与模型预测值的损失函数,当损失函数最小,模型则最优;具体包括以下步骤:s5031:基于训练集样本,寻光伏用户发电功率预测模型f(x);训练集样本数据为{(x1,y1),(x2,y2),
…
(x
m
,y
m
)},其中x
i
为第i个光伏用户t时刻的d维气象特征和电力特征矩阵,y
i
为对应时刻的发电功率,寻模型f(x)=w
t
x+b,使得f(x)与y尽可能接近,其中w=(w1,w2,
…
w
d
)为法向量,b为位移项,w1,w2,
…
w
d
均为待确定的模型参数;x包括x1,x2,
……
x
m
,y表示光伏用户发电功率;s5032:构建模型目标函数和损失函数;支持向量目标函数为:约束条件:st:|y
i-w
t
x
i-b|≤ε,i=1,2,
…
m其中损失函数为:s5033:模型参数求解,给出参数最优解。8.一种分布式光伏用户发电功率短期预测装置,用于实现如权利要求1-7任一项所述的方法,其特征在于:所述装置包括:气象数据采集模块:获取光伏能源站气象数据,包括能源站基础档案数据和日常检测太阳辐射明细数据;电力数据采集模块:获取用电信息采集系统中光伏用户的电力数据,其中包括档案数据、发电功率、发电示数;数据匹配模块:通过地址经纬度转化,计算光伏用户与气象站的实际地理距离,选择合适的阈值,实现气象数据和电力数据的匹配;数据处理模块:根据对发电功率预测的时间精度要求,对历史气象数据和电力数据处理成相应特征数据对;用户类化模块:基于光伏用户历史发电功率数据,对用户进行分类,区分不同发电效率下的用户;或通过历史发电功率提取出每个用户不同时刻发电效率矩阵,作为用户个性化属性;预测模块:根据不同发电效率下的用户,基于特征数据对,提取用户气象特征和电力特征,建立不同效率下的光伏用户发电功率预测模型,实现分布式光伏用户发电功率的短期预测。9.一种终端,其特征在于,包括处理器及存储介质;所述存储介质用于存储指令;所述处理器用于根据所述指令进行操作以执行根据权利要求1-7任一项所述方法的步骤。10.计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1-7任一项所述方法的步骤。
技术总结
本发明公开了一种分布式光伏用户发电功率短期预测方法及装置,借助光伏能源站采集数据,通过地址经纬度计算光伏用户与能源站的地理距离,选择合适的阈值后,完成光伏用户气象数据和发电数据融合,并根据发电功率预测时间精度需求,进一步处理气象数据和电力数据匹配对,提取出用户辐射、温度等气象特征和合同容量等电力特征,最后再根据用户历史发电功率趋势类化光伏用户,分别构建不同光伏发电效率下基于支持向量回归算法的光伏发电功率预测模型,实现了气象数据和发电数据的融合,最终实现基于气象数据的分布式光伏用户发电功率预测。测。测。
技术研发人员:
高凡 王忠东 徐孝琳 周玉 邵雪松 李悦 赵双双 穆卓文 周家亿 褚兴旺 容杰
受保护的技术使用者:
国网江苏省电力有限公司营销服务中心
技术研发日:
2022.09.01
技术公布日:
2022/12/9