引导语:“南水北调工程”即中华人民共和国的战略性工程。是指把长江流域水资源自其上游、中游、下游,结合中国疆土地域特点,分东、中、西三线抽调部分送至华北与淮海平原和西北地区水资源短缺地区。工程方案构想始于1952年国家主席毛泽东视察黄河时提出。自此,在历经分析比较50多种方案基础后,调水方案获得一大批富有价值的成果。工程规划区涉及人口4.38亿人,调水规模448亿立方米。工程规划的东、中、西线干线总长度达4350公里。 东、中线一期工程干线总长为2899公里,沿线六省市一级配套支渠约2700公里。
摘要:为了为南水北调中线工程实现全线通水后的正常调度提供有益技术支撑和经验借鉴,本文基于2008~2013年底南水北调中线干线京石段工程已经完成的4次向北京输水任务的相关资料,通过回归分析、人工神经网络等方法确立了渠道在恒定流情况下,开度、上、下游水位与流量3者的关系,并对2种方法所得结论进行了对比。
关键词:南水北调京石段;最小二乘法;神经网络;流量系数;稳定状态
引言
南水北调中线干线京石段工程起点为石家庄古运河枢纽进口,终点为北京市团城湖,渠线总长307.44km。渠线总长227.39km,其中建筑物长26.34km,渠道长201.05km,采用明渠自流输水方式;北京段从北拒马河中支南开始,途径房山区、丰台区,至总干渠终点团城湖,总长80.05km,采用管涵输水方式。为缓解首都北京水资源短缺,自2008年9月至今京石段工程已4次向北京市应急供水,累计入京水量超过15亿m3。
其中第4次通水实测流量数据较为充足(放水河节制闸、坟庄河节制闸、北拒马河节制闸、沙河引水闸等4座水闸有实测流量资料),故本次研究选取第4次通水上述4闸数据进行稳态调度分析研究。
一、分析方法简介
1.1最小二乘法
最小二乘法(又称最小平方法)是一种较基本的回归方法。它通过最小化误差的平方和寻找数据的最佳函数匹配。利用最小二乘法可以简便地求得未知的数据,并使得这些求得的数据与实际数据之间误差的平方和为最小[1]。
一般的最小二乘逼近定义为:对于给定的一组数据(xi,f(xi))(i=0,1,…,m),要求在函数类={0,1,…,n}中找到一个函数y=S(x),使误差平方和:δ22=∑mi=0δ2i=∑mi=0[S(xi)-f(xi)]2取得极小值。
为使问题的提法更具有一般性,通常把最小二乘法中δ22考虑加权平方和,即:
δ22=∑mi=0ω(xi)[S(xi)-f(xi)]2(1)
当0(x),1(x),…,n(x)是关于点集{xi}(i=0,1,…,m)的带权正交函数组时,解为:
ak=∑mi=0ω(xi)f(xi)k(xi)∑mi=0ω(xi)2k(xi)(k=0,1,…,n)(2)
1.2神经网络法
神经网络近年来兴起的研究热点,其具有逼近非线性函数的能力,它是基于映射网络存在理论。在神经网络中最广泛应用的信息处理运算是数学映射,给定一个输入向量X,网络应该产生一个输出向量Y=ψ(X),网络的基本特征是从复杂的高维数据中提取和识别必要的参数。影射网络存在理论认为,只要处理单元是一个输入变量的任意连续递增函数或是几个变量的总和,则一个输入向量X可以映射成任意输出函数Y=ψ(X)[2]。
神经网络算法基于最小均方差准则,由计算正向输出和误差反向传播组成。通过由比较网络的实际输出与期望输出来不断地调节网络权值,直至收敛为止。网络中每个节点的输入输出存在如下非线性关系
O={1+exp[-(∑WjiOpi+θj)]}-1(3)
式中:Opi为模式P输至网络节点j的输出;Wji为节点i到j的连接权;θj为节点j的阀值。
式中,δpj为j节点上一层节点k的误差;Wkj为节点j到其上一层节点k的连接权。
从以上公式可以得出,通过误差反向传播,调整权值,最终的输出就会接近所要求的期望值,这个过程称为训练。当达到所要求的误差时,就认为网络已经能在某种程度上近似表示输入与输出的关系。
也就是说,用含有隐含层的神经网络能拟合许多任意复杂的连续函数,回归分析的实质就是在抽样数据的基础上进行曲线拟合。如果对训练好的网络输入新的数据,输出的结果就是对此曲线新的点结果的预测。所以,用神经网络可以进行有关的曲线回归分析,也可以用已回归好即训练好的结果去预测新的样本[3]。
1.3回归效果分析
最小二乘法作为传统回归方法,对于多元回归计算的计算量过大,随着变量数目的增加,计算量剧增,并且要相互比较的回归曲线也剧增,选择一条最优回归曲线较难。根据本次研究现有资料,淹没系数与流量系数均不能通过资料直接查得数据,闸孔出流的淹没系数只能通过查相应关系曲线或表获得,这样就使得最小二乘法率定的结果会出现误差。
由于淹没系数反应的是下游水深对过闸水流的淹没影响程度,采用人工神经网络法建模时,在输入层数据矩阵中加入闸后水位,通过学习训练能够在网络内部建立样本隐含的复杂结构,避开了淹没系数不能准确确定这一问题,使得分析结果更为准确,考虑相关参数更为全面。在最小二乘法分析无法给出满意解时,神经网络将是一种全新的选择。
结合现有数据,本次报告采用上述2种算法分别对各闸流量系数进行率定,并对计算结果进行比较分析,下面列举放水河节制闸率定成果。
二、流量系数分析
受闸门控制的水位~流量系数关系,可以通过观测其上下游水位、闸孔开启高度及宽度,运用水力学公式来推求。在水力学理论公式中,上游水头要涉及行进流速水头,这里采用实测流量来率定流量系数,由于流量系数是水位的某种形式的函数,先对推流公式中的系数加以率定,并再据以推算流量,可不计入行进流速水头。
由堰流和孔流的特点可知,对于具有闸门控制的同一渠道,堰流和孔流可以相互转化。这种水流的转化条件与闸孔的相对开度和闸前水头有关,根据实验,堰流和闸孔出流的判别条件如下[4]:当闸底坎为平顶型时:eH≤0.65,为孔流;eH0.65,为堰流。当闸底坎为曲线形型时:eH≤0.75,为孔流;eH0.75,为堰流。根据样本中数据判别如下,坟庄河、放水河、北拒马河节制闸为平顶型孔流;沙河引水闸为曲线型孔流。
2.1最小二乘法求解
由于每组数据对应的淹没系数不一致,导致率定流量系数时计算过于繁琐复杂,现将淹没系数σs、流量系数μ拟合为一个未知数m,称为拟合流量系数(即孔口淹没出流流量系数)。回归方程转化为一元问题求解。求解m后,再通过查孔流淹没系数表查得每组数据对应的淹没系数σs,最终求得孔口自由出流流量系数μ。经查表可得:放水河节制闸淹没系数σs=0.65;坟庄河节制闸淹没系数σs=0.55;北拒马河节制闸淹没系数σs=0.35~0.85;沙河引水闸淹没系数σs=1。
断面的流量资料以及与流量系数相关的开度e、闸前水头H、宽度b等均可在资料中查得。选择第4次通水沙河引水闸、坟庄河节制闸、放水河节制闸、北拒马河节制闸1个月的通水数据作为样本。
闸孔出流流量计算公式:
Q=σsμbe2gH(4)
式中:Q为计算流量(m3/s);σs为淹没系数;μ为流量系数;b为闸孔净宽(m);e为开度(m);H为闸前水头(m)。
经计算可列出如下各项系数关系表,见表1。
表1放水河节制闸开度、闸前水头、自由出流流量系数关系表
e/mH/m3.5~3.63.6~3.73.7~3.83.8~3.93.9~4.04.0~4.10.0740.7860.1100.8120.8120.8120.1140.8790.1180.7730.7730.1200.7930.7930.8060.1300.8440.8440.8440.8290.8290.1400.8350.8350.8350.1470.6220.6220.1500.8660.1600.8860.8860.1700.8230.823
2.2神经网络法求解
与流量系数相关联的数据有闸前水头、闸后水头、空口净宽、闸门开度,则输入层神经元个数为4,输出层神经元为1,选取n个样本:
{(X1,y1),(X2,y2),…,(X20,yn)}(5)
其中Xi={xi1,xi2,xi3,xi4},i=1,2,…,n。xik表示第i个样本中第k个参数所代表的流量强度k=1,2,3,4。yi为第i个样本中的实测流量。
输入层神经元4个,为闸门开度、闸前水头、闸后水头、空口净宽,输出层神经元1个,为实测流量,将所有数据进行归一化处理。取BP神经网络梯度下降法学习算法学习效率为α=0.5,训练精度取0.01,训练次数为2000。对上述神经网络模型进行网络训练,训练结果如下:
放水河节制闸隐含层设为3层时精度为:0.015441;4层时精度为:0.015376;5层时精度为:0.015378。故隐含层选取精度最小的4层隐含层。
各闸门输入、输出权矩阵如表2。
表2隐含神经元个数为4权矩阵
闸门输入层权矩阵输出层权矩阵放水河节制闸5.74E-020.46128960.94999-0.5571120.3358424-0.2866769-0.92112231.058965-0.713352-5.18E-02-0.8456119-0.8865428-0.01462-0.9969012.345147-0.3966391-0.27491370.818604-0.787825-0.3147664
2.3合理性评价
流量系数与各相关影响因子的回归分析,建立回归方程仅仅是一种假定,是否符合实际情况就必须对率定系数的结果进行检验。从已知数据中随机找10次测量数据,用上述最小二乘法推求的流量系数以及神经网络法求出的权矩阵求解计算流量,再与实测流量对比,求出相对误差。
经计算各组样本中,平均误差均不到3%,误差小于5%[6]的样本比例分别为:最小二乘法数据:70%、100%、100%、60%;神经网络法数据:80%、100%、100%、100%。从以上计算及相关统计参数可以很明显的看出,用神经网络回归得出的数据相比最小二乘法的要好些,并且计算的流量很接近原始测量数据。但回归分析的效果好坏要综合来看,比如考虑相关参数的全面性,计算量的大小,回归方程的直观性,回归数据统计效果等[7],下面就从这几个方面进行对比分析。
2.3.1相关参数的全面性
最小二乘法中,率定的拟合流量系数中有2项:淹没系数、流量系数,淹没系数是反应下游水深对于过闸水流的淹没影响程度,由于每组数据的开度-闸后水位-上下游水位差差别较小,淹没系数表中精度有限,使得人工读数误差加大。而神经网络法在输入层数据函数中加入了闸后水位这一项,在网络内部建立样本的复杂结构,考虑影响流量的参数更为全面,回归出的数据精度更高。
2.3.2计算量
最小二乘法等传统回归方法,计算量的大小会随着变量个数的增加而呈指数形式增加,而神经网络法回归分析时,较多的计算量都花费在训练上。对于本次回归分析,由于变量较少,最小二乘法的计算量不是很大,求解的精度达到了相应要求,所以神经网络的优越性不是很显著。
2.3.3回归方程的直观性
从回归方程的直观性来看,最小二乘法求出的回归方程比较直观,而用神经网络不能求出回归方程。最小二乘法等一般回归方法是以求解回归方程为目的,本次分析研究中,先建立了闸孔出流的数学模型,根据此模型和样本数据进行下一步的计算。而神经网络是通过学习来逼近目标函数,它把信息记忆在相关联的连接权上,当误差达到一定要求时,就形成了输入和输出之间的一定程度上的近似对应关系。
2.3.4回归数据统计效果
最小二乘法是对目标函数的一种近似求解,是一种用数学模型去近似表达输入输出的某种关系。对于模型的选取要求较严格。神经网络是对目标函数的逼近,只要网络结构合理,训练效果好,回归出的数据精度相比最小二乘法要高,从本次计算数据上也证明了这一点。
三、总结
通过运用最小二乘法、神经网络法这2种回归方法分析京石段第4次通水放水河节制闸、坟庄河节制闸、北拒马河节制闸、沙河引水闸数据,可得出闸门开启程度、流量系数与水头具有相应的函数关系。应用最小二乘法推算出的流量系数,为闸孔自由出流的淹没系数,而查表得出的淹没系数会使误差加大。而神经网络在输入层数据矩阵中有闸孔开度、闸前水位、闸后水位和孔口净宽4项,考虑影响因素更全面,输入层数据矩阵为实测流量。
其中个别点误差较大,是由于仪器、检测条件、环境等因素的限制,对于实测流量的测量不可能无限精确,测量值与客观存在的真实值之间总会存在着一定的差异,这是不可避免的。由于京石段运行年数有限,实测数据并不充足,相信在日后数据更充足情况下计算的数据会更具备参考价值。
参考文献:
[1]廖伟明,罗剑,周斌.最小二乘法在水文参数率定中的应用[J].上饶市水利水电勘测设计院,2012(04).
[2]吴新根,葛家理.人工神经网络在回归分析中的应用[J].北京石油大学,1995(07).
[3]陈晓楠,黄强,邱林,等.基于神经网络的农业干旱评估模型及其概率分布研究[J].西安理工大学,2011(05).
[4]孙东坡,丁求新.水力学[M].黄河水利出版社,2009.
[5]宋孝玉,马细霞.工程水文学[M].黄河水利出版社,2009.
南水北调京石段稳定调度状态分析