[拼音]:quxian nihe

[英文]:curve fitting

用连续曲线近似地刻画或比拟平面上离散点组所表示的座标之间的函式关系。更广泛地说,空间或高维空间中的相应问题亦属此范畴。在数值分析中,曲线拟合就是用解析表示式逼近离散资料,即离散资料的公式化。实践中,离散点组或资料往往是各种物理问题和统计问题有关量的多次观测值或实验值,它们是零散的,不仅不便于处理,而且通常不能确切和充分地体现出其固有的规律。这种缺陷正可由适当的解析表示式来弥补。

数学表述

设给定离散资料

(1)

式中xk为自变数x(标量或向量,即一元或多元变数)的取值;yk为因变数 y(标量)的相应值。曲线拟合要解决的问题是寻求与(1)的背景规律相适应解析表示式

(2)

使它在某种意义下最佳地逼近或拟合(1),ƒ(x,b)称为拟合模型;

为待定引数,当b)仅在ƒ中线性地出现时,称模型为线性的,否则为非线性的。量

称为在xk处拟合的残差或剩馀,衡量拟合优度的标准通常有

式中ωk>0为权系数或权重(如无特别指定,一般取为平均权重,即

(k=1,2,…,m),此时无需提到权)。当引数b)使T(b))或Q(b))达到最小时,相应的(2)分别称为在加权切比雪夫意义或加权最小二乘意义下对 (1)的拟合,后者在计算上较简便且最为常用。

模型中引数的确定

一般的线性模型是以引数 b)为系数的广义多项式,即

, (3)

式中g0,g1,…,gn称为基函式。对诸gj的不同选取可构成多种典型的和常用的线性模型。从函式逼近的观点来看,式(3)还能近似地体现许多非线性模型的性质。

在最小二乘意义下用线性模型(3)拟合离散点组(1),引数b可通过解方程组

(i=0,…,n)来确定,即解关于b0,b1,…,bn的线性代数方程组

(4)

式中

(i,j=0,1,…,n),

方程组(4)通常称为法方程或正规方程,当m>n时一般有惟一解。

至于非线性模型以及非最小二乘原则的情形,引数b)可通过解非线性方程组或最优化计算中的有关方法来确定(见非线性方程组数值解法、最优化)。

模型的选择

对于给定的离散资料(1),需恰当地选取一般模型(2)中函式ƒ(x,b))的类别和具体形式,这是拟合效果的基础。若已知(1)的实际背景规律,即因变数y对自变数 x的依赖关系已有表示式形式确定的经验公式,则直接取相应的经验公式为拟合模型。反之,可通过对模型(3)中基函式g0,g1,…,gn(个数和种类)的不同选取,分别进行相应的拟合并择其效果佳者。函式g0,g1,…,gn对模型的适应性起著测试的作用,故又称为测试函式。另一种途径是:在模型(3)中纳入个数和种类足够多的测试函式,借助于数理统计方法中的相关性分析和显著性检验,对所包含的测试函式逐个或依次进行筛选以建立较适合的模型(见回归分析)。当然,上述方法还可对拟合的残差(视为新的离散资料)再次进行,以弥补初次拟合的不足。总之,当资料中变数之间的内在联络不明确时,为选择到相适应的模型,一般需要反覆地进行拟合试验和分析鑑别。

参考书目

冯康等编:《数值计算方法》,国防工业出版社,北京,1978。

A.拉尔斯登、H.S.维尔夫著,徐献瑜等译:《数字计算机上用的数学方法》,上海科学技术出版社,上海,1963。(A.Ralston and H.S.Wilf,MatheMatical Methods for Digital Computers,John Wiley & Sons, New York, 1960.)

更多信息: 银河最新网址 汇旺担保 数据 汇旺担保 买U 汇旺担保 接码