2014-02-11 09:26:49
在拟合势能函数的时候, 除解析式外, 也可以利用样条函数进行拟合. 样条拟合与其插值正好相反: 已知函数在节点上的值求任意位置的值, 做插值; 已知函数的某些组合值求函数节点上的值, 属于拟合. 由于样条函数可以化为节点函数值的线性表达式, 这样就可以将待求参数线性化, 得到最优情况下函数的形状, 为寻找合适的解析式提供依据, 当然也可以直接利用得到的离散数据拟合解析式.
样条函数可以是零阶, 一阶, 二阶, 三阶或更高阶. 实际使用中, 三阶使用最为普遍. 由于三次样条的构造需要求解一个三对角线性方程组, 其显式解很难得到, 所以线性化结果很繁琐.
- 零阶
在每一区间上样条函数为常量, 函数整体呈台阶状. 对等距情况, 计算时最好使用就近原则, 取最近点的值作为拟合点, 可用i=nint(x/dx)
实现.
- 一阶
在每一区间上样条函数为线性函数, 函数整体呈折线状.
$f_i(x)=y_i+{y_{i+1}-y_i \over \Delta x} (x-x_i)$
此式自动满足函数值连续条件, 即零阶连续.
- 二阶
在每一区间上, 样条函数为二次函数, 整体一阶连续, 即有连续的导数. 但仅有节点的函数值不能唯一确定整个函数, 还须提供某一节点上的导数值, 一般可令端点的导数值为零. 二次样条函数在偶数点的曲率不连续. 由二阶开始, 插值函数不再具有局域性, 改变某一节点, 函数整体都会改变. 使得线性系数分离很困难.
\[\begin{align} f_i(x) &=y_i + k_i (x-x_i) + {k_{i+1}-k_i \over 2 \Delta x} (x-x_i)^2 \\ k_{i+1} &=-k_i+2 {y_{i+1}-y_i \over \Delta x}, k_i=2 {y_{i+1}-y_i \over \Delta x}-k_{i+1} \end{align}\]可化简得
\[\begin{align} f_i(x) &= y_i+k_i(x-x_i) + (y_{i+1}-y_i-k_i \Delta x) ({x-x_i \over \Delta x})^2 \\ &= \alpha^2 y_{i+1} + (1-\alpha^2) y_i + (1-\alpha)\omega k_i \\ \alpha &= \omega/\Delta x, \; \omega=x-x_i \end{align}\]对势能函数, 一般满足远距离处导数为零, 故可使用自然条件 $k_n=0$ , 由此, 可推知所有系数 $k_i$ .
令 $k_i = {2 \over \Delta x} T_i, \Delta_i=y_{i+1}-y_i$, 则 $T_i$ 满足递推式
$T_i = \Delta_i - T_{i+1}$
可求得
\[\begin{align} T_i = \sum_{j=i}^{n-1} (-1)^{j-i} \Delta_j \end{align}\]样条函数可写为
$f_i(x)=\alpha^2 y_{i+1} + (1-\alpha^2) y_i + 2\alpha(1-\alpha)T_i, \; \alpha = (x-x_i)/\Delta x$
对不等距划分, 令 \(\Delta_i={y_{i+1}-y_i \over x_{i+1}-x_i}\), $k_i$ 满足如下递推式
$k_i = 2 \Delta_i -k_{i+1}$
求得
\[\begin{align} k_i = 2 \sum_{j=i}^{n-1} (-1)^{j-i} \Delta_j \end{align}\]- 三阶
对等距划分的均匀样条, 设节点为 $1, 2,….n$, 若 \(x \in [x_i, x_{i+1}], a=x-x_i, b=x_{i+1}-x, a+b=h=\Delta x\), 则
\[6 h f_i(x) = 6(a y_{i+1}+b y_i) + a(a^2-h^2)M_{i+1} + b(b^2-h^2)M_i\]$M_i$ 为节点的二阶导数, 对应于力学上的弯矩, 满足下面的方程
\[M_i + 4 M_{i+1} + M_{i+2} = d_{i+1} = {6 \over h^2} (y_{i+2}-2y_{i+1}+y_i), \\ i=1,2...n-2\]要求的 $M_i$ 个数为 $n$, 而对应的方程数目为 $n-2$, 故还需两个边界条件才能唯一确定, 边界条件可取为两端点的导数值或是二阶导数值. 常用的自然边界条件指 \(M_1=M_n=0\). 加上边界条件后便可求得 \(M_2, M_3, ...M_{n-1}\)
$M_i$ 满足的方程为
\[\begin{matrix} 0 &+ & 4M_2 &+ & M_3 &= &d_2 \\ M_2 &+ & 4M_3 &+ & M_4 &= &d_3 \\ M_3 &+ & 4M_4 &+ & M_5 &= &d_4 \\ \vdots & \vdots & \vdots & \vdots & \vdots & \vdots & \\ M_{n-3} &+ & 4 M_{n-2} &+ & M_{n-1} &= &d_{n-2} \\ M_{n-2} &+ & 4 M_{n-1} &+ & 0 &= &d_{n-1} \end{matrix}\]写为矩阵形式
\[\begin{bmatrix} 4 & 1 & 0 & \cdots \\ 1 & 4 & 1 & \cdots \\ \vdots & \vdots & \vdots & \vdots \\ \cdots & 1 & 4 & 1 \\ \cdots & 0 & 1 & 4 \\ \end{bmatrix} \left[ \begin{array}{c} M_2 \\ M_3 \\ \vdots \\ M_{n-2} \\ M_{n-1} \end{array} \right] =\left[ \begin{array}{c} d_2 \\ d_3 \\ \vdots \\ d_{n-2} \\ d_{n-1} \end{array} \right]\]可见, 此方程为三对角方程组, 对角占优, 存在唯一解, 可利用所谓的追赶法求解. 中文常称的追赶法, 是Thomas方法的形象翻译. 大致求解过程分为两步:
-
追: 利用消元法将原方程化为二对角方程, 向前递推, 使系数矩阵主对角线变为1. 由第一个方程, 得到 $M_2$ 和 $M_3$ 的关系, 将其带入第二个方程, 消去主对角线下方系数. 以此进行, 最终追到 $M_{n-1}$, 得到其解. 变换后, 其方程为
\[\begin{bmatrix} 1 & A_2 & 0 & \cdots \\ 0 & 1 & A_3 & \cdots \\ \vdots & \vdots & \vdots & \vdots \\ \cdots & 0 & 1 & A_{n-2} \\ \cdots & 0 & 0 & 1 \\ \end{bmatrix} \left[ \begin{array}{c} M_2 \\ M_3 \\ \vdots \\ M_{n-2} \\ M_{n-1} \end{array} \right] =\left[ \begin{array}{c} D_2 \\ D_3 \\ \vdots \\ D_{n-2} \\ D_{n-1} \end{array} \right]\] -
赶: $M_{n-1}$ 已经追得, 然后由此倒推, 得到其他 $M_i$ 值.
对上面的方程, 由于系数是固定的, Thomas方法的递推式为
\[\begin{align} A_2 &= {1 \over 4}, & A_i &= {1 \over 4-A_{i-1}} \\ D_2 &= A_2 d_2, & D_i &= A_i(d_i-D_{i-1}) \\ M_{n-1} &= D_{n-1}, & M_i &= D_i-A_i M_{i+1} \end{align}\]对 $A_i$, 可求得其通式
$A_i=2-\sqrt{3} \dfrac{t^i+1} {t^i-1}, t=(2+\sqrt{3})^2$
对 $D_i$, 向后递推至 $D_2$, 一般项可写为
\[\begin{align} D_j = \sum_{k=2}^j (-1)^{j-k} P_k^j d_k \end{align}\]对 $M_i$, 向前递推至 $M_{n-1}$, 一般项可写为
\[\begin{align} M_i = \sum_{j=i}^{n-1} (-1)^{j-i} P_i^{j-1} D_j \end{align}\]综合上面两个结果, 得到
\[\begin{align} M_i &= \sum_{j=i}^{n-1} \sum_{k=2}^j (-1)^{2j-i-k} P_i^{j-1} P_k^j d_k \\ &= \sum_{j=i}^{n-1} \sum_{k=2}^j (-1)^{i+k} P_i^{j-1} P_k^j d_k, \; i=2,3,...n-1 \\ P_m^n &= \prod_{l=m}^n A_l = A_m A_{m+1} \ldots A_{n-1} A_n, \; n>m \\ \end{align}\]根据插值公式
\[\begin{align} d_k &= {6 \over h^2} (y_{k+1}-2y_k+y_{k-1}) \\ 6 h f_i(x) &= 6(\alpha y_{i+1}+\beta y_i) + \alpha(\alpha^2-h^2)M_{i+1} + \beta(\beta^2-h^2)M_i \end{align}\]以划分间距 $h$ 为单位, 约化上述公式
\[\begin{align} f_i(x) &= \alpha y_{i+1}+\beta y_i + \alpha(\alpha^2-1)\mu_{i+1} + \beta(\beta^2-1) \mu_i \\ \alpha &={a \over h}, \beta={b \over h}=1-\alpha, \mu_i={M_i \over 6/h^2} \end{align}\]由此可见, 虽然三次样条函数仍可写为节点值的线性形式, 但其系数十分复杂.
上面公式看起来清楚, 但是实际计算时需要计算 $M_i$ 和 $M_{i+1}$, 两个三重循环, 整体计算量为 $O(N^3)$. 利用 $A_i$ 的近似关系和 $M_i$ 的递推关系可以将公式的计算量减少一些.
\[\begin{align} f_i(x) &= \alpha y_{i+1}+\beta y_i + \alpha(\alpha^2-1)\mu_{i+1} + \beta(\beta^2-1) \mu_i \\ &= \alpha y_{i+1}+\beta y_i + \beta(\beta^2-1) D_i \\ &+ [\alpha(\alpha^2-1)-\beta(\beta^2-1)A_i] \mu_{i+1} \end {align}\]对不等距划分, 上面的递推公式太过复杂, 很难写出一般项了. 样条函数可写为
\[\begin{align} f_i(x) &= {a y_{i+1} + by_i \over h_i} + {a(a^2-h^2)M_{i+1}+b(b^2-h^2)M_i \over 6h_i} \\ h_i &= x_{i+1}-x_i, a=x-x_i, b=h_i-a \end{align}\]$M_i$ 满足方程
\[\begin{align} h_i M_i + 2(h_i+h_{i+1}) M_{i+1} + h_{i+1}M_{i+2} \\ = 6( {y_{i+2}-y_{i+1} \over h_{i+1}} - {y_{i+1}-y_i \over h_i} ), \\ i=1,2,\cdots,n-2 \end{align}\]代码及测试测试结果
awk
实现的代码如下
# Language: bash
awk ' BEGIN{ Ndat=0 }
NF==3 { Ndat++; X[Ndat]=$2; Y[Ndat]=$3 }
END {
for(i=1; i<Ndat; i++) dX[i]=X[i+1]-X[i]
for(i=2; i<Ndat; i++) d[i]=6*( (Y[i+1]-Y[i])/dX[i] - (Y[i]-Y[i-1])/dX[i-1] )
A[1]=0; A[Ndat]=0
D[1]=0; D[Ndat]=0
for(i=2; i<=Ndat-1; i++) {
ai=dX[i-1]
bi=2*(dX[i-1]+dX[i])
ci=dX[i]
A[i]=ci/(bi-ai*A[i-1])
D[i]=(d[i]-ai*D[i-1])*A[i]/ci
}
M[Ndat]=0
for(i=Ndat-1; i>1; i--) M[i]=D[i]-A[i]*M[i+1]
# for(i=1; i<=Ndat; i++) print i, dX[i], d[i], A[i], D[i], M[i]
h=X[2]-X[1]
for(x=X[1]; x<X[Ndat]; x+=.1*h) print x, SP2(x, 0, Ndat, X, Y, dX), SP3(x, 0, Ndat, X, Y, dX, M)
}
function SP2(x, i, Ndat, X, Y, dX, j,a,ki) {
if(i==0) {
for(i=1; i<Ndat; i++) if(X[i+1]>x) break
}
ki=0
for(j=i; j<=Ndat-1; j++) ki += 2*(-1)^(j-i)*(Y[j+1]-Y[j])/dX[j]
a=(x-X[i])/dX[i]
return a^2*Y[i+1]+(1-a^2)*Y[i]+(1-a)*ki*(x-X[i])
}
#
function SP3(x, i, Ndat, X, Y, dX, M, a,b,h) {
if(i==0) {
for(i=1; i<Ndat; i++) if(X[i+1]>x) break
}
h=dX[i]
a=x-X[i]; b=h-a
return (a*Y[i+1]+b*Y[i])/h + ( a*(a^2-h^2)*M[i+1]+b*(b^2-h^2)*M[i] )/(6*h)
}
#
function Psp3(Ndat, i,j,k,a) {
a=(2+sqrt(3))^2
for(i=2; i<Ndat; i++) {
for(j=i; j<Ndat; j++) {
P[i,j]=1
for(k=i; k<=j; k++) P[i,j] *= 2-sqrt(3)*(a^k+1)/(a^k-1)
}
}
}
#
function uniSP3(x, i, Ndat, X, Y, j,k,a,b,h) {
if(i==0) {
for(i=1; i<Ndat; i++) if(X[i+1]>x) break
}
h=X[2]-X[1]
a=(x-X[i])/h; b=1-a
for(j=1; j<=Ndat; j++) Coef[j]=0
Coef[i] += b
Coef[i+1] += a
Rsec=b*(b^2-1)
for(k=2; k<=i; k++) {
Rtmp=Rsec * (-1)^(i-k) * P[k,i]
Coef[k+1] += Rtmp
Coef[k] += -2*Rtmp
Coef[k-1] += Rtmp
}
Rsec=a*(a^2-1)-b*(b^2-1)*P[i,i]
for(j=i+1; j<=Ndat-1; j++) {
Rij=Rsec * (-1)^(i+1)
if(j!=i+1) Rij *= P[i+1,j-1]
for(k=2; k<=j; k++) {
Rtmp=Rij * (-1)^k * P[k,j]
Coef[k+1] += Rtmp
Coef[k] += -2*Rtmp
Coef[k-1] += Rtmp
}
}
F=0
for(j=1; j<=Ndat; j++) F += Coef[j]*Y[j]
return F #( a*Y[i+1]+b*Y[i] + a*(a^2-1)*Mi(i+1, Ndat) + b*(b^2-1)*Mi(i, Ndat) )
}
#
function Mi(i, Ndat, j,k,Rtmp,ret) {
ret=0
for(j=i; j<=Ndat-1; j++) {
Rtmp=(-1)^i
if(j!=i) Rtmp *= P[i,j-1]
for(k=2; k<=j; k++)
ret += Rtmp*(-1)^k*P[k,j] *d[k]
}
return ret
}
' ABS >ABS.sp
# ' CUB > CUB.sp
#' LJ >LJ.sp
利用Matlab的csape函数
可以进行三次样条函数的插值, 示例代码如下
# Language: clike
format long
x=1:0.02:15;
y=-1E3*(-12./x.^13+6./x.^7);
pp=csape(x,y,'second',[0,0]);
pp=csape(x,y);
xsp=1:0.01:1.5;
ysp=ppval(pp,xsp);
yst=-1E3*(-12./xsp.^13+6./xsp.^7);
plot(x,y,'o',xsp,ysp,'-',xsp,yst,'-')
axis([1 1.5 -600 600])
FID=fopen('LJ.mat', 'w');
Ndat=length(xsp);
for i=1:Ndat
fprintf(FID, '%f %f\n', xsp(i), ysp(i));
end
几个测试函数的结果
样条函数的积分
对已经拟合的样条函数进行数值积分时可利用可利用Simpson方法. Simpson方法具有三阶精度, 对不超过三次的多项式精确成立, 很适合于二次和三次样条函数.