• / 29
  • 下载费用:1 下载币  

地球物理学中的反演问题

关 键 词:
物探 地震资料解释 地震处理 反演
资源描述:
地球物理学中的反演问题1、介绍物理科学的一个重要的方面是根据数据对物理参数做出推断。通常,物理定律提供了计算给定模型的数据值的方法,这就被称为“正演问题”,见图反演问题中,我们的目标是根据一组测量值重建物理模型。在理想情况下,存在一个确定的理论规定了这些数据应该怎样转换从而重现该模型。从选择的一些例子来看,这样一个存在的理论假定了(我们)所需要的无限的、无噪声的数据是可以获得的。在一个空间维度中,当所有能量的反射系数已知时,量子力学势能可以被重建[955; 980]。这种手法可以推广到三维空间[989],但是在那样的情形下要求有多余数据组,其中的原因并不是很理解。在一条一维的线上的质量密度可以通过对它的所有本征频率的测量来构建[946],但是因为这个问题的对称性,因而只有偶数部分的质量密度可以被确定。如果(地下的)地震波速只和深度有关,那么根据地震波的距离,运用阿贝尔变换,这个速度可以通过测定震波的抵达时间来精确构建[907;907]。从数学上看,这个问题和构建三维空间中的球对称量子力学势是相同的[et 1956]。然而,当波速随着深度单调增加时,构建法只能给出唯一解[966]。这种情况和量子力学是相似的,在量子力学中,当电势没有局部最小值时,径向对称势只能被唯一建立[973]。(量子力学相关概念不熟悉,翻译起来有点坑~~)图它们的适用性是有限的。原因有很多。第一,精确的反演法通常只在理想状态下适用,这在实际中可能无法保持。比如,演假定了地下的波速只依赖于深度并且随着深度单调增加。地震层析成像显示这两点要求在地幔层都不满足[et 1994]。第二,精确反演方法常常很不稳定。 et 994]已经清楚地展示了 程解中这种不稳定性的存在。然而,第三个原因是最根本的。在很多反演问题中,我们要确定的模型是空间变量的一个连续函数。这意味着该模型有无穷多的自由度。然而,在实际实验中,能够用来确定模型的数据数量通常都是有限的。通过变量的简单计算表明这些数据不能承担足够的信息来唯一确定模型。在线性反演问题的背景下, 967,1968]提出了这一观点,之后 994]也提出来这点。这个问题对于非线性反演问题同样相关。在实际实验中有限多的数据可以用来重建具有无穷多自由度的模型这样的事实必然表明反演问题不是唯一的,在这个意义上讲,有很多模型同样可以很好地解释这些数据。因此,从数据反演中得到的模型不一定等于我们想要的真实模型。这意味着图 1 中展示的反演问题的观点太简单了。对于现实问题,反演实际上包含两步。用 表示真实模型, 表示数据。由数据 我们得到一个这一步称为 估计问题( ,看图 2。除了~估计一个和数据一致的模型 ,我们也需要探究估计模型 和真实模型 具有~m~什么关系。在评价问题中,我们会确定估计模型获得了真实模型的哪些性质以及附带了哪些误差。这部分讨论的实质就是 反演 =估计 +评价 。当我们作出一个物理解释却不承认模型中存在误差的事实以及有限的精度,这是没有多少意义的 [1998]。图两个原因可以解释为什么估计模型跟真实模型不同。第一个原因是反演问题的非唯一性,这使得一些(通常是无穷多的)模型满足这些数据。从技术上来讲,这个模型因为模型空间的不充分取样所以零空间存在。第二个原因是实际数据(以及物理理论比我们想要的更频繁)总是受到误差的污染,所以估计模型也受到这些误差的污染。所以模型评价有两个方面,非唯一性和误差传播。模型估计和模型评价对于具有有限自由度的离散模型和具有无穷多自由度的连续模型在根本上是不同的。而且,模型评价的问题只有在线性反演问题上得到很好的解决。因此,离散模型和连续模型的反演是分开处理的。线性反演和非线性反演的情况也是分开处理的。在第 2 节将讨论有限数量模型参数的线性反演。在第 3 节中将推广为处理带有无穷多自由度的连续模型的线性反演问题。实际上,很多反演问题都不完全是线性的,但是这些问题常常可以通过做一些适当的近似来线性化。在第 4 节中将推导出单次散射近似。这种方法形成了运用于反射地震学中的成像工具的基础。理将在第 5 节介绍,它是关于线性化的,构成了使用正则模态频率对地球结构进行反演的基础。地震波传播时间层析的线性化方法是基于 理的,这将在第 6 节介绍。非线性反演问题要明显难于线性反演问题。第 7 节将会说明非线性可能是不适定性的一个来源。目前,对于非线性反演问题的评价问题还没有令人满意的理论。在第 8 节将会介绍三种可用于非线性评价问题的方法。然而,这些方法没有一个是非常令人满意的,表明非线性反演理论是一个有重要研究挑战的领域。2、解有限的线性方程组在前面的章节中讨论过,反演问题将有限的数据映射到一个模型上。在地球物理学大多数实际应用中,该模型是空间坐标的一个连续函数,因此具有无穷多的自由度。我们暂时忽略这点并假定该模型的特征可以由有限个参数确定。我们将回到这些模型的重要情形,在第 3 节中这些模型会是无限维的。性模型估计对于一个有限维的模型,模型参数可以规定为向量 ,类似地,数据可以规定矩阵 通过乘积 将数据关联到模型上。这个矩阵常常被称为理实,在给定的问题上,它包含了我们选择给模型的所有物理和数学信息。实际上,这些数据包含了误差 ,因此记录的数据和该模型的关系应该1)有一点需要经常注意的是,我们对于包含在模型向量 中的模型参数的选择有如,若想要描述地球的密度,我们可以选择一个模型,在该模型中,地幔和地核具有均匀密度,在这种情况下存在两个模型参数。或者,我们可以把大量定义在球体上的特征方程中的地球密度展开,比如描述横向变化的球谐函数以及描述深度方向变化的多项式,这种情况会有更多的模型参数。在同一个模型上的这两种不同参数化方法对应于不同的模型参数 和不同的矩这个例子表明模型 m 不一定是真实的模型,但是对模型参数的选择通常下我们将把 认为是真模型,虽然对于它的定义存在很多困难。由记录的数据我们得到模型的一个估计。因为这个估计实际上跟真模型是不同的,我们用 来表示估计模型。有很多方法来设计一个逆运算将数据映射m~到估计模型上[984;987;994]。无论选择什么估计量,从数据到估计模型之间最一般的线性映射可以写做(2)~算子 称为矩阵 的广义逆。一般来说,数据的数量不等于模型参数的数量。此, 通常是一个非方阵矩阵,所以它的正常逆矩阵是不存在的。随后我们将说明广义逆矩阵 如何来选择,但目前 并不需要作详细说明。被估计模g 与真模型 之间的关系遵循如下表达式(将等式(1)代入等式(2))m~(3)~矩阵 称为 精度矩阵( ,这个算子被定义为4)表达式(3)可以写成下列形式来进行解释(5)误 差 部 分有 限 分 辨 率 )(~在理想情况下,估计模型等于真模型向量: 表示我们选择的参数(列在~向量 中)可以被相互独立估计。等式(5)中最后两项分别解释了估计模型中糊度( 和 伪差( 。 描述了估计模型向量的元素是真模型向量不同元素的线性组合。我们只能取得模型估计中的参数平均值和模糊度,因为我们无法映射出最完美的细节。在理想情况下,这一项是为零的,此时 等于单位矩阵。由(4)可知,对于完美解决的模型参数,度矩阵为单位矩阵,即6)如前所述,通常定义向量 的模型参数的定义存在某种歧义。精度算子告诉了是,精度矩阵并没有完全告诉我们估计模型和真实的潜在物理模型之间的关系是什么,因为它没有考虑模型参数的选择对于在估计过程中能够得到的模型的限制程度。表达式(5)中的最后一项描述了误差 是怎样映射到估计模型上去的。这则它们就能从数据中减去。因为数据中存在误差,所以需要一个统计分析来描述估计模型中的这些误差。当数据 不相关且有标准差根据数据误差传播,模型估计 中的标准差 表达为jdim~ 22)(7)理想上来看,我们希望同时获得:一个完美的精度,以及不存在误差的估计模型。不幸的是,实际上这是不可能实现的。比如,使用广义逆阵 完0导致(荒谬的)估计模型 ,这样确实不受误差的影0~是,这个特殊的广义逆阵对应的精度矩阵是 ,显然这和理想的精度去甚远。因此,实际上我们需要在误差传播和精度限制之间找到一可接受的平衡点。小二乘估计我们现在来考虑这样的情况:独立数据的数量多于未知数的数量。在这种情况下,等式 不总是对任意给定的模型 都满足,因为数据向量中包含的可如,我们来考虑下面的问题。我们有两个物块质量分别是 和 。第一个物块的称重得出 1 千克质量。某人测量第二个物块,12结果得出 2 千克质量。接下来,某人把两个物块放在一起称重,结果发现总质量是 2 千克。这个问题中测量的结果可以用下列方程组表示 1) 321示为A10A(9)显然,这个方程组是不能满足的。不可能第一个物块质量是 ,第二个物1而它们的质量之和 。显然测量中存在误差,但2 3(略)生动地阐述了这个问题。在 平面中,三个方程对应三条实线。三条线不相交于同一点)( 21,以,采用合理的方法调和这些方程是确定两个物块质量的反演问题的一部分。通常估计模型的一种方法是寻找一个能够最佳拟合数据的模型 ,在这个m~意义上,数据向量 和再估算数据 之间由 范数(即欧几里德距离,延2量的差值要尽可能小。这表示由模型给出的最小二乘解最小化下列目标函数图(10)详细说明了这个量由下列模型估计最小化198(11)在图 3 的例子中,最小二乘解是 平面中到三条实线距离最短的点,)( 21,用矩阵(9),我们很容易得出问题(8)的最小二乘估计量由下式给出123~1(12)代入数据向量,分别得到估计模型 3/2~13)小范数估计在一些问题中,未知量的数量少于参数的数量。例如,考虑这样一个情形:有两个物块 和 ,某人只测量了它们的总质量14)相应的矩阵 表示为A1A(15)这个问题被形象地表示在图 4(略)中。显然,任何位于该实线上的模型向量都严格满足等式(14)。因此,考虑到质量是正值,则存在无限多完全满足数据的解。一个模型估计可以通过选取一个完全满足数据且具有最小 范数的2个模型在图 4 中用黑色方块表示。图据不足地说明)方程组系统,最小范数解定义为完全满足数据,即 ,且最小化 的模型。使用拉格(16)给出了详细推导。我们很容易得出系统(14)的最小范数解1984m(17)定问题(最小二乘估计中,我们假定即使由于测量误差导致出现矛盾,我们仍然有足够的信息来求出所有模型参数。所以,这就变成一个完全超定(因素决定)的问题,作为结果 是正则的。在最小范数解中,是我们没有足够的方程求出所有模型参数。这就是一个完全欠定的问题,这里的 是正则的。然而,最一般的情另一些则因为缺乏信息而无法评估出来。这时,无论 还是 都不能求逆(,这个问题是不适定即使逆矩阵是正式存在的,它们通常也是病态(,这意味着数据向量中很小的变化会导致模型估计中很大的变化。这表示数据中的误差在模型估计中将会被放大。显然,我们需要一点技巧来寻找一个模型,让它对数据中的小变化不那么敏感。带着这个目的,引入一个阻尼最小二乘解。从数学的观点来看,不适定性和病194零或接近于零的奇异值引起的。(这一句可能不准确)它的特征值( ,特征向量为 ,Mnnˆ则有nˆ(18)我们容易得到矩阵 的特征值为 ,则有ˆˆ(19)这表示矩阵的特征值可以通过向原矩阵添加一个乘了系数的单位矩阵来获得。这个性质可以用来定义阻尼最小二乘解(20)因为矩阵 具有正的特征值,则当常数 为正时, 的特征值将在正方向离零更远(以便消除不适定性和病态)。这样,(20)的解可通过最小化下面的价值方程得到22(21)这个表达式清楚地表明阻尼在当中的作用。最小化(21)式的第一项实际上是寻找最满足数据的模型。最小化(21)式的最后一项相当于寻找有最小范数的模型。一般地,我们不能同时最小化这两项,但是在最小化(21)式时,我们采取折衷的办法去找一个模型既能够合理满足数据又能够获得不太大的模型尺度。参数 控制着我们对这两个相互冲突的要求的侧重,因此它被称为 权衡系数( 。对许多应用来说,下面的矩阵性质是非常有用的111 2)在这个表达式中, 和 是正则方阵,然而 并不需要是方阵。这个表达式可以证明当采用加阻尼或者正则化时,最小二乘解和最小范数解(两者都采用了一个阻尼项)是完全相同的。为了理解这点,我们令(22)式中 ,-,则有111   (23)左手边相当于加阻尼的最小二乘解,右手边是(16)式最小范数解的加阻尼形式。这表明加阻尼后最小二乘解和最小范数解释完全相同的。小二乘解的一致性问题最小二乘解看似为寻求超定问题的解提供了一个客观的方法。不过,后面还存在问题。要理解这一点,我们来考虑方程组(8)超定系统。从数学角度看,当我们在最后一个方程左右乘上 2,这个方程组系统不会改变。以下这两个方程组系统是完全等价的42121312321 4)原系统矩阵和新的等价系统矩阵可以表示为,以及 10A210A(25)在这部分,无撇号的量表示原方程组系统,而有撇号的量则表示变换后的方程组系统。我们容易得到原系统以及变换后系统的最小二乘解(11),如下,以及 123~ 25491~(26)代入原数据向量 和变换后数据向量 的数字值,可以得到下列模型的估计值d,以及 3/52~m9/145~(27)问题是,关于同一个模型的这两个估计量是不同的。这很奇怪,因为在(14)式中原方程组系统和变换后的系统在数学上是完全等价的。这两个解不相等是因为原数据空间和变换后数据空间的量度在变换过程中被改变了。这是一种不同的说法,即在使用最小二乘准则解决这两个方程系统的过程中,距离是用不同方法测量出来的。因为最小二乘解最小化了距离,所以当数据空间的量度(或称测量单位)改变后最小二乘解随之发生改变是说得通的。这表明最小二乘解并不像乍看之下那么客观,因为任意变换方程系统会导致不同的最小二乘解!对于最小二乘解,其广义逆表达为 。我们很容易推导出原系统和变换后系统的精度矩阵都等于单位矩阵,即: 以及。因此,两个系统都具有完美的精度!读者也许有兴趣停下来解释一下(27)式中不相等的估计模型是怎么被调和的。这里出现矛盾的原因是(5)式中的误差传播项 。我们知道在表达式24)中定义的系统中使用的数据一定要带上误差才能使得方程没有矛盾。方程按比例缩放后,两个方程组系统中的数据和误差按不同方式得到调节,这样就得到了不同的模型估计。因此,在方程组中由误差造成的矛盾产生了最小二乘解对任意比例缩放操作的依赖。我们现在来考虑数据向量和模型向量在更一般的变换条件下的最小二乘解。初始方程系统如下 28)这个表达式不是很正确,因为我们忽略了误差 ,而误差总是存在的。这就是们必须找到这个方程组系统的的最小二乘解。我们来考虑通过一个变换矩阵 来对模型参数作变换:(29)以及通过一个变换矩阵 来对数据向量作变换:(30)假设 可逆,则变换后的方程组系统可以表达为1(31)原方程组系统(28)式的最小二乘解为(32)变换后方程组系统(31)式的解与上式形式相同,只要令 , 用1样就给出了变换后模型向量 的解。为了将这个解和模型估 m计(32)式进行比较,我们需要将它变回原模型空间,使用关系式 。m1将最小二乘解 写成关于变换矩阵 和 的形式,有2~(33)( 表示对 先转置后求逆)1们对 项反复使用矩阵性质11到11表达式1111  (33)可以简化为 (34)比较该式和原系统表达式(32)中的最小二乘解 ,我们发现1~m— 当 可逆时,对模型向量作 变换不影响最小二乘解,当 时,对数据向量作 变换也不影响最小二乘解。对于第一个性质的理解,我们回忆前文可知在最小二乘问题中的目标函数不会最小化模型范数,只是对数据做了最小化拟合。对于第二条性质的理解,我们可以对比变换前后被最小的那些量。对于原系统,我们最小化的是:2(35)对于变换后的系统,我们最小化的是:2(36) 变换矩阵 是幺正矩阵(如果一个 n 阶方阵,它的列向量构成一组标准正交基,那么这个矩阵就是幺正矩阵),也就是当 时,上述两个量是相等。这个结果体现了这样一个性质,即幺正矩阵不影响向量的范数。小范数解的调和问题协调性问题不仅针对最小二乘解,最小范数解也面临同样的问题。以(14)中的欠定方程组系统为例,这个问题的最小范数解为, 1~m 1~2m(37)作模型向量 到新模型向量 的一个变换: 21m(38) 2对于这个新模型向量,方程组系统变成了19)需要注意的是,这个变换后的模型向量揭示了这样一个事实,变换后的系统比原系统(14)欠定得更加明显,因为新系统没有对模型参数 施加任何约束。2m变换方程(39)的最小范数解为 , 。在(38)式变换作用下,变2~1后模型空间的这个解跟下面的这个原模型空间的解是一致的:, 2~1 0~2(40)这个解在图 4 中用空心方块表示。需要注意的是,这个解与原方程组系统的最小范数解(37)式是不同的。这里出现矛盾的原因跟 中最小二乘解的调和问题是相似的;变换方程(38)已经改变了模型空间的度量标准,所以原模型空间和变换后模型空间中的距离是以不同方式来计量的。一次,原问题和变换后问题的最小范数解是不同我们可以模仿 中的最小二乘解,对模型向量和数据向量在一般变换下得到的最小范数解的变换性质做一个类似的一般化分析。但是,在实际应用中,我们会对方程组作正则化。正如方程(23)所示,阻尼最小二乘解和阻尼最小范数解是完全相同的。因此,一般性的变换性质将在下一节阻尼最小二乘解中来讨论。求更一般的正则化对阻尼最小二乘解变换性质的分析与 中对非阻尼最小二乘解的分析是完全类似的。现在先忽略误差,线性方程组系统按(28)式表示为: ,模向量和数据向量的变换分别按(29)式和(30)式给出: 和 。假设 存在,则变换后的方程组系统按(31)式表示为: 。1S A1原系统的阻尼最小二乘解表示为(41)与(34)式类似,变换后方程组的阻尼最小二乘解表示为: (42)这里的阻尼参数不一定等于原阻尼最小二乘解中的阻尼参数,但是出于我们的目的,我们没必要让它们不等。表达式(42)可以通过(34)式中推导的相同步骤来简化。将 项写作 ,则有I1(43)这个表达式指向了一个基本的问题:模型空间 的阻尼项由单位矩阵m(见(42)式)给出,且当按照原模型向量 来表达时,阻尼项为 (见I 43)式)。这表示阻尼 对于模型参数变换并不是不变的。当进行数据向量I变换时就会产生 项。这表示在对数据向量或者模型向量作变换之后阻尼最此,需要有一个更一般的正则化可以允许以一致的方式改变模型和数据空间。这样一个一般的正则化可以在(43)式中找到,令 ,同时定义这样,一般性最小二乘解表示为(44)该解最小化下面的目标函数: (45)这个表达式表示一般情况下权阵 和 可以是任意的(只要它们是正定的以极小值)。按照这种写法, 可以被看作是一个权衡参数,它折中了S模型的两个特征:模型大小以及模型对数据的不符合性。模型的两个独立的性质不能都取得任意小,因此需要取一个平衡。然而,选取一个最适宜的 并不那么容易。我们已经清楚地表明,当你从一个简单阻尼最小二乘解开始时,你可以把那个问题转换成另一个坐标系中的一个更一般的正则最小二乘解,反之亦然。这表明相对于(44)式这种更一般的最小二乘解我们偏向阻尼最小二乘解是没有道理的。实际上,大多数反演问题都是不适定的(部分欠定部分超定)和病态的(数据中的微小误差引起很大的模型变动),它们和零空间同时出现,因此总是有非唯一解。所以需要进行正则化,但是在正则化的选取上存在很大不确定性[1997]。这反映出我们在解决反演问题时面临的基本难点:相对于选取正则化,解决方程组系统只是一个次要问题。采用贝叶斯统计法是其中一种方法,我们从统计学的角度结合关于数据和带实测数据的模型的先验信息来讨论反演问题[1982a; 1982b]。权阵反映了我们所掌握的关于数据和模型的真实的物理先验信息(从统计学角度),且独立于测量数据。比如,其中包括获取数据用的仪器的统计噪声特性,也包括来自其他自变量的模型和数据信息。(比如,地球的质量密度一定是正的。)在贝叶斯方法中,权阵为, 146)这里的 和 分布是数据和模型的先验协方差矩阵:1(47) (48)在这些表达式中,尖括号 代表期望值。在这个解释中,当误差服从高斯分布时,估计量(44)与最可能的后验模型是一致的。如果我们承认先验信息包含真实物理意义这样一个规律,则贝叶斯变换的统计学基础会推导出一个客观解。然而,实际上我们应该意识到对于数据和模型的先验分布的选择常常也是很主观的。读者可以在[的专栏“贝叶斯还是非贝叶斯”找到更加详细的信息。另一种方法是定义一个非拟合函数,这个方法赋予模型给定的性质(比如小,光滑等等)[994]。选择先验信息相当于定义一个适当的范数,在这个范数中非拟合的数据和任何给定的模型性质都会被测量。在我们的这个情况下,权阵会按 范数定义一个特定的矩阵。选择权阵 的一个很常见的例2L et 1987],该反演寻求一个与数据保持一致的最为平滑的模型。在这里,我们要求这个模型的梯度平方尽可能的小,也就是(45)式中最后一项是 一个离散化,而不22是在模型范数上施加一个约束,因此 跟拉普拉斯算子 的一个离散形式是阵的变化规则反演解的一个基本的要求应该是反演问题的解不依赖于对模型向量或数据向量所做的任意缩放变换。遗憾的是,这个要求经常被忽视,使得不同模型的对比变得毫无意义。了解实际含义可参阅[1990]以及[et 1992]。在这里,我们将推导在使最小二乘解保持不变的变换下,权阵 和 应该怎样调节。9)式中的模型向量缩放: 。在这个变换下,(45)最小二乘量中的模型项将作如下变换 1(49)其中10)对模型权作这样的变换不会改变最小二乘准则,因此,当模型权阵 经过变换得一提的是,这个变换规则意味着,对于贝叶斯反演(其中的权阵是模型协方差阵的逆矩阵,即 ),协方差阵应该作如1变化(51)我们容易从定义式(48)核实这确实是协方差算子的变换规则。接下来,我们考虑数据向量 的变换(30)式是怎样影响数据权阵的变换的。矩阵 在变换 的作用下作缩放变换。在这个变换作用下,5)中的数据项将作如下变换 1(52)其中13)对于贝叶斯反演,数据权阵是数据协方差阵的逆阵( ),这样对于一1应该作如下变换 (54)再次注意,这是在(47)式中定义的正确的协方差阵变换规则。这表明贝叶斯观点(即 和 是模型和数据协方差阵的逆矩阵)确保了在模型向量以及/或是不变的。尽管我们已经推导出在模型和数据向量变换下权阵 和 是怎样变换的,个不适定的以及/或者一个病态的反演问题只有当我们愿意通过施加一个正则化(来控制解时才能被解决。一般来说,选取权阵 和 的方法并不唯一。选取这些矩阵则决线性方程组系统应该注意的是,最小二乘解总是要求解决一组线性代数方程。比如,方程(44)可以写成~(55)这个公式表示的是线性方程组 的一个正方系统,也就是所谓的法方程组。么 不需要转换。如果我们还对实上我们总是会这样),那么就必须意识到 需要就要付出额外的计算机运算时间。许多标准的子程序包是可用的,[et 1989]对这个问题给出了一个很好很实际的介绍。但是读者需要明白,对于实际的地球物理问题,系统 可能变得非常庞大,所以值得去虑一个专门的程序,这个程序最匹配 的性质(对称性,带状的,稀疏的,等等)。法方程组的维数也值得考虑。记住矩阵 的维数是 ,其中 是据数量, 是模型参数数量。系统(55)具有模型空间的维数,但是运用M(22)式我们可以得到一个与数据空间维数严格等价的系统。选择最小的维数写出法方程可以节省很多计算机计算时间。大多数解决代数方程组的技术直接和 作用,总的来说需要足够的存储空间来承载这个矩阵。但是,比如在 全B 些维数可能会极度庞大( , ),这样就610种方法一次只能作用于 的一部分。另一个经常出现的包含了正则化,它仍然是奇异的或者数字上非常接近于奇异。奇异值分解(一个强有力的技术,它能精确判断出问题是什么,并且给出一个有用的数值解。反演理论中解释获得某个结果最有效的工具。迭代法或者 需要作用于方正系统,因此可能直接使用矩阵 。在这白一般化最小二乘解(44)等价于简单最小二乘解是有用的。02/12/12/156)读者可以参阅 987]中对于正定矩阵平方根的意义的讨论。还要记住在选择权阵时的某种自由(见 读者也许想要直接定义 而不是 。2/16)表明,正则化会往线性方程组系统中添加额外的行,但是扩大的系统仍然保持 形式,其中矩阵 和数据向量 被导致正则化的额外的行时在法方程中, 不再是方阵。我们现在将更详细地阐述应用在系统中的奇异值分解和迭代法的本质。 奇异值分解(奇异值分解是由 1961]年提出来的,这个方法是将矩阵的特征向量分解一般化至非方阵的情况。我们首先来考虑一个真实的对称矩阵 方阵N,它的特征向量是 ,对应的特征值是 。对于这样矩阵,其特征向量构Bnˆn成了一个单位正交组,因此任何向量 都可以由这些特征向量表示:x。当 作用于这个表达式时,结果可以写成ˆ1Bˆ1(57)用同样的特征向量 分解向量 ,则有 ,将其代入(57)nˆyˆ1式,可得下列解向量 的展开式:xˆ1(58)可以看出,小的特征向量可以导致解 的不稳定。奇异值分解将这个展开式推1961]以及 1980]给出了该方法的详细内容。现在来考虑下面的非方阵方程组系统:行行矩 阵 (59)奇异值分解基于 在单位正交组特征向量 下的展开式和 在单位正交组特征xnˆ的展开式。这些向量不可能是 的特征向量,因为 不是方阵,因此过,这些向量与下列关系式存在关联:,  ˆ(60)容易看出,当向量 是 的特征向量时,向量 是 的特征向量,因此nˆ和 有公共的非零特征值 。 被称 的奇异值。当 作用在 上时,结果可以写成:ˆ1(61)和的上限由非零特征值的数量来确定,因为零特征值对求和没有贡献。数字可以明显小于问题的维数: 且 。将向量 和向量 作为矩阵 和 的列是很方便的,从指标 往后(即nˆ始)的特征项对应于零特征值,需要把它们补充进矩阵 和 中使1P  0ˆˆˆ121 2),  0ˆˆˆ121 (63)特征向量的正交性意味着 , 。特征向量的完整性意味着。因为特征向量的正交性也存在于 和 的子空间 和以有 , 。但是,这些子空间中的向量一般不构成完以一般 , 。(61)式一般化至非方正系统可以写成, 4)其中 为p021(65)从(61)式可知,当 作用于一个向量时,对应于零特征值的特征向量 不参B 些特征向量被安排在子矩阵 中。这相当于是说根据表达式(64)0仅由 和 建立。 和 是没有被算子 照亮的空间黑点(我因为 ,所以预测数据 与子空间 正交,见0数据向量的任何分量都不能被任何模型所解释。这些数据矩阵的分0的误差是对应的,它们是对物理问题的一此, 被称为数据无效空间。在最小二乘反演中,我们的目的是最0小化非拟合数据。最小化非拟合数据实际上是找到一个模型,这个模型产生子空间 中的一个最接近真实数据的数据向量。从图知,这只要简单地把分量从问题中投射出去。这实际上就是将(64)式中对特0征值的求和限定为只对非零特征值求和。当然,当 为空时,我们总可以找到0,因为 是跨越了整个数据空间的。特征值的求和限定在非零特征值之上,其产生的影响是模型估计只产生于子空间 中,估计模型在 中没有分量。在 中的任何模型分量都为 。这表示 定义了 模型无效空间 ( 数据跟落在 中的模型向量的分量是没有关系的。将模型无效空间中0在向量 中展开,同时将 在向量 中展开,并只考虑非零特征值,我们xnˆy8)式中的解一般化至非方阵系统中:, ˆ1(66)使用矩阵 和 ,上述结果也可以写成: 1(67)其中, p/10/012(68
展开阅读全文
  石油文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
0条评论

还可以输入200字符

暂无评论,赶快抢占沙发吧。

关于本文
本文标题:地球物理学中的反演问题
链接地址:http://www.oilwenku.com/p-63033.html
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服客服 - 联系我们
copyright@ 2016-2020 石油文库网站版权所有
经营许可证编号:川B2-20120048,ICP备案号:蜀ICP备11026253号-10号
收起
展开