反向因果检验关系怎么检验

[0001] 本发明涉及一种原因追溯方法屬于计算机人工智能技术领域。

[0002] 在一类被完全认知的对象系统中每个具体实体对象都具有本类的共性,每一个 原因的发生都会引起一个(組)效果(或现象)的发生不同的原因引起的效果(或现象)会存 在不同,这种不同正是区别不同成因的重要特征和依据

[0003] 对于一类已经被认知嘚对象,其中某个实体对象出现异常或意外的效果(或现象) 时为了使其恢复正常或试图再次重现这种意外时,需要对引起异常或意外的效果(或现 象)的原因进行追溯一方面能够从根源入手解决问题,达到消除异常或意外的效果(或现 象)另一方面运用本方法追溯原因嘚过程和结果获得寻求新的原因、新的现象或新的因果 联系的机会。原因追溯的准确性和速度对后期准确选择有效方案以及能否尽早实施正确 的方案有着极为重要的影响。

[0004] 由于对象系统的复杂性不同和对于对象系统认识程度的原因以及单一系统可以 综合成更为复杂的系統的原因。现有的追溯方法多涉及单独的某一样事件或者某种事故专 门追溯其应用面比较窄,不能通用如有的追溯方法采用树结构进荇追溯,其中每个内部 节点表不一个属性上的测试每个分支代表一个测试输出,每个叶节点代表一种类别其在 追溯叶节点的原因时,發现某个分支条件不符时则需要退回上级分支节点,选择其他分支 继续追溯叶节点其追溯过程时间长,效率不高同时,做出判别技術要求相对较高增加了 普及使用的难度。对于不同对象的原因追溯需要编写专门的树节点条件,进行使用方法 的通用性不强。

[0005] 本发奣要解决的技术问题是:为克服上述问题提供一种适用于各种事故或错误 的快速的原因追溯方法。

[0006] 本发明解决其技术问题所采用的技术方案是:

[0007] -种原因追溯方法包括以下步骤:

[0008] S1:初始化因果关系知识库,所述因果关系知识库中包括一类对象的异常现象和 引起该异常现象的原因以及异常现象和其原因之间的因果关系;

[0009] S2:在异常现象列表中选出当前已知状态的异常现象,根据因果关系知识库中的 因果关系形荿新的因果关系知识库并记录追溯到的原因;

[0010] S3:输出追溯到的原因作为结果信息。

[0011]优选地所述步骤S2具体为:依次选出当前已知是否发生的异瑺现象,建立新的原 因组记录追溯到的原因,建新的现象组建立新的因果关系知识库;

[0012] "建立所述新的原因组,记录追溯到的原因"具体洳下:

[0013] 把所述异常现象拆分成确认已发生的第一现象组、确认未发生的第二现象组和未 被确认状态的第三现象组;

[0014] 分别在所述因果关系知識库中找到第一现象组、第二现象组和第三现象组对应的 原因组形成第一原因组、第二原因组和第三原因组;

[0015] 以第一原因组为基础删除其中与第二原因组重复的原因后形成第四原因组;

[0016] 以第四原因组为基准在第三原因组中进行比较,将所述第四原因组中与所述第三 原因组Φ不重复的原因记录为追溯到的原因将所述第四原因组中与所述第三原因组中存 在重复的原因建立新的原因组,当所述第四原因组中已經不存在与所述第三原因组有重复 的原因时则表示继续追溯的条件已经不存在,将执行步骤S3

[0017] 建立新的现象组的过程如下:

[0018] 在所述第三現象组中删除与所述新的原因组中任何一个原因不存在因果关系的 异常现象,剩余的异常现象为新的现象组;

[0019] 建立所述新的因果关系知识庫过程如下:

[0020] 根据原始因果关系知识库中记录的因果关系为新的原因组和新的现象组建立因 果关系,形成新的因果关系知识库

[0021] 优选地,所述"结果信息"还包括已经被确认过状态的现象组和被追溯到的原因之 间对应的因果关系

[0022] 优选地,当所述第一现象组缺损时即输入未包括确认存在现象时,则采用所述第 三现象组替代所述第一现象组同时保留第三现象组。

[0023] 优选地当一个异常现象可对应多类对象时,則以该异常现象分别与对应的多类 对象建立的多个因果关系知识库同时并行执行步骤S1-S3。

[0024] 优选地每执行一次S2步骤称为一次原因追溯,以噺的因果关系知识库为基础运 行N次运行S2步骤为N+1次原因追溯

[0025] 优选地,每执行完一次S1步骤至S3步骤称为1级追溯

[0026] 优选地,还包括"N级追溯"步骤:N次執行从S1步骤至S3步骤称为N级追溯且每一 级追溯所使用的原始因果关系知识库不同。

[0027] 优选地所述因果关系知识库通过矩阵来表示:异常现象集合P,包含N个异常现象 元素记做Pl,即第i个异常现象i从1到N;引起异常现象的原因的集合S,包含Μ个引起异常 现象的原因元素记做即第j个引起异常现象的原因,j从1到Μ;因果关系集合R包含NX Μ个关系元素,记做 rij,即第i个异常现象和第j个引起异常现象的原因之间的关系

[0028] 优选地,所述因果关系知识库通过表结构来表示:仅包含异常现象和能引起该异 常现象的原因的对照关系由该对照关系组成的记录在表结构中具囿唯一性,不同对照关 系的集合组成某对象类的因果关系知识库

[0029] 本发明的有益效果是:本发明可以针对不同种类对象进行原因追溯,相比於现有 技术采用树结构的追溯方法本发明可以快速的找到异常现象原因,因为该不同种类对象 可以为各行各业的机械、计算机程序或各種重复的具体事件所以本发明可以为各种行业 的异常状况快速寻找原因,让使用者针对相应的原因解决问题节省了使用者自己的排查 時间,使生产或者事情快速恢复正常提高了效率,并且本方法还可作为人工智能机器人的 基础认知途径智能机器人可以通过本方法对其识别的异常现象进行追溯原因,找到其结 果了解异常现象发生的原因,并采取相应的策略使其具有解决问题的能力。

[0030] 下面结合附图囷实施例对本发明进一步说明

[0031] 图1是本发明一个实施例的流程图;

[0032]图2是本发明一个实施例的示意图;

[0033] 图3是本发明另一个实施例的示意图;

[0034] 圖4是本发明另一个实施例的示意图;

[0035] 图5是本发明另一个实施例的示意图;

[0036] 图6是本发明另一个实施例的示意图;

[0037]图7是本发明方法的流程图;

[0038] 圖8是本发明中表结构的追溯过程图;

[0039] 图9是本发明中表结构的另一个追溯过程图。

[0040] 现在结合附图对本发明作进一步详细的说明这些附图均為简化的示意图,仅以 示意方式说明本发明的基本结构因此其仅显示与本发明有关的构成。

[0042] 如图1所示的本发明所述一种原因追溯方法包括以下步骤:

[0043] S1:初始化因果关系知识库,所述因果关系知识库中包括一类对象的异常现象和 引起该异常现象的原因以及异常现象和引起異常的原因之间的因果关系,所述一类对象 为已被认知的之间有共性的对象该对象为现实世界和虚拟世界中遵循自然规律并且已被 人类認知的事件,可以是例如刮风下雨等事件也可以是虚拟环境中的事件,例如程序崩溃 或传输失败等;

[0044] 所述因果关系知识库为人工智能技術中的符合特定结构规则的数据集合本发明 仅提供因果关系知识库的各构成要素,各要素之间的关系以及进行追溯时如何使用因果 关系知识库中的信息,具体的因果关系知识库中的现象、原因以及关系由相应领域的技术 人员补充并且因果关系知识库的具体体现方式可鉯但不限于矩阵结构,例如串表结构和 其他的结构所述因果关系知识库中的异常现象为普通的现象中出现的反常或者极端的情 况,为不哃情况下不容易发生的现象其具体采用现有技术可以进行检验检测到的(例如电 压、电流),或常识性的知识(例如是否下雨了、灯是否煷了)而不是经验和感觉(例如感觉 有点冷或感觉很闷热);

——论物理学中的时空测量
前言囷摘要: 关于时空物理学能讨论些什么?

物理学能够讨论的对象或物理量是什么呢显然,不能测量的也就是物理学不能讨论的。不论昰证实还是证伪,首先要可证关于一个物理学所讨论的物理量,物理学只能讨论如下三个方面的话题:一是该物理量的测量对象是什麼这个测量对象必须是可测量的,即它必须是实际存在的不是虚幻的;二是测量的方法或标准是什么,即关于该物理量我们是怎样進行测量的;三是测量的结果是什么。离开了这三个方面其它一切讨论,都是唯心的、凭空进行的、不可检验的讨论

同样,关于时空物理学也只能讨论这三个方面的话题,即:一是时空这一物理量测量的对象是什么,或者说当我们测量时空时,我们究竟是在测量什么;二是我们是怎样进行测量的;三是测量的结果是什么

显然,我们只能讨论客观存在的物质运动过程所花费的时间和所占用的空间离开实际存在的物质运动,直接讨论时空本身的特征如时空本身是不是弯曲的,一维时空的两个端点在高维时空中会不会纠缠在一起甚至穿越时间去旅行等等,都是在凭空讨论因为这种讨论没有上述的那三个方面作为基础。

时空本身的测量对象是什么呢我们对时涳本身又是如何进行测量的?我们能测量“空虚”吗或者,我们能在“空虚”中进行测量吗

广义相对论认为,测量两个时空点之间的距离ds如果ds2=c2dt2-dx2-dy2-dz2,则时空就是平直的如果该式不成立,成立的是ds2=gijdxidxj(爱因思坦惯例即ds2=Σgijdxidxj),i,j=0,1,2,3x0对应于时间t,则时空就是弯曲嘚但ds能直接测量吗?

在三维空间中当无引力场时,两点之间的距离为dL2=dx2+dy2+dz2这时,我们说三维空间是平直的当有引力场时,该式鈈再成立成立的是dL2=rijdxidxj,这时我们说三维空间是弯曲的。但是不论三维空间是平直还是弯曲的,dL都可以直接测量而不是只能通过上述两式的右侧来计算。dL的测量方法与dx或dy的测量方法完全相同只不过在测量dx或dy时,我们是沿坐标轴进行的测量测量dL时,我们是沿给定直線进行的测量正因为我们直接测量出的dL2等于或不等于dx2+dy2+dz2,我们才说三维空间是平直或弯曲的

但是,四维时空中两个时空点之间的距離即四维时空的度规ds却无法直接测量,只能通过它的定义式ds2=c2dt2-dx2-dy2-dz2或ds2=gijdxidxj来测量因此,我们不能说存在一个与三维空间中的几何具有等同意义的、关于四维时空的几何学当然,就更不能说四维时空是弯曲的

有人认为,测量物体运动过程中的固有时也就是测量ds。在“弯曲时空”中当物体产生dxi(包含dt)的运动时,ds2=gijdxidxj在随该物体一同运动的参照系K/看来,dxi/=0(不包含dt/)ds2=g00/dx0/2,dx0/对应于dt/请问,带上我们嘚时钟随该物体一同运动,所测量出来的时间是不是该物体运动过程中的固有时这个固有时表达的是不是dt/? 如果这样测量出来的是dt/泹dt/不等于ds,只有知道g00/才能算出ds。在“平直时空”中当物体产生dx和dt的运动时,ds2=c2dt2-dx2在随该物体一同运动的参照系K/看来,dxi/=0但我们能說ds2=c2dt/2吗?只有当该物体作匀速直线运动时我们才能说ds2=c2dt/2,此时固有时dt/才等价于ds,因为只有在惯性系中才有ds2=c2dt2-dx2成立。如果该物体在莋变速运动则随该物体一同运动的参照系K/,就是非惯性系该参照系中的时空就是“弯曲的”。 因此按这种说法,当我们带上时钟隨物体一同运动,所测量出来的dt/只有在“平直时空”中,并且还要求该物体只能作匀速直线运动才等价于该物体运动过程的ds。显然這样测量出来的ds或s,只是物体在“平直时空”中作匀速直线运动时所产生的ds或s并不是任意两个时空点之间的ds或s。例如在“平直时空”Φ,如果ds2=c2dt2-dx2<0即为类空间隔,则就没有任何物质运动能将ds两端的两个时空点联系起来这种间隔用测量固有时的方法显然就是无法测量的。

四维时空的弯曲带来的一个直接后果就是时间也可以弯曲,因此人们可以回到过去,杀死从前的自己

如果时间本身弯曲了,咜的流动速度变慢了甚至逆向流动了,这种“时间本身的流动速度和流动方向的变化”又是相对于谁而言的呢?我们又是怎样测量出這种“时间本身的流动速度和流动方向的变化”的呢

严格来说,当我们说三维空间是平直或弯曲的时当我们说勾股定理dL2=dx2+dy2成立或不荿立时,我们所谈论的也不是空无一物的空间本身所具有的特征而是空间中由实物构成的几条线段的长度之间的关系。如果空间中空无┅物勾股定理中的三条线段的长度值从何而来?我们能在一片空虚中测量出这三个长度值吗如果空间中空无一物,我们凭什么说三维涳间是平直或弯曲的我们凭什么说勾股定律是成立的或不成立的?难道这种平直或弯曲、成立或不成立不是测量出来的吗所谓的引力場使三维空间发生了弯曲,实际上是说引力场改变了物质存在或运动的状态从而使得由物质存在或运动状态所确定的三条线段长度之间嘚关系不再遵守勾股定理。是引力场对物质存在或运动产生了影响而不是引力场对空间本身产生了影响。物理学中的直线实际上是无引仂场空间中的光线或与此种光线相吻合的物体的棱边。光线在引力场中弯曲了所以也就是直线在引力场中弯曲了,所以才有勾股定理茬引力场中不成立了

本文的中心思想是,我们只能讨论在某个参照系中用某套时空测量标准所测量出来的实际存在的物质运动过程所婲费的时间和所占用的空间,离开了参照系、时空测量标准和实际存在的物质运动这三个要素而讨论所谓的“真实的时空”或“绝对的时涳”是毫无意义的

本文第一部分主要讨论了时空测量标准与时空测量结果的关系,认为物理规律是相对于时空测量标准而言的而时空測量标准实际上是人为规定的。本文第二部分主要讨论了参照系与时空测量结果的关系认为研究我们所在参照系内部的物理规律,比研究其它参照系中的物理规律及其与我们所在系的关系不仅更为实用,而且也更为基本其它参照系与我们所在系的关系,不能作为我们所在系内部的物理规律能否成立的依据本文第三部分主要讨论了实际存在的物质运动与时空测量结果之间的关系,认为广义相对论中所謂的“时空弯曲”实际上仅是指光线的弯曲。不存在与三维空间类似的、可测量验证的“四维时空中的几何学”当然也不存在所谓的“四维时空的弯曲”。本文只是对相对论从时空测量的角度给出了一些新的解释并没有得出与相对论不同的、可测量的具体物理结论,楿对论中可测量的、具体的物理结论仍然是成立的只要我们对相对论给出合理的解释,则狭义和广义相对论就是无可置疑的理论体系洏我们原先对相对论的解释中,却仍然保留着一些绝对时空观的成份


要素众多相互作用复杂,因果關系的推断非常困难对此有一系列的研究。2012年发表在Science的一篇论文提出了收敛交叉映射算法,针对复杂生态系统进行因果推断取得较恏效果。本文是对这篇经典论文的解读

现实中中的因果关系,由于其本身的复杂性往往不能根据领域知识,画出明确的因果图(Directed acyclic graph)從而无法按照 Judea Peral 在《为什么》这本书中提出的基于因果图进行因果推论。
例如判断黄石公园引入狼群是否恢复了生态系统的平衡要考虑的混杂因素就会有几十项,从天上气候变化到地上的微生物和真菌的变化,都需要考虑
生态系统是典型的,多种元素相互作用。针对複杂生态系统2012年的Science文章提出了收敛交叉映射算法(convergent cross mapping ),本文是对该论文及收敛交叉映射算法的详细介绍
在介绍这篇经典论文之前,先囙顾一下之前关于因果推断的相关方法
test)。格兰杰因果检验是针对时间序列时间最常用的一种统计方法,从最初在计量经济学中使用后来进入了生态学、等自然科学领域。格兰杰因果检验考察的是两个事件发生的先后顺序然后假设因一定比果先发生。
但格兰杰因果檢验的假设——“原因比结果先发生”——是有问题的其格兰杰检测只是判断两个事件的发生的先后顺序是否在统计上显著,并不能够判定因果关系
例如,观测中美两国的股市如果发现美国股市的暴跌总是比中国股市早零点几秒,于是用格兰杰检验会发现在任何情況下,使用美国股市的数据都能更精确地预测中国股市的暴跌因此两者之间有因果关系。但实际上两国股市的起伏可能是某个突发事件同时引发的,只是由于光纤传递信息的延迟导致了时间上的先后。
的特点之一是存在非线性的相互影响由此产生相变和现象。具体來说两个变量在很长一段时间内,看起来是高度相关的但可能突然就变得毫不相关了。如果没有意识到这一点就容易根据观察到的局部相关性,判断变量之间存在伪相关关系(spurious
下图所示的是存在非线性关系的变量X和Y之间随时间变化的图图中大部分时间,XY都是高度相關的:
图2:非线性下的伪相关会持续相当长的时间
对上图的例子格兰杰检验就不会判定X和Y之间有因果关系,但根据俩者的微分方程可鉯看出俩者之间是存在着因果关系的,因此在该例中格兰杰检测就没有检出因果关系。

复杂生态系统中的因果关系模型

前面说了格兰杰洇果检验存在的缺陷而2012 年这篇 science 文章中提出的新方法“收敛交叉映射算法”,正是针对格兰杰检验进行的改进
用一句话来概述收敛交叉映射算法就是,如果变量Y的历史数据能够由变量X可靠的推出的程度越高那么X到Y的因果关系就越强。
举例来说将包含三个变量典型的洛侖兹系统(canonical Lorenz system)看成是的经典案例。其中已知X和Y是互为因果关系的在三维流形中画出其运动曲线,可以得出下图:
图3:洛仑兹系统中的因果关系Mx 和 My 分别是x和y在流形 M 上的映射
在t时刻,X的数值处在橙色圆圈附近Y处于绿色圆圈附近,由于X和Y在动力学上是相关的所以知道X所在嘚位置能够预测Y所在的位置,反过来也是这样由于随着时间的流逝,X和Y的轨迹都会变得更加密集因此,从X或Y能够更加精确的预测Y或X的徝从而可以推出——X和Y之间的因果联系更强了(图中蓝色圆圈部分的曲线密度更大)。
读者可能会问前文写道可预测不等于因果,这裏就需要澄清收敛交叉映射算法的核心词——收敛(convergence)
首先,收敛交叉映射算法是一个向后看的模型:它考察当前的状态之间的关系昰根据当前的X预测当前的Y,而不是基于当前X的状态能否预测Y未来的值进行判断
图4:随着横轴时间L的增加,洛仑兹系统中相关性ρ变大并收敛到1

举公鸡打鸣和太阳升起的例子假设公鸡在小时候,有时半夜鸡叫有时正午才打鸣,长大后逐渐掌握了太阳升起的时间打鸣准時了。等公鸡年长都会根据四季的不同调整打鸣时间了,那时候公鸡就能欺骗收敛交叉映射算法——算法会认为是公鸡打鸣才是太阳升起的原因(因果性存在)但这显然是荒谬的,由此通过反证法该例子说明了收敛交叉验证算法能够从相关性之中,找到真正的因果性

因果关系的方向和类型?

在简单情况下因果关系可以分为三类:互为因果,单向因果与共同原因三者在数据上看起来是很难区分的,但使用收敛交叉映射算法可以将由共同诱因Z导致X和Y发生变化的情况与X导致Y区分开。

图5:基于渔业数据用收敛交叉映射算法区分共同洇素引起的伪因果

研究者使用真实的渔业数据,做了研究结果如图所示,左边展示的是三种因果关系的示意图右边是两种鱼X和Y的数量,由于两个变量的交叉相关性ρ并没有随着时间L变化出现收敛因此可以排除互为因果,单向因果这两种关系进而得出是由于共同的第彡方因素导致了这两个变量的相关。

收敛交叉映射算法还能区分互为因果与单向因果这两种情况如下图所示:

图6:随着时间的变化,从X箌Y和从Y到X的对应不确定都减少从而推出双向因果

图7:随时间变化,只有X到Y的映射随机性降低因此是单向的X到Y的因果

更复杂的情况是五個物种组成的生态系统,如下图所示在该生态系统中,物种1、物种2、物种3相互之间有100%密切的相关性物种1、物种2、物种3共同作用,分别影响物种4和物种5

图8:5个物种组成的模拟生态系统中,通过收敛交叉映射算法判断因果关系

如果使用因果图(casual diagram)方法需要根据预设知识,在模型中给出可能存在因果关系是哪些组而在缺少预先假设时,例如考察物种2和物种4的相互关系是无法矫正其他物种带来的影响的。但收敛交叉映射算法就可以在无假设的前提下判断出因果关系。

判定因果关系尤其是在和现实环境中,是极其困难的连诺奖得主提出的格兰杰因果检验,都不能直接检测因果关系也无法区分单向的与双向的因果关系。因此判断因果关系要格外地战战兢兢如履薄栤。本文聚焦2012 年 Science 论文通过和格兰杰因果检验的对比,展示了收敛交叉映射算法在判定因果关系上能力更优

回顾因果判定方法的发展,洳同咬住自己尾巴的蛇:统计模型的最终目的不是去超越最简单的观察法,而是去模拟人类的因果推断从而做到小样本下可解释的因果推断,再将其自动化地推广到大数据上
为了让更值得被信任,因果推断是充分必要条件近期,有一系列讨论因果推断问题的研究进展这里举几例:
有了因果推断,就不用担心模型会歧视少数族裔或者女性因为模型可以自己回答反事实的问题,判断路径相关下的决筞是否公平
不仅可以利用因果推断模型,还可以反过来去判断模型对因果的判断与哪些些因素相关从而为模型提供可解释性。
同时洇果模型还可以提升模型在不同领域间的可迁移能力,在无监督下学到领域无关的一致性表征(domain adaptation)
因果推断和,以及更广泛的认知科学因果涌现的结合,是会持续关注的话题如果对该话题下的某个具体子领域或者某个问题感兴趣,或推荐相关经典论文与研究进展欢迎留言。

科学如何改变思维方式


加入“没有围墙的研究所”

让苹果砸得更猛烈些吧!

原文始发于微信公众号():

我要回帖

更多关于 因果检验 的文章

 

随机推荐