probability
probability

概率论:完全可能性的理论与现实图景

概率论:完全可能性的理论与现实图景

这篇文章的标题可以用来命名一本小册子,小册子的内容与中国现行的概率论教材,以至绝大多数中国人见到的外国概率论教材给出的基础理论大相径庭。应当如此说,在绕行了两千多年,经历无数的谬误和荒诞后,终于再次来到前人划定的理论框架。不同之处是,由于有了社会理论和具体自然科学理论的突破所提供的坚实基础,先前的理论观点已经开始得到正确的理解。这次,将是人们整体思想观念的彻底变革。

一、明道红的卦:爱在贝叶斯定理的没有交集处

本世纪初的电视剧《少年张三丰》里,明道红几乎事事占卜问卦。她不知道,她的卦有时灵,有时不灵,一切都是导演的安排。后来,我才明白,若非刻意或凑巧,明道红和现实中人们的卦永远不会灵验,因为贝叶斯定理很难灵验,更何况贝叶斯定理的成立依赖于条件概率,计算条件概率的两个条件事件,前事件A和后事件B,必须要有交集。她不知道,她的那些卦与问的对象从来都没有必然联系。后来,我才明白,我们见到的世界全部是由条件事件组成的,它们无不是对一个样本空间的取样,不妨将它命名为:元样本空间。

元样本空间纯粹由数字0和1的排列组合构成,所有排列组合的个数可以由一个无穷级数来表达,即2^1+2^2+2^3+2^4+2^5+……。它是一个互相相容的完备事件组,用G(N)来表示各个事件组,则有G(1)=2^1=2,G(2)=2^2=4,依此类推。也就是说,你所看到的教材上未明白告诉你的“样本空间是一个事件组”,实际上是错的。“互不相容的完备事件组”同样错得离谱。

元样本空间提供给整个世界用于取样,产生我们看得见、看不见的事件。在元样本空间的层面上来讨论相容性与不相容性,一目了然。例1,在同一个时间点上,一名中国消费者购买一瓶饮料,一名日本消费者购买一台电脑,十名韩国消费者在网站上团购千袋食品,它们可以用不同的0-1数字组合来表示,即对元样本空间进行取样。

任何一个样本空间均可以化归为元样本空间。例2,可以分别用001、010和100来描述黄种人、白种人和黑种人,即在由三个数字构成的组合上,用第三个位置上的1来表示取样到黄种人,第二个位置上的1来表示取到白种人,第一个位置上的1来表示取到黑种人。

传说中,计算机是某个外国人根据易经创造出二进制而发明的。当然,中国的有关方面做出了辟谣,一如他们在教材上告诉中国人,使用n这个通项来计算无穷级数。用来表示元样本空间的无穷级数可以直接用错位相减法进行计算:设G(N)为X,则2X-X=X=(2^2+2^3+2^4+2^5+2^6……)-( 2^1+2^2+2^3+2^4+2^5+……)=-2。是的,你没看错,结果是负2。用概率论来描述整个世界时,其计算性逐步丧失。

二、基于概率论的虚拟世界:一种创造现实的游戏理论

假设我们拥有一台资源足够的计算机,为我们制作一款完全不需用户来参与的自动化游戏。游戏里的对象包括人类、其他动物、植物、水、空气、阳光、泥土、矿产,等等,即创造一个与我们周围的世界没有本质区别的世界。它们被创造的规律是全部从元样本空间中取样。例3,创造一名人类,赋予其性别(假定只有2种:男和女)时,从事件组G(1)中取样,取到0创造一名男性,取到1创造一名女性。例4,在创造一名人类的同时创造一条狗,先从事件组G(n+1)中随机取一个0-1数字组合,当这个数字组合取到距离全部为0或全部为1的数字组合附近的3%或者5%区域(该事件组内全部数字组合构成100%的区域)内的数字组合时,再从事件组G(1)中取样,赋予狗的性别属性。G(n) 可以用来规定一个事件列表,包括人类日常生活中的各类事件及其发生顺序,事件的发生也从G(n+1)中取样产生,但是当取到3%或5%区域时,则不按照规定的顺序发生,而是另取一个事件发生,类似于:一个人早上起床后,本应洗漱一番,但他直接去上了班。取样方法可以但不限于此。小说是依据写作者的意志来创造现实,归根到底不是创造现实,这里却是依据一个普遍适用于现实世界的规律来创造现实。创造这款游戏的人,对于这个游戏世界来说,就是“创造一切的主体”。

《道德经》四十二章云,“道生一,一生二,二生三,三生万物”。二十五章又云,“有物混成,先天地生。寂兮寥兮,独立而不改,周行而不殆,可以为天地母”,“人法地,地法天,天法道,道法自然”。“天”、“地”合为现今的小自然(地球、星球),“自然”则为大自然(宇宙)。我不知道,在这些理论变异为所谓宗教的道家或被划归唯心主义的范畴时,历经了怎样的变故。可惜,它并非唯心主义,也非唯物主义,因为真理只有一个。它认为,世界上存在一个普遍适用的规律,上帝用它来创造一切。哥德尔不完备定理认为,形式系统是不完备的。但概率论在数学上是完备的——元样本空间是“一”,二项分布是“二”,多项分布是“三”——它甚至完全地描述了整个世界。当中,没有不可能性。

毫无疑义,这个虚拟世界与现实世界有本质区别。虚拟世界没有意识。物理计算机不可能创造出意识,生物计算机才能。而我们恰恰拥有一台资源足够的生物计算机:宇宙。假如,我们仍然处在唯物论的错误层面上,没有认识到是意识在推动社会发展前进,而不是物质决定意识,我们就不可能得到最后一个用来对抗概率论的武器,一件用来证明我们不是处于虚拟世界的证据:“小概率事件”可以普遍发生。现实世界里的完全可能性是如何发生的呢,人们不是明明见到许多不可能发生、发生不了的事?是在通往无穷大和无穷小世界的道路上发生的。物质与意识、主体与客体的合一,导致了完全可能性。

三、现行理论:让人们永远呆在远离真相的泥沼

在阅读中国几千年历史中诞生的文学作品时,我感到,它们的存在,掩盖了太多现实生活的苦难。唐朝引进佛教,用意是极为深刻的。《道德经》作为一部当今被认定为唯心主义的典籍,不适合用做实施愚民政策的工具,因为它竟然宣称“道大,天大,地大,人亦大”,不说“王大”。这无疑会引发统治阶级的不满和恐慌。甚而相反,它阐述了一系列自然科学理论和社会理论,让人们接近真相的理论。封建统治者标榜自己为真龙天子,号称民贵君轻,自己却从来不会、不敢(也的确没有能力)去真正相信《道德经》。事实上,唯物论和唯心论、贝叶斯学派和频率学派,就如同江湖中的名门正派,没有一个代表正义,那不是它们的主要功用。

大数定律。它是在说,谎言重复n遍即为真理。国外教材有一种观点是均数定律,倒是与马克思主义不谋而合。马克思主义认为,商品价格围绕价值上下波动,而不是围绕市场上的多数价格波动。中国在对待标准差和标准误上讳莫若深,用方差代替标准差,并且对标准误一笔带过。而元样本空间的出现,推动了进一步对均数定律的否定。

正态分布。“正态分布”是与均数定律紧密联系在一起的。做一次取样,落在三倍标准差(误)以外的数据(样本)很少,是均数定律的观点。增加抛硬币的次数至100次以上,硬币的所有可能性组合绘制成长方形的概率直方图,再用连点法将这些概率直方图连接起来,就得到了一条正态曲线,正态曲线下的面积可以用来拟合计算“概率”(实质是条件概率)。结合本文前面的阐述,可以看到,根本不存在所谓的“正态分布”。“正态分布”是二项分布(一般形式即为0-1分布,全部用0和1来表达的样本空间即为元样本空间)的象,二项分布是“正态分布”的体;“正态分布”是离散的,不是连续的。我也不知道,“服从正态分布”的总体是何意。因为在概率论看来,总体是对元样本空间在不同层次上的划分。例5,对手机产品进行市场细分的人,与对电脑产品进行市场细分的人有可能会将同一名消费者划分到不同的事件组。“正态分布”是对一个集合的形象描述,很容易令人误解的是,一个数字组合就被看作是一个“正态分布”。因而,线性的世界(总体)被贴上了“正态分布”的标签。每个相对于概率论而言的研究对象,都是一枚抽象的硬币。即便事件组内的数字组合都是同时被取到的,你应该知道,它们是在描述不同的对象。“正态分布”和所谓的其他分布,是为了掩盖人们对二项分布和多项分布的认知。

小概率原理。它说,“小概率事件”在一次实验中不可能发生。例6,假如全世界出足够多的钱给一千名能够连续抛出100次硬币正面的人,那么,别管它是怎么发生的,它一定会发生。例7,微软的windows视窗操作系统在中国过去的某些时期里,一直占据了几乎所有的个人电脑,整体上来看,如果说那时99.9%的个人电脑装的是windows,你会认为这个推断是错的吗?如果说只看某个单位,则可以断言100%都装的是windows。也就是说,在装windows还是不装这个事件上,99.9%或100%的对象选择了1,它们在数字组合上表现为99.9%或100%的1。“小概率事件”可以普遍发生,有的正在普遍发生,因为在现实世界里,是意识,或者说是人们的所思所想、所欲所求决定了事件如何发生,如何向事件组中聚集。例8,据说美国调查机构仅抽取相对于全部选民来说极为少量的样本,就能预测总统人选,你应当知道这是怎么回事。

测度论。一条曲线为什么会不可以测量它的长度呢?因为“这条曲线弯曲得非常厉害,我们无法测准它的长度,或者设想它离我们非常遥远,即使用最先进的仪器也无法对它进行测量”。测度论得出这样的结论,无非是投入了不可知论的怀抱。假如世界是不可知的,他们又是怎么知道测度论的这个结论是正确的呢?

误差。假如我们给一块金块称重,不同时间、不同仪器、不同情境下的称量,会出现或大或小的差异,这是误差吗?用问卷调查一名对象,访问人员填错了对象的回答,这是误差吗?不,它们只是对样本空间取了不同的样。在概率论的眼里,世界上不存在误差。另,社会系统的迁移和变革、语言、思维,都能用概率论来描述。

因果论和决定论。仅仅是出于语言习惯的原因,我们用“因果”和“决定”的字眼来描述世界。概率论的观点是,世界是条件的,一切事件的发生都需要条件。又,世界是不确定的,它是在无数枚硬币的抛起与落下中诞生。我们不知道硬币何时抛起,何时落下,最后展示给我们哪一面,所以,我们无法去算命,尽管我们可以从一个类中找出一个类的相同性。在湖中捞些鱼上来,给它们做上标记,然后放回去,再捞一次,看捞上的带标记的鱼有多少条,通过公式计算测定湖内鱼的数量,这就是在算命。使用条件概率,而不去寻找具体的原因和条件,注定了要出现错误和悲剧。例9,20世纪可口可乐耗资数百万美元进行的口味测试的失败。例10,对某种商品进行消费者购买意愿调查,形成调查结论,消费者行为并不一定(或者说往往如此)与结论一致。有很多因素在影响研究对象,使他们在某个时刻落入不同的事件组,与其他对象排列在一个数字组合里。

是的。区别了虚拟世界与现实世界,也无法否认概率论在描述世界上的完全性。由于不愿意相信身而为人,却没有自由意志,生活在一个类似美国电影《黑客帝国》中虚构的matrix系统里——尽管人们应该明了,现实世界与之非常非常非常之相似——所以,必须从哲学上作出界定,提出两个哲学的基本问题:1、世界是一(个),还是多(个)?2、世界是可知的,还是不可知的?人们应当明了,前面的两个信念与本文前面的论述一道支撑起一个我们认为正常的世界,后面的两个信念则告诉人们这个是荒谬的世界。
beckham
贝壳期待2011-08-19 10:49:03