|
王虚怀:全效应法数形统计律
数学的新阶段发展到“全效应法数形统计律”时代。主要涉及许多非常规因素的综合,目前正处在不断摸索和不断发展之中。许多方面还正在逐步被人们认识。因此,先搞清楚下面这些基本定理,能帮助我们更好地掌握统计量规律数形统计律是根据数学在自然科学中具有三三对应的特点,将自然界事物统计量的计算规律归纳成三大因素,九条统计规律,二十七种统计方法、八十一个统计量公式的新观点,对所有的统计量数学问题,采用定性与定量相结合的系统分析最佳析方法为主,这样按三三对应规律分析下去,少则一两步,多则三四步,即可求出较为理想的统计量。以下归纳的是数形统计的十大基本定理:
(一)数形统计基本定理
定理一:概率统计定理
事物在某区间最大与最小值无限趋近,在数值不断增多时,愈无限趋于统计平衡值,在几何分布上的随机变量,当落在偏差外的非正态分布,可通过大数统计规律对偏差概率进行统计量估计值。
世界上事物的变化,大多呈现统计不规则的变化。统计就是从大量复杂数据中,找出其规律性,在现代科学技术中,完全规则的关系问题是很少的。绝大多数是不规则的,但非常不规则的问题也是很少的。大多数可化成几个规则的集合,规则的采用福氏方法求解,非规则采用有限元法求解。对次要量,要采取分层逐步回归的方法,也可以用迭代法使理论与实际值无限接近。每一事件的概率都遵循着一种再现的图形,因而对某一事件出现的概率往往能预测未来。我国应用“随控布局”,控制飞机上的某些可操纵部分,来获得最有利的气动效率,通过人工始稳升力和侧力操纵,同动变后掠,以提高飞机的性能。
利用统计概率,可求出拓扑空间最普遍的马尔可夫过程,并探索与此有关的从一般连续函数的巴纳赫空间变换成正半群的全部标符。概率统计预报并非100%准确,常需配合其他方法,加以统计综合而进行预报,才有可能获得较好的预报效果,实践证明,综合统计因素愈多,结果就愈趋近。
定理二:参题后计定理
根据样本确定总体参数值中,由于样本和估计量都是随机变量,要确定一个估计量的好坏就不能根据某一次试验的结果来衡量,而是希望它在多次试验结果待定参数附近摆动,而且尽可能摆动得越小越好。设待定的参为Q,(x1,x2,……xn)是它的估计量,如果估计量(x1,x2,……xn)对任何n满是M=Q,则称(x1,x2,……xn)是Q的无偏估计量,满足无偏性的估计量常不止一个,到底采用哪个更好呢?应当是方差小的,估计量会稳定可靠些。
如果(x1,x2,……xn)、(x1,x2,……xn)都是参数Q的无偏估计量,且D<D,我们就称比有效。如果随着样本容量n的增大,它变为无限地精确,称这个估计量为一致性估计量。
参数Q取似然函数;达到最大值时,观测结果出的可能性最大,求最大似然估计量可用普通微积分方法:
以上两种估计量的方法是一致的,但并不是说它们之间没有区别,在已知总体分布类型时,最大似然估计法是常被采用的方法。
如果下述三个条件被满足,则称渐近有效估计。第一,当n无限增大时,(-Q) 的分布逼近具有平均数口方差σ2(Q)的正态分布;第二,对每个ε>0时
对θ中的每个Q成立,第三,没有别的这种一致付计量序列:Q、Q、……Q……使(Q-Q)的分布逼近具有平均数O方差σ*2 (Q) 的正态分布,且:
对某个开区间中的全部Q成立,则称估计量序列1,2,… ,n ……为Q的一个最佳渐近正态估计量。
定理三:最佳检验定理
在假设检验中,寻找一个检验(判定函数d),使它对Ω中每个θ值的风险极小化。若判是函数满足 :
P(S∈S2|θ∈ω1)≤α
使得P(S∈S1|ω2)极小的唯一检验,称为最佳检验。
统计学分两大类:一类是描述统计学,主要研究简缩数据和描述这些数据;另一类是推断统计学,是根据部分数据去推断更一般的情况。而推断统计主要包括参数估计、假设检验和因素分析。设判定函数公式中的集合ω1和ω2,它们分别与假设或命题:“θ在ω1中”和备择假设H2:“θ在ω2中”相联系,行动α1称为接受假设(接受H1),行动a2称为拒绝假设(拒绝H1),当应用到具体数据上去时,将导致接受或拒绝假设的判定函数d,就称假设检验.有时统计分析的问题,并不要求确定完全未知的参数,而是根据问题的本质,我们可以认为某一参数似乎应该取某值,然后通过观测样本以检验这一假设。假设检验的内容非常丰富,常用的分布有:X2分布;T—分布;F—分布等。进行最佳检验的一般方法是:根据问题的需要对我们研究的总体作出统计假设H;选取合适的统计量,要使得在假设H成立时,其分布或渐近分布为已知;根据实测的样本,计算出统计量的值,并由给定的显著性水平查表来进行检验,直到满足定理中最佳检验为止。
定理四:模糊统计定理
世界上的事物,当模糊性增大时,精确性则减小;当精确性增大时,模糊性则减少,故模糊与精确是不相容的,但只要极少的模糊信息,依据推断统计准则进行“思维”,就可得出相当准确(或足够近似)的结论来。在自然界和社会中存在着大量的模糊事物、模糊现象和模糊信息,而以往建立起来的精确的数学方法是无法定量解决模糊领域的科学问题的,而模糊数学理论和方法的建立,人们才找到了科学地解决这类科学问题的正确和有效的方法,才使得“模糊中见光明”。 模糊数学和方法的创立及广泛应用,并不是数学本身由精确变成模糊了,而是数学——这一精确的科学打入模糊领域,从而使人们能定量揭示和描述模糊性事物、模糊性现象和模糊性信息的规律性。模糊统计就是在不定多变的情况下,作出某项决定或判断模糊信息,自然界有些现象中,不用模糊信息来判别简直不大可能。如:用计算机判别走过来的是谁?就得测量对象的身高、体重、手摆角度、鞋底对地面的压力和磨擦力、速度、加速度等几十个参数而且每个参数要求精确到有效数字几十位,而人脑利用模糊信息,能很快地判别对方是谁,模糊性与精确性是相对的概念。根据定理,在模拟大脑功能时,不应该单纯地追求精确性。模糊概念的数学表现是模糊集合论,模糊集合的“余”、“并”、“交”与布尔代数中“非”、“或”、“与”的概念相似,但模糊集合中不满足互余律。在实际工程控制中,往往由于对象的非线性,多种参数的复杂性、检测条件受限制等原因,使我们无法得到对象的精确数学模型。往往有助于模糊控制更为有效。人对自然语言的理解本质上是模糊的,聚类分析和社会系统也带有模糊性。随机性和模糊性是不同的。随机性表示事件发生的不确定性;模糊性表示事件概念内涵和外延的不确定性、随机性依赖于概率论;模糊性则需求助于模糊数学。两者符合统计量规律,但又建立在一个统一的模式中。数学是不可分割的有机整体。
定理五:拓扑统计定理
在一个复合映射中,如果把若干个因子换成一个同伦的映射,其统计规律与原来的复合映射同伦,在从X到Y的所有映射组成的集合YX里,同伦的关系近似一个等价的关系。
拓扑学是继欧几里得几何、解析几何、微分几何、射影几何等之后的一种较新的几何学。它是研究图形在连续变形下不变的整体性质。拓扑学已和数学结合成点集拓扑(或称一般拓扑)、代数拓扑、微分拓扑等分支,且正在渗入数学很多分支,并用拓扑统计在一个统一的模式中。借助映射来研究拓扑空间问题是个重要方向,从六十年代中期把关于Mooγe 空间;P—空间;M—空间;σ—空间和Σ空间等方面研究均有重要进度。我们地球表面的拓扑要比时间直接的拓扑复杂得多。拓扑与分析两者的结合,指出了客观世界数量变化规律之间的本质联系,每个解析函数有相应的曲面,而曲面结构又是拓扑学所研究的,目前正在研究拓扑空间的马尔科夫过程,这对势论、扩散论和热传导论的运用有重大意义。
有限的多面体的同调群和同调论,定义都建立在单纯形概念的基础上,单纯形是代数拓扑中最简单的几何图象。其定义为:设
a0,a1,……aq
是n维欧几里得空间En与占有最广泛置的q+1个点,q≤n,令
X=λ0α0 +λ1α1 +……+λqαq +
其中;实数λ,λ1,……λq,满足两条
λ0 +λ1 +……λq =1
和λ0≥O,λ1≥0,……λq ≥O
En中这样的点X集合叫一个q维单纯形,利用拓扑统计定理,可对闭曲面的拓扑分类,三维流形、同伦论、基本群等进行深入研究。
定理六:突变统计定理
当系统的参数在某个范围内变化,该函数不止一个极值时,系统必然处于不稳状态,只要按统计量规律变化参数,将使处于不稳定状态的系统突然进入另一种稳态,状态发生突变的一刹那,实现某种过程从一种稳定态到另一种稳定态的跃迁。
过去的数学大多是研究数形渐变的规律,而突变研究的却是质变和突然的变化。自然界存在大量的突变现象。如:物质在液相与气相之间的转化;磁铁在加热到一定温度时,会突然失去磁性;超导下许多金属会突然失去电阻;晶体会从一种对称突变到另一种对称;生物会出现跳跃基因等等。均用常规的数学方法是无法解决的。一九七二年,法国数学家汤姆运用了拓扑学的奇点理论和结构稳定性等数学工具,研究自然界结构不连续的突然变化。不超过四个控制因素时,有七种突变类型,不超过五个时,有十一种突变类型……等。目前,突变统计已应用在:用燕尾突变研究发育胚胎细胞分裂;用蝴蝶突变分析神经病类型;用椭圆脐点突变未解决流体流动问题。
突变理论其状态能够用一个依赖于几个参数,m个变量的函数Fa1……an(X1,X2,……,Xm)来表示,突变不是发生在进入不稳定态的开始,而是达到不稳定态另一边缘时才出现,一般来说,稳定性越大,滞后越强。自然界各种力的平衡大都可用光滑的曲面来描述,当事物演变的轨迹在曲面上遇到中断处,平衡即遭到破坏,发生了突变,因此,突变理论是讨论可能存在的平衡曲面的形状问题。根据突变统计理论,在最简单的静态平衡点之间,所有可能突变是由那些基本突变决定的,目前正在研究中。
定理七:图论统计定理
把复杂多变物质世界的联系,用点、线组成的空间图形来精确表示非常多,单纯靠计算其难度是以指数函数增长的,很快就使计算成为不可能,若用一系列迭代过程非常复杂,只能用图形统计量规律剖析逼近最佳点。
图论统计的理论和方法,就是从形形色色的具体图、树、圈中,抽象出共性,再从中找出统计量的规律和方法。一七三六年,欧拉在解决哥尼斯堡七桥问题后,严格证明图需满足下述两个条件:第一,从图中任意一点出发,通过一些边一定能到达其它任意一点,图是连通的;第二,图中每一点必须是偶数边的交叉点,欧拉的方法即使数字很大,仍很实用。图、树、圈在各种条件下的排列、组合、复合、划分、分类、检索、区组设计、递归、生成函数、数列变换等方面的许多问题,都是统计量数学的研究对象。统筹方法是用一张由箭头连接起来的统筹图表示,可使错综复杂的情况下,了解主要矛盾、关键环节,使全局一目了然,小到一所建筑;大到海、陆、空联合作战,统筹图均是行之有效的方法。图论统计是研究由线连接起来的点集合,并利用统计集合进一步研究子图、连通图、有向图以及回路、切组、树、反树等基本概念,用筛法逐步回归选取最佳方案。目前有一些所谓“启发式”方法,在大多数情况下,往往能找到最好解或非常接近最好解。
定理八:运筹统计定理
管理任何一个部门,包括人(思想、智能、知识),物(物资、设备、资金)、事(信息、调研、决策)三方面九个问题。如何用运筹统计的规律和方法,使这些问题协调好,并取得最佳方案。
运筹统计方法包括排序论、策略论、规划论、排序论是一种随机聚散现象,关键在于找出随机现象的平均特性规律。在人类活动的各个领域里,几乎都存在着排序问题,甚至连多道菜的餐饭准备工作,也显示出非同小可的排序问题,解决排序问题主要采用从头搜索,按主次表选最优方案,使其每一组法则服从某种概率随机数。策略论分策划、对策、决策三种:策划是对未来与发展进行总体的系统规划,广泛采用系统分析方法;对策是在竞争局势中,参与对抗的各方都有一定的策略可供选择,在各方具有相互矛盾情况下寻求最大综合效益;决策是根据信息选取可能的策略以及采取这些策略对系统状态所产生的后果,进行综合研究,大多应用推断统计选取最优策略。在应用策略时,总是采取最不利这一方的策略进行对抗,使其得利最校而从这些得利最小的所有情况中,选择其中得利最大的一种情况,就可以在多次重复的对策中获得最大取胜的可能性。规划论是在一定的约条件下,寻求目标函数的极值问题。分线性规划、非线性规划、动态规划三种。当目标函数为线性时,称线性规划,否则叫非线性规划;动态规划是求解多级判决过程最优化问题。这样可以把多维问题转化为一串每级只有一个变数的单级问题。利用动态规划来研究离散确定性、离散随机性、连续确定性、连续随机性等四种基本类型问题。
定理九:决策统计定理
决策是多因素、多目标、多层次、综合动态反映的统一过程。决策统计采取定性分析与定量计算相结合;谋与断相结合;可能度与满意度相结合,逐步逼近最佳综合效益的方法。决策涉及到政治、经济、社会、综合科技领域,有的关系到人类生死存亡的大问题。社会、经济、科技等信息量千变万化,故决策不能只考虑指标性能的优劣,还要考虑社会的、人口统计学、心理学等种种因素,最重要的是抓实效。如果一个事物一定可能做到的话,则“可能度”为最高,对有成千上万因素影响的目标函数,要很快的定出一个百分比的数值来是不太容易的,如果从完全不可能和完全可能的两头来考虑的话,就较为方便些,现实些。当一个事物出现后,从人们主观愿望来说,“是否满意”也是有着客观依据的,不过“满意性”比起“可能性”来带有更多的随机性。随着研究的不断深入,考虑得更为全面,统计的面又不断扩展,对于满意度的描述就能逐步精确起来。决策统计是综合考虑需要,把可能度和满意度并合起来。在探讨粮食总产量的可能度时,就涉及耕地面积和亩产这两个因素。这时,可以把两种单因素的可能度,利用强并合的办法,求出粮食总产量的可能度,再同人均产量需求的满意度并合,就可获得总人口对粮食的可能──满意度。最后需作合并成的可能满意度影响大小的灵敏度分析:
从上式分母看,两转折点间距大,灵敏度底。
定理十:预测统计定理
事物的未来和发展是复杂多变的。但按统计规律是可进行科学预测的。常用的预测统计方法有:统计系综、相关预测、回归预测。但需有信息反馈灵敏度高、系统分析准确度高、波动范围小于某一阈值为基矗否则,会直接影响科学预测的准确度。产品方向性的预测要根据社会需求,条件具备、方案可行三个原则。通常有四类波动:第一,倾向性变动。由于人口增加,技术进步、工资收入增加、产品饱和性等引起的长周期(持续增长或减少的现象)趋势。用最小二乘法估计倾向性变动非线性函数允许一定误差范围但不超过预测目标函数);第二,季节性引起的波动;第三,偶然因素在一定时空起主动作用的波动;第四,循环性波动。社会产品一般经历五个阶段:早期试销阶段;早期增长阶段;成长后期;稳定期;衰老期,市场商品始终是由不平衡到平衡,再由偏离平衡态出现新的不平衡。均可根据统计特性曲线作出科学预测。要根据及时反馈的综合信息,分析饱和状态和奇缺状态的动态变化预测其发展趋势,以满足国民经济的需要。要通过科学预测,逐步掌握多方案,多目标主动权,在复杂多变的社会环境下,能以自己的特色和优势制胜。预测统计的数学模型主要用于统计系统、相关分析和回归分析三个方面。任何事物都有一个产生、发展到衰老的过程,用一次回归,二次指数平滑难以反映发展趋势,但在平滑系数_的选择上,应适当加大,表示更加侧重新数据。在经营活动中,特别别要重视销售预测,对社会产品如何及早做好第二代、第三代、第四代……准备,做到“人无我有,人少我多,人多我好,人好我转”,掌握商品供销主动权,是确保工农业生产持续增长的关键。
(二)数形统计模型
(三大统计因素;九条统计规律;二十七种统计方法;八十一个统计公式)
统 计 量
A.[不定因素、随机统计]
1.随机统计: 一、 概率 (1)几何概率 (2)条件概率 (3)全概率
二.、变量分析 (4) 二项分布 (5) 泊松分布 (6) 正态分布
三.、均值 (7) 期望值 (8) 方差值 (9) 中心矩
2. 数理统计:四、参数估计 (10)点估计量 (11)区间估计 (12)有偏估计
五、假设检验 (13)参数法 (14)非参数法 (15)符号检验
六、因素分析 (16)方差 (17)回归 (18)相关
3.多元分析: 七、相关 (19)逐步回归 (20)典型相关 (21)趋势面
八、聚类 (22)聚类 (22)逐步判别 (24)因子
九、对应 (25)对偶 (26)平衡 (27)系统
B.[多变因素、模糊统计]
4.模糊: 十、 集合 (28)余 (29)并 (30)交
十一、关系 (31)信息量 (32)关系 (33)推理
十二、控制 (34)时间 (35)空间 (36)识别
5.拓朴: 十三、点集 (37)连通 (38)扩张 (39)同伦等价
十四、同调 (40)同调群 (41)同调序列 (42)同调环
十五、图论 (43)图 (44)树 (45)圈
6.突变: 十六、几何 (46)双曲式 (47)椭圆式 (48)抛物式
十七、仿生 (49)尖顶 (50)燕尾 (51)蝴蝶
十八、自然 (52)折叠 (53)宇宙 (54)催化
C.[未知因素、运筹统计]
7.排序论 十九、排队 (55)排序 (56)存贮 (57)生灭方程
二十、最优顺序 (58)黄金分割 (59)最优解 (60)大数概率
二十一、置位 (61)搜索 (62)库存 (63)分配
8.策略论 二十二、策划 (64)经济发展模型(65)最大绝对点误差(66)配分函数
二十三、对策 (67)博奕 (68)对策 (69)策略
二十四、决策 (70)可能度 (71)满意度 (72)可能与满意并合
9.规划论 二十五、规划 (73)线性规划 (74)非线性规划(75)动态规划
二十六、统筹 (76)相关函数 (77)多边形逼近(78)标准偏差
二十七、预测 (79)统计系踪 (80)先验概率 (81)回归预测
(注:以上八十一个统计公式,王虚怀教授都已有具体公式,在本文中省略)
(三)全效应法数形统计律的应用
在应用数形统计律时,先将需要进行计算的问题,找出符合相对应的公式(可以是一个,也可以是几个的组合);再将这些公式的未知数给出定量值或近似值;后再将这些值输入已编好程序的电子计算机内,即可得出所求的统计近似值。我们已初步将数形统计律应用在国民经济各部门和社会环境中。如:用图论统计初步算出水分子和维生素A的键构模拟值;用相关统计算出生物线信息识别互感统计值;用决策统计已作心电图分析诊断的数据处理等。 还需要作更深更广的探讨。
|