莆田网站建设一站式服务(专做网站的公司)科学是可以证实的吗,
贝叶斯主义把科学定义为一个用证据不断更新信念的概率框架,这一观点把“可证伪性”纳入其中,视为一个特例。
科学哲学从上世纪的逻辑实证主义、波普尔的证伪主义、库恩的范式转换一路走来,到了20世纪80年代形成以贝叶斯为底层逻辑的共识框架。
时间线清楚,人物和概念都在书里和课堂上反复出现过,学界在实践中也一直按这个路子做事。这套框架的核心是三句话。所有信念都不是“对或错”的二选一,而是带一个置信度百分比。
新证据出现后,按贝叶斯公式把置信度往上或往下修。不同人的初始置信度可以不一样,但在大量证据面前会逐步靠拢。广义相对论的例子很直观。
刚提出时支持者不多,先验置信度很低解释水星进动,置信度抬升一截;1919年日食观测到光线近太阳弯曲,再抬一截;哈勃红移的发现,把整体框架压得更稳;引力波观测把置信度推到很高的区间宇宙加速膨胀带来两条路,暗能量或修正引力,这类证据让置信度往回收一点。
结论明白,证据驱动信念的大小,而不是一次性盖章。这组做法落地到不同学科,会呈现不同的平均置信度。数学在公理和逻辑的层面最稳,平均置信度很高。
物理学在可检验的范围里很强,精密测试能到很多个九,但每一个理论都有适用范围,强场和量子效应交织的地方就需要新理论广义相对论在黑洞奇点附近没有可靠的“量子版”,宇宙整体膨胀让“能量守恒”这个词失去全局意义,原因是时空的几何在变,无法定义一个适用于所有时间的统一能量量。
量子场论的路径积分在数学上缺少完全严密的基础,杨–米尔斯质量间隙到今天还在千禧年难题列表里。
物理学家的工作习惯更看重和实验是否合拍,而不是数学证明是否完美,这个选择让工程进步很快,也埋下了“理论严密性”这条隐患冷凝态、热力学等分支充满唯象模型,能解释趋势,但误差较大,双原子分子比热的能量均分定理估算会出现超过一成的偏差,这种情况在教科书里随处可见。
心理学和医学面临可重复性不足的问题。
这些年做过几轮大规模复验,选出顶级期刊的心理学论文去重做,能重复出的比例不高百篇里三成多成功复现,随后另一批经典实验也只有一半能过关医学这边复验顶级论文的结果也不乐观,每两篇里只有一篇能挺过重测,癌症研究复验的成功率更低。
统计上的p值阈值长期用0.05,很多人以为这等于5%的出错率,实际并不是。p值没有把假阳性算进去,导致一批结果看起来“显著”,复现却过不去。学界提出把标准提高到0.005或引入贝叶斯因子。
标准一提高,大量论文会被判为证据不足。可重复性这块,造假和动手脚也影响了整体信誉,撤稿榜单里医学论文数量常年居高。天文学依赖近似手段,误差范围大是常态。
相对论计算量太大,模型里常用牛顿近似处理重力;磁场的计算复杂,很多模型直接忽略磁场影响教科书里大量约等于符号,论文里常见数量级估计,银河系直径十万光年这个量级、太阳光子穿日幔要几百万年这个量级,研究者先把量级抓稳,再慢慢加细节。
精确模型并不是没有,比如微波背景、造父变星、哈勃红移提供了坚实标尺,但总体上多数模型粗糙,误差两成左右很常见。
这类误差对方向判断影响不大,对具体数值的把握影响明显经济学的长项是事后解释,短板是事前预测危机到来前模型很难统一发出清晰信号,危机发生后再把现象往各家假设里归类,常见情况就是“解释很多,预测较弱”
门派众多是原因之一,不同假设能推导出不同结论,模型能把同一现象装进不同框架。过度数学化也让实际效果打折扣,公式堆得很美,落地预测误差不小。科学的核心是可检验的实证,数学是工具,不是目标。
谁能在未观察到的场景里做出准确的、可验证的预测,谁就把话语权拿到手。数学本身的软肋在公理。现代数学构筑在一组常用公理之上,从算术公理和集合论公理出发,能把数系、函数、代数和微积分都搭起来。
这个成就很高,前提是这些公理站得稳现实世界里没有完美的平行线,平行线是脑子里的定义;集合论的选择公理在不同体系里会带来不同结论;逻辑里的排中律有分歧哥德尔不完备定理给出了一条铁律,只要系统足够强,总会有不能在系统内部证明真假的语句。
一阶逻辑表达能力有限,很多结构需要更强的工具。结论是数学在逻辑内部很稳,但和现实是否完全对齐,要看公理选定的路线。这组观察和数字背后,贝叶斯的方法给出了一个算账的明白路。
先有一个初始置信度,像商店里两种箱子各占一半,抽到一个红球,系统里就能把A类箱子的概率从五成更新到七成七。再抽到一个红球,概率升到九成二。每次抽球就是一次实证,几次之后,人手里的判断就稳定。
广义相对论的各次观测对应着这一次次“抽球”。天王星轨道的偏离是另一个例子。命题是牛顿定律能描述天王星轨道,证据是观测到微小但持续的偏离。
偏离可能来自未知行星,也可能是估计误差或模型遗漏把各种可能的出现概率和在各自条件下看到偏离的概率合起来,整体概率会下降到一个新的值置信度从很高的水平回落一截,模型没有被丢掉,科学家继续找未知行星,最终找到了海王星。
这类过程和“证伪就丢弃”的思路不符,实际工作更接近“先更新置信度,再排查解释链”。哲学对科学的疑问集中在两把刀。休谟提出因果难题,看到事件长期一起出现,不等于能保证因果关系一定成立。
火鸡每天十点有食物,火鸡把它当作规律,节日那天规律不成立。力和速度改变长期被一起看见,是不是一定有“力导致改变”的因果性,哲学问题留在这。科学里大量推理用到因果,逻辑上就会被这把刀卡住。
迪昂–蒯因问题把刀再往深处推进一点,任何检验都牵涉很多辅助假设,哪个环节出错,无法一眼分清贝叶斯方法把刀变成秤看到事件一起出现,不把它叫绝对因果,把它叫高置信度的相关性,把“肯定”改成“多大概率”,估计会随证据变动。
辅助假设也放进似然项,整条证据链一起计算,哪块拖后腿,数值会有反应。这组做法把逻辑上的硬碰硬换成强弱之分,科学在操作层面更灵活。证伪主义是重要里程碑,工作中有用的地方很多。
逻辑上一句干脆的“出现黑天鹅,‘所有天鹅都是白的’就失败”,这句话能写进教科书。贝叶斯里同一件事等价于把“出现黑天鹅”这个证据的似然值设为零,后验概率直接降到零。可证伪性就成了贝叶斯公式的一个特例。
现实研究中,很多证据不是零就是一的硬界,更常见的是多证据混合,强弱不一,值也不等。这个时候用“证伪或不证伪”来刻画,就会太粗。波普尔本人也强调过,需要用“佐证度”评估理论经受检验的程度。
这个概念和贝叶斯里的似然权重相通,路径指向更细的量化。这套思路还能把很多科学方法从公式里推出来。奥卡姆剃刀偏好简单模型,放到贝叶斯里就是给复杂模型加结构成本,证据相同时简单模型更容易拿到高后验。
双盲实验提高证据质量,似然项里的噪声被压低,更新更稳定。精确性和可重复性直接影响似然的形状,越精确、越稳定的实验,权重越高。学界用这些方法做事,哲学的两把刀就没那么容易把科学逼到墙角。
这套底层逻辑有一个形象的比喻。宇宙像一款游戏,源代码是自然法则,人类作为游戏里的角色看不到源码,只能看屏幕上的结果来猜背后的规则。苹果落地、行星绕行、星光红移,这些结果是一条条线索。
贝叶斯的步骤就是由果溯因,让每条线索在“源码候选列表”上加加减减。弦论、圈量子引力、平行宇宙这类候选没有现成的实验线索,分数很难算,先验就会影响结果。可操作的路线就是等新证据出现,再动一次表。
这套方法也有缺点。初始置信度不好定是第一件棘手事。能测的理论靠一次次证据把先验拉到一个稳定区间,起点高低影响不大。
没法测的假说就只剩下个人判断,容易分歧。不同人持有不同置信度是系统允许的状态,知识结构和经验不同,估值自然不同。中医这类问题就会出现截然相反的看法,争论持续存在。
解决路径还是证据,往共同的证据方向推进,争论就会收敛。系统自身不能用自己来给自己打分也是一个边界问题,自指悖论一直存在,理性总要选择一个起点假设来往下走。这套框架落到日常生活也能用上。
看新闻里的医疗新疗法,先问证据有多少、质量够不够、有没有双盲、有没有复验把“听说有用”变成“置信度有多高”,心里就会稳一些遇到一个理论的反面消息,不用立刻把它归为“全错”,把置信度略微下调,再看看新消息是不是真证据、是不是统计上站得住。
选用中成药或保健品这种事,路径还是一样,把宣传里的说法换成证据的清单,去找可靠的试验和权威的评审,有线索再算置信度大到经济政策的判断,小到家庭的医疗选择,都能按这条路来走这套科学观对不同学科的相对位置也给出解释。
数学重在逻辑自洽,物理重在与自然合拍,心理学和医学重在人群差异的复杂性,天文学重在数据采集的局限,经济学重在假设驱动的模型多样置信度的差异不等于歧视,等于是告诉大家“哪块更经打,哪块需要更谨慎”对象也不是整个学科,而是具体理论。
每一个理论都要靠证据来加减分,学科只是集合名。这条路向前走的看点很清楚。能提高证据质量的方法都会让科学更有力。
统计标准的改进、开源数据和复验机制的普及、跨学科的联合实验、公共数据库的建设,这些工具会把似然项做得更清楚能让模型更透明的方法也很关键把复杂模型的假设公开,写清楚哪个环节最敏感,公众和同行都能看懂,错误更容易被发现。
对非可测假说的态度也要更实在。承认它们是候选,把它们放在“等待证据”的列表里,不着急给高分,也不把它们打成零分,留出改进空间。观点是科学的底层逻辑已经不再是二元判断,而是“证据权重下的置信度更新”。
这条逻辑能把哲学的难题化解成可操作的算账,把可证伪性收纳进一个更大的框架,把科学方法从经验直觉变成数量化的流程对读者最有用的落点就是把习惯改成“问证据、算强弱、再下结论”,把情绪冲动变成清单和分数科学的价值来自和世界的匹配度,证据越好,匹配度越高,生活里的决策就越少走弯路。