第1个回答 2022-07-01
吴军博士的新书叫《智能时代》,副标题是“大数据与智能革命重新定义未来”,因为这个智能革命恰恰源于数据驱动,与此相对应的是机械思维驱动了工业革命。从历史的角度来看,这似乎只是不同的发展阶段,但如果从底层逻辑来看,我认为这只是不同数据尺度的体现。
机械思维到大数据思维既不对立互斥也并不彼此相邻。如果笼统地总结,机械思维当隶属小数世界,大数据则隶属大数世界,而处于两者中间的是我们的日常更常面对的中数世界。
一、机械思维与小数世界
在当今的我们看来,“机械思维”好像是滞后的、呆板的象征,甚至“机械”本身也成为了对某个人的形容,然而绝非褒义。然而在17世纪,机械思维就像当今的所谓互联网思维一样时髦。
机械思维的方法论如果用八字箴言来概括我觉得没有比“大胆假设、小心求证”更合适的了。大体上就是做出假设、建构模型、数据证实、优化模型、预测未来。这也是沿用至今的一套思路。成果也是显然的,比如,牛顿——他用力学三定律和万有引力定律几个简单明了的公式说明了大千世界宇宙万物的运动规律。
这里面有三个点, 一是公式的确定,二是公式的简明,三是公式的普适 。这也是机械思维的三大特质。
先看确定性和普适性。牛顿的定律无论应用于什么样的场合,都可以用一样的公式推出相应的确定的结论。这对于人们来说非常重要,因为根据种种确定的定律和原理,世界对于我们而言成为可知,我们也可以借此预测系统中其他变量的反馈、预测未来。
简明性一样重要。牛顿所处的时代宇宙的复杂程度并不比现在弱,不一样的只是思维方式决定的模型差异。太阳系中有成千上万的天体,按照完全的计算,就复杂了去了。然而万有引力定律非常简洁优雅,将万千天体的作用回归到依次考虑两两天体的互相作用力中。甚至更进一步,由于太阳独一无二的巨大质量,牛顿将每个行星和太阳看成一个独立的二物系统,得到了更进一步简化。回归到两物体系统自然是个“小数”,然而这个所谓的小数世界原本其实并不那么小。比如,在一个仅考虑两物体的系统中,涉及到两物体各自的情况、彼此相互作用的情况和它们所在的系统的情况。如果借用数学和力学概念来描述,那么两物体系统涉及到孤立方程、相互作用方程和场方程共4个方程。此系统每增加一个物体,场方程数量保持1不变,孤立方程线性增长1个,但相互作用方程数就呈指数级增长了。所以,简化也是其核心。
二、大数据与大数世界
与上述机械思维一脉相承,苏联在设计武器和航天器时依赖牛逼的数学家建立复杂而精准的数学模型,希望可以用之皆准。美国的科学家数学底子弱一些,所以走了不同的道路——建立简单的数学模型,但依赖于计算机和大量数据。结果是美国的路子胜出了。
吴军博士在《智能时代》中还举了另一个例子——德国拥有完美的光学仪器技术,所以做出了高难度的非球面透镜,仪器小巧而完美;日本缺乏这样的技术,所以用多个球面镜组合来获得同样的效果,这样的机器笨重然而容易大规模生产使用。二战后,成为光学仪器第一大国的不是德国,而是日本。
在这两个例子中,都通过 多个简单模型来胜过单一的精确模型 。然而这样的胜出是有前提的——基于大数据。如果说机械思维下的精美模型是纯净的晶体,那么大数据绝对是散漫无章的气体。气体的分子们本身是无序而复杂的,但我们却可以预测整体的扩散情况、确定其整体的物理性状。这跟每一个分子的“随机性”离不开,正是随机性让统计有了意义。如果某地有一场流感正在蔓延,我们很难判断某个单一个体是否会感染,但谷歌甚至可以根据人们的搜索数据来计算出接下来将蔓延到哪里,至于感染率有多少就更是一个简单的统计计算数字了。
在上面这个流感的例子中不难发现,面对大数据,精确的数值其实反而没有那么重要了,我们关心的点也不必精确到个位数。比如运营一个app,用户达到千万量级的时候,每天关注的DAU肯定就是多少万,甚至更简略一些就只具体到十万位、百万位了,个位数是几不再重要。但面对大数据,个体依然是独一无二的,我只有感染、不被感染两种结果。那么对于这种情况,大数据的感染率就成为了个体是否会感染的背景概率,个体自己的健康情况、活动区域灯则成为其他的调整概率项。
由上也可见,概率性思维的价值更凸显了。事实上,基于大数据的思维方式不做假设,只根据海量数据做出相关性分析;不care因果确定,只判断概率大小、相关性强弱。
除了 混杂取代精确、相关取代因果、不确定性取代确定性 ,大数据思维最显而易见的就是 全量取代样本 ,这也就是大数据之为“大数”的原因。不用考虑怎么抽选有质有量的随机样本,大数据的风格是全量数据纳入计算。正因如此,从搜索引擎到语言识别到机器翻译,算法技术相当的前提下,谷歌却能异军突起——他家的数据量沉淀太可观了。然而海量的数据只是燃气,终究受制于燃灶的处理能力。正因为计算机的计算能力的增长赶不上数据的指数增长,服务器的数量就更赶不上,所以,面对大数据,简化的算法尤显重要。比如马尔可夫链,比如维特比算法。
三、复杂的生活与中数世界
管理上,我们或许会把一个个的个体抽象为单元,然后用机械思维统筹管理;决策上,我们又可能会根据大数据跑出的强相关性分析结果,决定下一步去打什么市场。无论是小数世界的机械思维还是大数世界的大数据思维,都是基于过去可以预测未来的假设的,目的也都是为了预测。
然而,我们现实生活中遇到的大多数情况既不是小数也不是大数。如果说机械思维是晶体、大数据思维是气体,那么中间还隔着一个液体——中数的世界。某家上市公司有多少人?是个中数;一台计算机里面有多少零部件?是个中数;这片森林里有多少只鸟?是个中数……生活在其中的我们是尴尬的,就像高中数学老师的吐槽——你们做物理什么没有摩擦力,哪里没有摩擦力?还匀加速运动,你匀加速一个我看看!
小数、中数、大数本身并不是在量级上有一个数字清晰的划分,事实上这种划分是抽象的、概念式的。 对于身处其中的中数世界,我认为可以采取的应对方式之一是根据不同的情况,或者靠拢小数世界借鉴机械思维,或者靠近大数世界借鉴大数据思维。
先看靠近小数世界和机械思维。假设-求证-应用的方法论应用场景其实非常广阔。比如,这两年非常热的精益创业,精益思维最核心的点就在于最小化可行性验证。由于现实生活中我们的成本是有限的,不可能有个主意就全量铺开,这也是不经济的。我们需要用最小的成本先行测试验证某一想法,就创业者而言就需要用最小的成本在真实场景中验证用户是否真的有此需求。但此时得出的归纳性结论并不是机械定律般确定性的、因果明晰的,事实上,归纳无法确立因果,只能提供强相关、弱相关或不相关的参考。
再看靠近大数世界。国人爱好读史,历史本身何尝不是大数据。但我们阅读的史书只能是寥阔史料中挑选过的非随机样本(中数),即便如此,依旧是“太阳底下没有新鲜事”——基于过去预测未来一定程度上确实是有应用价值的。过去给我们对于未来的预测提供了一个外部视角,可以作为我们做具体预测的背景概率(曾看到有人戏称经验是人类的大数据,我觉得蛮有意思,但个人经验远达不到“大数据”的程度,充其量只是中数,然而已经可以为今后的预测和决策提供一个背景概率)。所以, 大数思维对于日常生活最大的借鉴价值我认为是提供一个外部视角的背景概率。当面对具体的情况的时候,在这个背景概率的基础上,分析具体情况做各个独立的概率修正 。
我们的知识要么源于自身和他人(同时代或历史上)的经验,要么源于前人已经提炼出来的原理。
对于自身和他人的经验,有两种借鉴方式——一是直接复制,二是追究因果(虽然大多时候只是相关关系)予以应用。 都会觉得第二种好,但现实中大多数情况我们都在不自觉地按照第一种思路应用,因为第二种不仅难,而且违背直觉——也就是说,大多人(包括我在内)大多时候是达不到机械思维的标准的。
对于前人已经提炼出来的原理,也有两种应用方式——一是一元思维模型,二是多元思维模型。 查理·芒格说过,如果你只有锤子,那么在你眼里什么都是钉子。因为如果一个人只有一两个思维模型,那么当他思考现实的时候就不得不扭曲现实来符合自己的思维模型。这个时候,模型越精确具象,对一个人的思维限制就越厉害。所以查理·芒格指出,我们必须有多元思维模型,且这些模型必须来源于各个不同的学科(在这个学科细分的世界,永远别指望在一个院系中发现世间全部真理)。这种多元思维模型其实跟数据驱动下的多个简单模型胜过单一精确模型是一样的。即使我们面对的数据量很多时候达不到“大数”的层面,但一个人建立多元思维模型的前提就是比一元思维模型的人吸收了不同量级的底层数据。因为每一个模型都源于不少的经验数据得出的原理,多个模型背后就是不同维度、不同量级的数据。这样的多元模型容错性高,面对具体问题的分析也真正可以从不同侧面不同维度得出尽量贴近真实的结论和对未来的预测。
本文参考书籍:
1、吴军《智能时代》
2、吴军《数学之美》
3、维克托《大数据时代:生活、工作与思维的大变革》
4、温伯格《系统化思维导论》
5、查理《穷查理宝典》