【小P老师-prpr.pw原创:大数据分析背后的数据思考】上高中的时候,有一次老师在讲台上讲物理运动的例题解析,记得满黑板都是因为xx,所以xx;因为xx,所以xx;因为xx,所以xx。。。。。。看的我头昏脑胀,不是我看不懂(我全校1000多名重点生里面物理还老是第一名呢),是我确实既羡慕老师脑袋里面如何记得到那么多的因为所以,又对这个充满了各种因为所以的世界感到繁杂紊乱,不可思议。

记得前排的一个女生回过头来,半开玩笑的说,因为所以,科学道理;懂不?弄的我一愣一愣的。不过长期的学历教育、满篇的因果逻辑确实让很多人伤脑筋,不是不尊重它们的严密,而是这满眼的鸟语花香、简洁智慧和黑板上繁复的因为所以、科学道理之间,确实存在巨大的反差,让人迷惑不已。世界真的这么复杂?我们坐在操场边的草地上,偶尔格调高起来的时候,也会似懂非懂的谈论这个话题。
因果,汉语拼音读 yīn guǒ。一个意思是原因和结果之间的关系;另一个意思是因果报应,一个人的行为是因,遭受的命运曲折都是因为种下的因所得的果。所以,有因必有果的说法就流传的很广发。还有一种说法更通俗,叫善有善报、恶有恶报。
因,是主因,缘,是助缘;机,意味“积”音,果,则是结果。因无缘,则不果,机不投,因不果。因果,因机缘果之简称,时机不到,因缘不生,因不受缘,有缘无份,如此使然。“机”之源来:木应天地因缘感召,得天之气,积阳之温,化地之水,聚土之尘,累积木几,曲直向上,执著生“机",通天会地,修木高尚,至成机会。故曰:不是不报,时候未到,即是如此。
这段颇有佛学意味的姻缘际会,确实很让人初看不懂,又一看,则意味深长。可是佛学也好,科学也罢,始终都是向前发展的。 比如因果逻辑,本是探索因果之间关系的一种辩证,用来解释一些事物,探究它的来源,探索它的发展趋势等等。我们在长期的教育中受到的就是这种严密的因果逻辑的训练与指导。
但是社会和经济、商业发展到今天,技术的突破已经逐渐的要求我们放弃一部分对严密的逻辑论证和精确的因果关系的推导,来从另外一个思维角度思考我们遇到的各种问题和事情。这个重要的正在急速发生的社会认知变革,主要源于信息社会的发展和所有人和物数据化的结果。
一是社会进步到今天这个时代,物质极大丰富的今天,人们的思维逐渐受到互联网碎片化思维的影响,逐渐从深度的系统性思考问题和阅读,慢慢的转移到表层的碎片化的表面信息和跳跃的信息浓缩链接上去了。
互联网形成一个极大的知识库,它是我们地球上最伟大的老师,比孔子知道的可多了去了。从群体性到个体性的发展,也让我们逐渐摆脱老师的权威性的解读,方便的从这个伟大的老师身上,自主的去寻找我们需要的答案。一是满足了个人当家做主的满足感,获得了个体意识的解放;二是与以前的压迫性的灌输之间形成了鲜明的对比;三是极大的印证了我们这个社会所处的高速发展的时代,生产力的极大解放反过来促进了人的解放。以前我们需要一个导师活生生的站在台上,我们也从心底深处乐于接受这样一个指导,有人在前面知识的海洋里探了路,我们也乐得在后面跟随,虽然我们有时候表面上还是不喜欢这种灌输与说教,但根子里仍然不由自主的散发着阵阵芳香的奴性。这也是如今的教育和老师们面临的最大问题,随着互联网的发展,教育面临着深刻的变革。
二是随着所有的人和物,机器和事务都被物联网信息化和符号数据化处理,我们能够有条件获取样本的全部数据了。
我们以前总是采用抽样的方法去调查一些事物。但是抽样的原因是因为我们确实没有手段、工具和能力去获取我们调查对象的所有信息,我们只能采用数学的方法去选择其中的一部分。为了让我们极少数的样本能够尽可能地接受真实的情况,我们发明了随机抽样获取相对不那么主观的样本信息,但是随机抽样很难做到,你无法确保你所进行的调查是真正的随机抽样,因为在调查实施的过程中,任何微小的因素,比如被调查对象的心理作用变化等,都会引起样本的不客观性。这就是抽样本身的局限,不管你如何设计和改进,抽样就是抽样,部分就是部分,不能代替也永远不是全部的对象。
但是现在我们的整个世界,都几乎联为了一体,网络无时无刻不在 感应、传输、搜集、处理和存储各式各样的数据。我们可以从淘宝买卖家的交易数据里获得所有进行买卖的人的所有交易记录数据,而不必去抽样调查某一区域的某一类别的几个人作为样本来代表那些被代表的人群和交易记录。我们通过对全部数据的整体分析,得出的结论就是真实的情况,无所谓抽样不抽样。从这些繁杂的数据库里,我们分析出来的消费者购买行为就是中国淘宝电子商务交易的真实记录,而不是抽样的不确定的不客观的主观逻辑推演的记录。如果中国的几大电子商务体系的数据全部聚拢起来(当然也需要一个过程),那我们通过对这些大数据(big data)的分析,得出的就是中国的电子商务的真实信息和趋势。
技术的发展与进步,让我们摆脱了对抽样和部分不完整数据样本的依赖,让我们能够对整体的全部的进行分析和挖掘,而结果就是全部的真实的趋势和结论。以前的抽样因为不是全部的数据和整体,而为了接近真实的状况,就催生了因果逻辑推断的作用和发展势头。我们必须用逐渐发展起来的因果逻辑推演,来把我们不能全部获取的样本之外的其他事实所蕴含的信息加以推测。
突然,这一切,似乎不那么重要了。重要的是,人们越来越想知道这些事情和因素之间的相关性,谁和谁有关联,谁和谁之间存在着比较强的关联信息,我们通过改动谁可以带动另外一个谁的变化。这一切,都让我们逐渐从部分抽样样本状态下的因果逻辑追求变成了不再那么苛刻的依赖因果逻辑而是更像探听事物之间的相关性。 人们由于各种原因,不再对为什么兴趣浓厚,更在意谁和谁之间有关联这种状态。
三是我们面临着思维方式的极大变革挑战,需要考虑以部分放弃严密的因果逻辑关系的推理来换取快速行动的务实效果。
这一点不那么容易让人直接接受,更谈不上喜欢这条建议或者道理。但是有它有道理的一面,也是随着发展会逐渐占据主导地位的一种思维方法。
我们并不是说,因果推理和逻辑推理需要被抛弃到历史的垃圾堆里面了。我更倾向于在复杂事物的前期,更多的需要这种思维,用放弃一部分因果逻辑方面的纠结来换取对事情的推进与持续关注和了解,进而能够让事物不会只停留在原始的因果论证的尴尬层面。而大量的相关性关系最终还是需要因果逻辑验证与归纳分析,来提炼为更高层次的知识财富。快速响应变化需求的时代,你需要用这种全部数据分析的大数据分析方式,来快速获得和你看重的结果关联度最高的那些基本因素,从而能够快速响应和反馈,取得先机,本身就是成功的一大要素,不为别的。
个体化意识的提升,个性解放的促进,社会化生产力和全球事物数据化的大发展趋势,都在飞速的引导我们进入这样一种模式,这对每个人来讲都是一个极大的挑战,面临着我们是不是被数据化了、是不是变得肤浅了、是不是经历了漫长的发展最终又向深林里树上的那些我们的祖先靠齐了(返祖嘛)的极大疑惑,随着数据化的不断加深,所有的人、事、物都会被信息化而后数据化,我们用一张虚拟现实的网笼络了这个美丽的星球,人类创造出来的技术时不时的会发出让人担心是否失控的状态,一股巨大的潮流正铺面而来。而你,又如何看待、对待?
- 评论列表(网友评论仅供网友表达个人看法,并不表明本站同意其观点或证实其描述)
-
