|
跟着信息技能和网络及种种传感设备、海量存储技能的飞速成长,数据的界说和收集方法发生了革命性的变革,大数据应运而生。对比传统阐明要领,大数据技能拥有无可相比的优势,然而大数据技能所激发的一系列关于认知论的哲学困难——大数据的假设及伦理问题——同样不容忽视。John Symon和Ramón Alvarado 2016年颁发在《大数据与社会》(Big Data & Society)的论文《我们可以信任大数据吗?把科学哲学运用在计较机软件上》(Can we trust big data? Applying philosophy of science to software)暗示:在许多环境下,道德与认识论问题密不行分。解铃还需系铃人,只有尽大概弄清大数据如何影响并改变了认识论,才气从基础上改进大数据技能潜在的问题。譬喻,通过大数据技能我们可以知道什么?这些技能的范围性在那边?以及大数据的“新”到底表此刻那边? 有关大数据的主流文献经常表示出对科学哲学和认知论的差异观点,结论均基于一个假设:大量的数据及通过大数据阐明发明的模式是独立于理论基本的。换句话说,许多大数据学者错误地认为数据量越大,阐明功效就越靠得住,而理论态度无关紧要。这种研究大数据而不思量今世科学哲学的做法既不明智也不行取。大数据的焦点在于如何利用大数据技能来捕获和阐明数据,而大数据技能多涉及算法,我们只有充实领略各类算法的范围性和风险,大白这些算法会如何引致以及引致什么样的误差,才气抉择到底多洪流平可以对这些算法施以信任、加以限制。 文章首先先容了大数据的界说并试图表明大数据的范围性,然后就以往研究对大数据的品评举办了概述,并接着论证为什么科学哲学和社会认识论与大数据技能息息相关。办理认识论担心的最好步伐是参加到计较建模与模仿的科学哲学辩说傍边。基于Paul Humphreys提出的“认知恍惚”,作者暗示,大数据的“认知恍惚”要害在于大数据技能对错误打点和错误检讨的忽视,而错误问题同时也是大数据认识论的一个重要特征。要改进大数据认识论的缺陷,就必需正视误差的影响。基于这一思量,文章就误差检讨与更正的主要特性及软件误差和路径巨大性之间的干系举办了叙述,并先容了误差检讨的通例统计要领(如Mayo的严格检讨及模仿验证),以及当处理惩罚大数据的软件系统受到高度制约时这些误差检讨的缺陷。最后,以谷歌流感趋势为例,文章进一步接头了大数据技能的范围性,尤其是范围性的来源。 那么,我们可以信任大数据技能吗?文章暗示,这不只仅在于软件的开拓与批改自己,而越发在于认知对软件的开拓—修改—更新这个轮回进程的指引浸染。大数据技能是科学哲学与社会认识论争辩的产品,在运用时不该离开科学哲学思想的指引。缺乏认知则会大大限制我们发明错误的本领。 总而言之,大数据技能作为一种东西不行制止地存在范围性。从本质上讲,这些范围性反应了大数据技能背后理论的缺失。更重要的是,这些范围性清晰地表达了大型软件系统的通例误差监测、批改与评估对内涵认识论的挑战。 |














