内容摘要:通过社会调查获得信息数据是社会科学尤其是社会学所依赖主要研究方法。
关键词:社会调查;李炜;数据技术;智能设备;中国社会科学网;学者;独特价值;数据信息;数据量;记录
作者简介:
通过社会调查获得信息数据是社会科学尤其是社会学所依赖主要研究方法。而大数据时代凭借智能设备,通过数据挖掘技术可以获得海量数据,有学者提出,依赖于问卷调查的传统社会调查所能获得的数据与大数据相比,就是“小数据”。那么社会调查在大数据时代是否还有必要?在大数据技术兴起背景下,传统的社会调查方法如何彰显其优势和独特价值?中国社会科学院社会学研究所研究员李炜就这一学术争鸣话题接受中国社会科学网记者的采访。
中国社会科学网:请您谈一谈大数据给传统社会调查带来的挑战,大数据在获取数据信息的渠道等方面具有怎样优势?
李炜:说到“大数据给传统的社会调查带来的挑战”,首先要明确“传统的社会调查”是什么。在我看来,社会调查的“传统”也在不断的变化中。从古希腊时代的贝壳到当前采用计算机、互联网和远程通讯技术,社会调查在技能和方法层面也发生了巨大的变化。如你所说大数据技术所依赖的是现代先进的网络信息技术、智能设备等,同样也造福于社会调查的领域,在这一层面上大数据之于社会调查并不是挑战,而是共同的机遇。
社会调查,或者更狭义地说统计调查(survey research),其本质是以“询问—作答”方式来收集社会信息。即询问者(研究者)将自己感兴趣的问题,通过访问工具(常见的是问卷和调查表格),求教于信息提供者(受访者)。这些征集到的信息,通常以量化的(统计的)形式再现。在这一过程中,有目的的问题设计是其本质。
因此,只要人类通过提问他人来获取信息的需求存在,社会调查在本质上就是不可替代的。正如你的采访提纲向我提出三个要解答的问题,就体现了你的“有目的的问题设计”。试想如果不通过这种问答方式,你即便掌握了我个人的“大数据”,汇集了我的微博、微信互动信息、文章著述,乃至手机通讯记录,也无法如此直接地得到你所意欲的答案。
你的问题中还意涵着常规的社会调查涵盖的数据量小,无法和“大数据”的信息量匹敌的看法。持这种观点的人不在少数。这一观点的误区在于只看到数据量的大小,而不关注它是否对信息使用者有用。比如,我所参与的“中国社会状况综合调查”(CSS)每年度获得的原初数据信息量至少是800多万项(1万余人的至少800个变量),以数据库格式存储大约70M,若以文本格式存储应该不到10M。自2006年至今5次调查,其数据规模乘5就大致可知了。为了每次调查的1万余人的800万项数据,我们有700-800人的人力投入,平均的单个访问花费至少600元。这个经费标准在国内的同类大型学术调查中,属于中偏下的档次。从数据量上来比,每年的调查数据信息量,仅相当于600个人每天使用2次交通卡乘地铁的信息。但调查中百余项询问的问题广泛覆盖了从家庭结构、就业、收入消费、社会保障……到公众对于地方政府的评价、对反腐倡廉的看法。每一问题都是我们所需的信息,而他(她)的交通卡数据再大对我也是无用的。因此,数据量的大小不是本质问题,关键是数据是否有用的。







