这两天,又一篇学术论文“火出圈”了。全球顶级学术期刊《科学》最新一期刊登的一篇文章称,来自美国与瑞士的研究团队在全球40个国家的355个城市进行了测试。研究者希望以实验人员向银行、酒店等机构提交自己“捡到”的钱包,来测试当地人的“诚信水平”。研究者相信,越多收到钱包的工作人员按照钱包中的联系方式联系了失主,说明当地人“诚信水平”越高。
这篇文章的争议点则在于,文章称,中国的“诚信水平”在40个国家中垫底。文章发出后引来轩然大波,许多人都对调查的科学性,甚至是调查者进行调查的立意进行了质疑。那么,《科学》这篇文章到底有没有道理呢?还是用那句话说吧:你认真一下,他们就输了。
处处是坑的测试设计:收到这么个钱包,你会主动找失主吗?

这项研究的实验设计是最为人所诟病的一个方面:首先,研究人员准备了上千个简易的“钱包”:塑料透明钱包中,装着三张相同的名片,名片主人的身份被设定成当地最平常的名字、最平常的职业(在中国,名片上的名字是Chang Wei、Liu Qiang、Wang Lei,职业是软件工程师),并注明邮箱。钱包中还附有一份用当地文字写成的“购物清单”。
据称,研究者在中国的北上广深,和成都、天津、杭州、西安共8大城市,总共投放了400个不同的钱包。其中一种只有名片和“购物清单”,另一种加上了49元人民币。根据研究者的说法,所有地方准备的钱包都有有钱和没钱两类。现金数额按照不同地区的物价水平,购买力基本相当。
在具体操作上,研究团队派出了13名来自德语区的工作人员,在全球40个国家执行同样的程序:将一个透明钱包交给当地的酒店、银行、邮局和电影院的工作人员,用英语说“Hi ,I found this on the street around the corner. Somebody must have lost it ,I''m in hurry and have to go , can you please take care of it?”(我在街上捡到一个钱包,肯定是有人弄丢了,我着急要走,你能帮我处理一下吗?)。
研究者称,他们以名片上的电子邮箱收到工作人员联络,主动送回钱包的比例,来衡量不同地区、不同情况下的人们的“诚实程度”。研究团队自称控制了工作人员的英语水平、当地工作中使用电子邮件的普及度等变量,结论确定无疑:中国人主动联系失主的比例最低,没钱的钱包只有约8%联系失主,有钱的钱包则刚刚超过20%。

遇上中国人,咋就这么双标呢?
这种实验设计自然是漏洞百出。最关键的一点莫过于,研究团队竟然没有安排人员主动前去找工作人员或是失物招领处寻找失物,便草率地给没有主动发送邮件的中国人扣上了“不诚信”的帽子。
事实上,这篇文章在绪论中表示,研究的立意,是讨论人在什么时候会更有道德感,更倾向于做出“诚信行为”。研究者认为,不还钱包所带来的收益,联系失主的成本,人的利他倾向,和不还钱包所带来的道德成本,是影响被试者是否归还钱包的四大因素。实验设计控制了“联系失主的成本”这个变量,希望探索“不还钱包的受益”不同时人的行为。研究者假定,钱包中金额越多,被“私吞”的可能性越大。
然而,根据这项调查自己得出的结论,40个国家中的38个----包括作者认为“最不诚信”的中国在内,工作人员在收到了里面有钱和钥匙的钱包时,都会比收到空钱包时,更倾向于联系失主。
最让人看不懂的,是整个调查选择了40个国家,仅在欧洲就选了包括挪威、瑞典、丹麦等近邻的19个国家,但东亚地区却只在中国一家开展了调查。日、韩等国为什么没有做类似的测试呢?文章作者竟然还专门进行了回复:因为据他们了解,日本人收到遗失物的时候更倾向于将其交给警察派出所等地方,等待失主前来认领。这和实验的要求不符。那为什么同样习惯于将遗失物交给工作人员,等待失主认领再确认包里有什么的中国人为什么就符合“实验要求”了呢?作者给出的只有沉默。

另外,在很多细节上,虽然研究者信誓旦旦地声称自己“控制了变量”,但仍然让人疑窦丛生。例如,研究选择的40个国家中,多半都是欧洲国家或以英语为官方语言的国家。实验结果也显示,语言背景更接近的国家,“诚信”水平远高于中国这些不使用英语的国家。虽然研究者称已经确保了被试者能够理解研究人员的德国味英语,但被试者是否能理解实验中那句“take care of it”是“帮忙联系失主”的意思呢?
再比如,研究者称,确实考虑了中国等国家日常生活中使用邮件这种联系方式较少的情况,因此专门选择了会使用邮件与客人联系的酒店,情况并无明显差异。他们还参照一份世界银行发布的,各国人士日常使用电子邮件频率的数据,在控制了使用邮件频率的情况下重新核算,中国的排名也只是从倒数第一上升到倒数第二。
然而这样的说法仍然很难让人信服:工作使用邮件,和日常生活中使用邮件是两个概念。在许多地方,工作人员使用的电脑都无法连接外网,工作纪律也不许使用私人手机。更有网友吐槽,研究者在中国投放了许多只有名片和便条的“空钱包”,看起来实在是很像街上商家随便发放的宣传品,有8%的工作人员主动联系名片上的邮箱,才是件反常识的事情。
归根结底,研究者用了如此复杂的方式,保证被试者“能用邮件”,却不肯在名片上多印一个手机号,或者核实一下没找上门的被试者是否真的私吞了钱物,实在是有点不知所谓。

科学无国界,但《科学》杂志估计是有的
因为实验设计不科学而得出了看似骇人听闻实则没有根据的结论,这样的闹剧其实并不少见。2016年,中国一家婚恋网站发布调查结果称,中国“95后”平均在18岁前迎来初次性经验。实则,彼时年龄最大的“95后”才21岁,统计其中已有性经验者的数字,自然不会太高;更早些时候,则有媒体称,中国一半的父亲在给别人养儿子。原来,这是统计了某亲子鉴定中心给出所有报告的数据。家长产生怀疑后来进行鉴定,结果有问题的比例自然比一般人大得多。
不过,一个实验设计与结果推论有着明显漏洞的学术研究,通过了期刊编辑与业内专家的层层审核,刊登在学术界最有声望的学术期刊,《科学》杂志上,这问题可就和完全不一样了。事发后,就有社会心理学专家吐槽道,虽然这项研究自称是在研究“诚信行为”,但研究要求被试者主动联系失主,期待的却是一种“帮助行为”。
这位专家认为,这两种行为在社会心理学上可谓是相距甚远。此前中国曾有类似目的的研究,被试者将拾到的钱物交至失物招领处即算诚信,而在这类研究中,“不诚信”行为的比例只有5%。
其实,中文互联网上的批评声浪,确实不乏“过敏”的成分。仔细研究论文的研究设计不难发现,中国本来就不是这项研究的重点,中国和大多数国家一样,被投放的钱包只分有钱没钱两种。而在美国、英国,研究者还额外投放了第三种包含更多现金(约94美元)和一把钥匙的钱包,研究发现,这种钱最多的钱包,被主动送回的比例也最高。此外,文章发出后,中国也确实不是关注的焦点,多家主流媒体对这份研究进行了报道,很多都没有提及关于中国的问题。
然而,无心的歧视,也照样会对被歧视者造成伤害。譬如,研究者在结论中宣称,宗教信仰氛围更浓厚的地区,被试者更倾向于联系失主。显然,以无神论为主流的中国为这个结论提供了重要的基础。再比如,同样有着类似的特殊习惯,日本就被特殊照顾了,中国却被无视了,并且直接挂在“最不诚信”的位置上。这种情况下的“不友好”和“敌意”间的距离,可能比调查中“诚信行为”和“帮助行为”的距离,还要小。一次一次的不公平对待无疑提醒着我们,科学无国界,但《科学》杂志,估计是有的。
评论 (0)