英国大学社会科学评价:不看影响因子,看原创性
在国内外大力破“唯影响因子”评价的情况下,很多大学教师尤其是“青椒”疑惑纠结:不用影响因子,那你拿什么评价我能否入教职、能否上职称、能否获得铁牛(tenure)?
英国大学“卓越科研评价框架”(REF)规定:科研评价,只看原创性,不看影响因子或被引用数。看看英国的科研评价理念和做法,可借鉴参考。
一、何谓“原创性”?
什么是“原创性”(originality)?如何评价“原创性”?英国针对大学的“卓越科研评价框架”关于科研成果原创性评价标准,具有参考、借鉴意义。
科学社会学家默顿提出,原创性是科学的最高价值。科学作为一种社会制度,将原创性视为最高价值。他将原创性纳入科学的五种精神气质之中,即公有主义、普遍主义、无偏私性、原创性和怀疑主义。
正是通过原创性科研成果,人类知识才得以不断增长。从科学家转型为科学社会学家的齐曼提出,所谓原创性,就是给人类知识宝库“添新砖”“加新瓦”。
比如,提出新科学问题,探索新研究方法,获得新数据,提出新理论、新解释,或者是以上的组合。可以说,原创性是科学的精气神。
英国针对大学的“卓越科研评价框架”(以下简称REF),对科研成果的原创性提出相对可操作的界定,即原创性,指的是某个科研成果在多大程度上对某个科研领域的理解和知识作出了创新和重要的贡献。
具体来说,一个具有原创性的科研成果指的是,作出新的实证发现,或发现新材料,以及对这些新发现或新材料作出新解释;解决新问题或复杂难题;开发出创新性的研究方法、方法论和分析仪器设备;拓展出富有想象力和创造性的研究视野;提出新论证或/和新表述、新解释或/和新洞见;获得或采集到新的数据;或/和对社会政策和实践提出新理论、新分析或新表述。
英国对大学科研成果的评价,除了坚持原创性标准之外,还提出要兼顾对科研成果的“意义性”和“严谨性”进行评价。
所谓“意义性”,指的是某项科研成果在多大程度上对人类知识、学术思想或对社会政策和实践产生影响,或者对它们具有多大的影响潜力。也就是说,要全面评价科技创新成果的科学价值、技术价值、经济价值、社会价值、文化价值。
所谓“严谨性”,指的是某项科研成果是否充分体现学术严谨性、体现学术诚信科研伦理,使用的概念、分析方法、数据资料、理论和方法论是否确凿可信。
二、如何评价“原创性”?以“社会科学”为例
英国REF对科研成果采取“专家同行评议”和“分类评价”。REF将科研成果划分为四大类学科进行评价。
第一类:物质科学、工程和数学;第二类:医学、健康和生命科学;第三类:社会科学;第四类:人文与艺术。REF把科研成果的原创性(以及科研成果的意义性、严谨性),划分为四个层次,分别是四星、三星、二星、一星。
笔者曾经介绍REF对“物质科学、工程和数学”学科的“原创性”(及意义性和严谨性)的评价标准,这里再介绍REF对“社会科学”原创性的评价标准。必须指出:原创性是有“层次”之分的。
如果某项社会科学成果具有或潜在具有下列某些特征,可评定为四星级:
提出了全新(outstandingly novel)的概念、范式、研究方法或崭新的研究结果。
奠定了未来社会科学的研究元点(primary point of reference)。
对学术研究议程不断产生影响。
研究设计、研究方法、调研和分析非常严谨扎实。
获得或开辟了极为重要的数据或研究资源。
如果某项社会科学成果具有或潜在具有下列某些特征,可评定为三星级:
提出了新颖的概念、范式、研究方法或崭新的研究结果。
奠定了未来社会科学的研究基点。
提出了非常重要的新知识、新思想和分析方法,很有可能对未来的学术研究议程持续的产生影响。
研究设计、研究方法、调研和分析严谨恰当。
获得或开辟了确凿的数据或研究资源。
如果某项社会科学成果具有或潜在具有下列某些特征,可评定为二星级:
提出了重要的新知识
对知识库作出了渐进性的或累积性的贡献
很专业地进行和采用了研究设计、研究方法调研和分析。
如果某项社会科学成果具有或潜在具有下列某些特征,可评定为一星级:
获得了有用的(useful)的新知识,但该知识不大可能产生较大的影响。
对知识库有一定的贡献,但是属于现有的范式或框架之内。
恰当地进行和采用了研究设计、研究方法调研和分析。
如果某项社会科学成果未能达到上述质量,则打入“忽略不计”行列。
三、不得看影响因子
REF规定,对大学科研成果评价,不得看影响因子,慎看被引用数。
REF《评价标准》规定:任何评估小组(四大类学科主评估组下,划分为34个小学科评估小组),对科研成果进行评估,不得考虑发表该成果的期刊的影响因子,不得考虑期刊的档次和级别。
四、慎看被引用数
若干小学科评估小组明确表示:科研成果评价中,彻底不看引用数,比如物质科学、工程和数学大类中的“数学”评估小组,“工程”评估小组;社会科学大类中除“经济学和计量经济学”评估小组之外,所有其他小组均不看引用数。“艺术与人文”大类,一律不看引用数。
若干小学科评估小组表示,会部分看引用数,比如医学大类的所有分学科评估小组均看引用数。
四大类学科主评估组对那些在科研评价中参考引用数的评估小组,作出下述规定:
1)引用数仅仅作为评估科研成果的学术意义(academic significance;或学术重要性,学术价值)[案:而非原创性]的一个指标。引用数只是提示同行评议判断成果质量的一个元素,不得用作评估的主要指标和工具。
2)如果某项科研成果没有提供引用数,并不意味着该成果缺乏学术意义。
3)评估小组应当认识到,引用数只是有些时候而非总是一个可靠的指标(reliable)。评估小组还应当认识到,引用数并不是一个总可以查到的数据,并且,引用数因学科或评估单元不同而不同,不能搞“一刀切”。
评估小组应当认识到,引用数,对某些类型的成果(如应用性科研成果)是一个不可靠的指标;而且,引用数,对不是用英语写作的科研成果以及新近发表的成果,存在着很大的局限性(案:和不公平)。
4)评估小组如果看引用数,只能看REF评估组提供的数据,任何其他机构和个人提供的数据都是无效的。任何评估小组不得看期刊影响因子或期刊级别分区。
5)任何看引用数的评估小组,必须遵循REF的总规定。任何评估小组必须把同行专家评议作为科研成果评价的主要手段,以此作为对科研成果的原创性以及意义性和严谨性进行全面的评估。
结语
任何国家或大学的科研评价标准,必须与其发展阶段相适应,当具有“国别特色”或“自己特色”。在吾国很多大学处于世界三流或二流大学的情况下,在社会科学具有不同于自然科学和工程学科的学科特性以及鲜明“国情”的情况下,吾国大学(包括已宣称进入了世界一流大学的PK U)在现实中采用期刊档次如A刊及影响因子、被引用数等量化指标的评价做法,具有很大的合理性,当然也有不合理性。
对于那些已经接近或进入世界一流社会科学的学科,对它们的评价要分阶段地超越影响因子等量化指标,逐步转向基于同行专家评议的对科研成果本身的原创性评价。对长聘正教授的科研成果评价,也当如此。
评论 (0)