《科睿唯安社会影响力评估框架:负责任的影响力评估指南》
- 分类
- 分析报告
- 格式
- 发布时间
- 下载次数
- 54 次
简介
由科睿唯安旗下的科学信息研究所(ISI)发布,是科研社会影响力系列报告的第三份。报告系统阐述了如何利用科睿唯安社会影响力评估框架,在Web of Science Research Intelligence平台上负责任地衡量科研的社会影响力。报告的核心判断是:科研的社会影响力评估不应依赖单一指标,而应通过结构化的框架整合多元、可验证的数据,并充分结合具体背景进行解读,以应对数据匮乏、归因困难、时间滞后及定性定量平衡等核心挑战。
一、报告概述
报告指出,评估科研社会影响力本身极具挑战性。Research Professional News的调查显示,56%的科研管理部门受访者认为“社会效益”是未来需要衡量且重要的影响类型,但同时70%的受访者认为科研的社会影响力难以衡量。困难主要源于:数据缺乏、定性定量平衡难以把握、评估方法多样化、时间滞后及影响归因困难。
核心研究发现包括:
1. 框架设计的关键考量
| 考量因素 | 核心内涵 |
|---|---|
| 影响力指标的多样性 | 结构化整合RAE等评估框架中使用的近百项不同指标 |
| 数据来源的整合 | 支持外部与内部数据结合,形成更全面的认识 |
| 影响的分类 | 按照分类体系梳理数据,帮助用户识别最有价值的信息 |
| 灵活性与用户驱动 | 支持多种分类体系(SDGs、自定义分类等) |
| 已显现影响与潜在影响 | 分为回顾性指标(已显现)与前瞻性指标(潜在) |
| 颗粒度与背景信息 | 针对机构与项目评估提供不同层级的细节与背景信息 |
2. 社会需求的分类方式
框架采用扩展版PESTLE模型,涵盖八个社会层面:
政治与政策
经济
技术
环境
社会与文化(细分为“医疗”“人力资本”)
法律与治理
默认采用UN SDGs进行分类。通过“引文主题”与“研究主题”将科研成果映射至SDGs。同时支持用户采用其他国家、地区或学科特定的分类体系。
3. 指标组结构
| 类型 | 指标组 | 核心内容 |
|---|---|---|
| 前瞻性指标(潜在影响信号) | 实用性 | 与SDGs对应的论文数量 |
| 传播 | 开放获取论文、公众讲座、新闻稿等 | |
| 关注度 | 社交媒体提及、分领域读者统计 | |
| 参与交流 | 会议、焦点小组、圆桌讨论等 | |
| 学术界之外的合作 | 与工业、医疗、博物馆等非学术机构的合著 | |
| 可转移性 | 专利申请、临床试验、政策文件参与制定 | |
| 回顾性指标(已显现影响信号) | 在学术界以外的研发活动中的利用情况 | 企业、医院、慈善机构、政府部门的引用 |
| 在非研发活动中的利用情况 | 政策文件引用、专业指南引用 | |
| 媒体报道 | 主流媒体报道情况 | |
| 表彰 | 重要奖项、学术声誉调查 | |
| 培养 | 博士生/博士后职业发展路径 |
4. 社会影响力全貌
“社会影响力全貌”功能以图形化方式总结机构在不同社会层面上的已显现影响与潜在影响,作为进一步深入探究分析的起点。其采用“渐隐式”可视化设计,旨在体现数据概括的不确定性,防止用户做出过度精确的解读。目前仅适用于机构层面(不适用于项目层面),以避免误读风险。
5. 在国家科研评估机制(RAE)中的应用
Web of Science Research Intelligence的“社会影响力报告”功能,可帮助机构完成影响力案例研究的准备、撰写与验证。框架支持将科研成果映射至各国RAE所采用的分类体系(如荷兰SEP、意大利VQR等)。
6. 未来方向
整合新的数据源与度量指标
探索定性数据源(调查、情感分析)
研究大语言模型(AI)在影响力案例研究验证中的应用
二、整体解读
1. 核心命题:社会影响力评估需要“结构化框架”而非“单一指标”
报告最核心的战略判断是:科研社会影响力评估不应试图将所有信息压缩为单一数字(如“影响力得分”),而应通过结构化的框架整合多元数据,并充分结合具体背景进行解读。
这一判断直接回应了Research Professional News调查中70%受访者认为“社会影响力难以衡量”的困境。报告明确指出:“目前并不存在一种合理的方法,可以将社会影响力数据简单汇总为单一指标,并据此对整体社会影响力进行评估比较。”任何试图将多个指标简单加总的做法都会导致误读。
2. 前瞻性 vs. 回顾性指标:两阶段影响追踪
报告将指标分为“前瞻性”(潜在影响信号)和“回顾性”(已显现影响信号),这一区分具有重要的方法论价值:
| 指标类型 | 代表指标 | 适用场景 | 时间特征 |
|---|---|---|---|
| 前瞻性 | 实用性、传播、关注度、合作、可转移性 | 早期识别潜在影响,指导资源分配 | 科研成果刚产生时即可评估 |
| 回顾性 | 非学术引用、政策引用、媒体报道、奖项、培养 | 评估已显现影响,用于RAE等总结性评估 | 需要数年甚至数十年才能完全显现 |
关键洞察:前瞻性指标并非“次等”数据。例如,开展临床试验本身并不构成已显现影响,但临床试验的启动可被视为未来潜在影响的早期信号。在影响力案例研究准备阶段,前瞻性指标可以帮助机构发现此前可能尚未识别出的影响信号。
3. 社会影响力全貌:负责任的数据聚合与可视化
报告提出的“社会影响力全貌”功能,是对“如何在不误导的前提下概括复杂数据”这一难题的回应:
| 设计原则 | 具体实现 |
|---|---|
| 避免单一数字 | 不将多指标压缩为单一“影响力得分” |
| 避免信息过载 | 按社会层面聚合,提供总体趋势概览 |
| 体现不确定性 | “渐隐式”可视化设计,防止过度精确解读 |
| 支持下钻分析 | 作为起点,引导用户深入探究具体数据 |
| 仅限机构层面 | 不适用于项目层面,避免误读风险 |
战略价值:社会影响力全貌帮助机构快速了解“在哪些社会层面影响信号较强/较弱”,从而做出战略决策——是优先强化优势领域,还是优先改善薄弱领域。
4. 负责任评估的五项核心原则
报告贯穿始终的“负责任评估”理念,可归纳为五项核心原则:
| 原则 | 具体建议 |
|---|---|
| 背景解读 | 指标必须结合具体背景解读;绝对计数可能具有误导性(尤其在样本量小或数据偏斜的情况下) |
| 规模规范化 | 在其他条件相同的情况下,规模更大的机构自然呈现更高总体影响力;需使用相对占比进行比较 |
| 阈值校准 | 对于数据稀疏的指标采用宽松阈值,对于数据丰富的指标采用更严格阈值,以平衡噪声与信号 |
| 同类比较 | 机构比较时仅进行同类比较——综合性机构与综合性机构比较,专业学科机构与同类机构比较 |
| 透明度 | 提供底层原始数据,确保各项指标构建方式的透明度 |
5. 科研人员与科研管理部门的认知差异
附录B的调查结果揭示了值得关注的分歧:
| 指标 | 科研人员重视程度 | 科研管理部门重视程度 | 分歧解读 |
|---|---|---|---|
| 浏览量/阅读量 | 38%(较高) | 18%(较低) | 科研人员希望尽早识别影响信号;管理部门更关注成熟指标 |
| 媒体报道 | 相对较低 | 高度重视(尤其在北美、澳大利亚) | 科研界对媒体影响力的认知与管理部门存在差异 |
| 政策引用 | STEM领域支持度有限 | 整体高度重视 | 不同学科对社会影响力的定义不同 |
战略启示:负责任的社会影响力评估需要平衡不同利益相关方的视角,避免单一群体主导评估框架的设计。
6. 对国家科研评估机制的支撑
报告明确展示了框架与各国RAE的对接能力:
| 国家/地区 | RAE机制 | 框架支持方式 |
|---|---|---|
| 荷兰 | SEP(标准评估协议) | 科研成果可通过SDG映射至SEP分类 |
| 意大利 | VQR(科研质量评估) | 支持社会、文化与经济维度评估 |
| 中国香港 | RAE 2026 | 可根据评估指南调整分类体系 |
| 英国 | REF 2021 | 框架指标与REF案例研究四要素(贡献、产出、影响、证据)高度契合 |
战略价值:框架不仅提供定量指标,还可帮助机构完成影响力案例研究的准备、撰写与验证——这是RAE评估的核心环节。
7. 映射方法的严谨性:超越关键词匹配与黑箱AI
报告特别强调了映射方法的中间路线:
不采用纯关键词匹配:示例论文明确提及SDG15但实际与研究主题无关,纯关键词匹配会导致错误分类
不依赖AI“黑箱”:AI模型本质上属于“黑箱”,人们无法明确知道其为何得出某一结论
采用引文主题与研究主题:基于“相互引用的论文通常涉及相近主题”的假设,结合语义分析,实现透明、可复现的映射
方法论价值:这一方法在可扩展性与准确性之间取得了平衡,且符合负责任研究评估的透明性原则。
8. 应对数据稀疏与分布偏斜的统计方法
报告直面“大多数机构在多数影响力指标上几乎没有数据”的现实,提出了务实建议:
| 策略 | 具体做法 |
|---|---|
| 限制比较范围 | 仅比较具备足够影响信号的机构,降低统计噪声 |
| 使用相对位置 | 采用分位数等相对位置指标,在不同指标分布差异较大的情况下提高可比性 |
| 阈值动态校准 | 根据度量指标特征校准阈值——稀疏指标用宽松阈值,丰富指标用更严格阈值 |
| 承认局限性 | 小样本数据天然包含更多统计噪声,避免过度解读 |
战略价值:避免因“数据不完美”而放弃评估,同时防止因“过度解读稀疏数据”而产生误导性结论。
三、核心数据速览
| 指标/数据 | 来源/说明 |
|---|---|
| 56%的科研管理部门受访者认为“社会效益”是未来需要衡量的重要影响类型 | Research Professional News调查 |
| 70%的受访者认为科研的社会影响力难以衡量 | Research Professional News调查 |
| 各社会层面相关论文数量分布(2015-2025) | 报告图1:部分层面(如医疗)未发表相关论文的机构不足5%;部分层面(如法律与治理)超60%机构没有任何持续获得非学术界引用的论文 |
| 框架默认社会层面数 | 8个(扩展版PESTLE) |
| 指标组总数 | 11个(6个前瞻性+5个回顾性) |
四、战略启示(提炼自报告)
| 受众 | 核心启示 |
|---|---|
| 科研管理部门 | 社会影响力评估不应追求“单一得分”,而应通过结构化框架整合多元数据;前瞻性指标(如合作、可转移性)可用于早期识别潜在影响;社会影响力全貌可帮助识别战略优先级(强化优势还是改善短板) |
| 基金资助机构 | 评估科研影响力时,应平衡定量指标与定性案例研究;不同学科领域需要采用不同的评估方法;应承认时间滞后问题,允许前瞻性指标作为早期信号 |
| 高校/研究机构 | 影响力案例研究准备可从Web of Science Research Intelligence的“社会影响力报告”功能入手;可利用前瞻性指标识别未被发现的影响信号;应在机构层面而非项目层面进行社会影响力全貌比较 |
| 政策制定者 | 国家RAE可借鉴框架的分类体系与指标组结构;应支持建立高质量、可互操作的科研数据基础设施;应鼓励负责任评估原则(背景解读、规模规范化、同类比较) |
| 研究人员 | 理解科研成果如何映射至SDGs及社会层面;关注前瞻性指标(如合作、可转移性)作为未来影响的早期信号;在撰写影响力案例研究时,可利用框架提供的数据进行验证 |
五、总体评价
这是一份方法论严谨、实践导向、负责任意识突出的科研评估指南。 其核心价值在于:
系统性强:从框架设计原则、社会需求分类、指标组结构、背景解读到国家RAE应用,形成完整闭环
负责任意识突出:明确指出“不应简单汇总为单一指标”“绝对计数可能误导”“仅限机构层面比较”等重要限制
可操作性高:提供具体的指标组、数据源、可视化方法(社会影响力全貌)及案例研究支持
兼顾学术严谨与实用:映射方法在可扩展性与准确性之间取得平衡,统计方法直面数据稀疏现实
国际视野开阔:框架设计参考了英国REF、荷兰SEP、意大利VQR、中国香港RAE等多种国家评估机制
值得注意的定位:
本报告是科睿唯安ISI系列报告的一部分,其框架与Web of Science Research Intelligence平台深度绑定,具有一定的产品导向性
报告聚焦于“定量指标”,对定性评估方法(如专家评审、深度访谈)的讨论相对有限
对“归因困难”(特定影响由多个研究领域共同促成)的解决方案仍依赖传统方法(如通过引文分析追踪贡献),未提出突破性方法
报告未讨论开放科学、预印本、数据共享等新兴实践对社会影响力评估的影响
总体而言,这份指南适合科研管理部门、基金资助机构、高校研究评估办公室、政策制定者以及关注科研社会影响力的研究人员作为方法论参考。其核心启示可概括为:科研社会影响力评估不应追求“单一得分”的简化,而应拥抱“结构化框架”的复杂性。负责任评估需要平衡前瞻性与回顾性指标、定量与定性数据,并充分结合具体背景进行解读。社会影响力全貌不是“最终答案”,而是“探索起点”——帮助机构识别在哪些社会层面影响信号较强或较弱,从而做出战略优先级判断。最好的社会影响力评估不是告诉机构“你得了多少分”,而是帮助机构回答“我们在哪些方面真正产生了影响,以及下一步该往哪里走”。