本文基于CiteSpace软件的知识图谱可视化功能,对CNKI数据库2002~2022年间关于中国数据新闻研究的CSSCI期刊文献进行文献计量分析,结果显示:2013年前,数据新闻研究产出非常有限,此后才经历“井喷–下滑–回升”等过程;在学术合作与共建上,该领域存在较为松散且低密度的学术合作关系。研究主要内容则聚焦基础理论、实践应用、伦理风险与规范发展、人才培养与数据新闻教育等方面。研究领域延展有限,多涉及“大数据”、“可视化”等议题。但面对新的数字信息环境,“可供性”生态学视角正在被引入数据新闻的研究领域,为其提供了新型视角及创新性的研究路径。 Based on the knowledge graph visualization function of CiteSpace software, this paper conducts a bibliometric analysis of CSSCI journal literature on data journalism research in China between 2002 and 2022 in the CNKI database, and the results show that: the output of data journalism research was very limited before 2013, and then went through the process of “blow-out-decline-rebound”; in terms of academic cooperation and co-construction, there are loose and low-density academic partnerships in this field. The main content of the research focuses on basic theory, practical application, ethical risk and normative development, talent training and data journalism education. The extension of the research field is limited, mostly involving topics such as “big data” and “visualization”. However, in the face of the new digital information environment, the ecological perspective of “availability” is being introduced into the research field of data journalism, providing a new perspective and innovative research path.
本文基于CiteSpace软件的知识图谱可视化功能,对CNKI数据库2002~2022年间关于中国数据新闻研究的CSSCI期刊文献进行文献计量分析,结果显示:2013年前,数据新闻研究产出非常有限,此后才经历“井喷–下滑–回升”等过程;在学术合作与共建上,该领域存在较为松散且低密度的学术合作关系。研究主要内容则聚焦基础理论、实践应用、伦理风险与规范发展、人才培养与数据新闻教育等方面。研究领域延展有限,多涉及“大数据”、“可视化”等议题。但面对新的数字信息环境,“可供性”生态学视角正在被引入数据新闻的研究领域,为其提供了新型视角及创新性的研究路径。
数据新闻,文献计量,CiteSpace,知识图谱
—A Bibliometric Analysis Based on CNKI (2002~2022)
Kaili Chen
School of Journalism & Communication, Jinan University, Guangzhou Guangdong
Received: Oct. 27th, 2023; accepted: Dec. 3rd, 2023; published: Dec. 12th, 2023
Based on the knowledge graph visualization function of CiteSpace software, this paper conducts a bibliometric analysis of CSSCI journal literature on data journalism research in China between 2002 and 2022 in the CNKI database, and the results show that: the output of data journalism research was very limited before 2013, and then went through the process of “blowout-decline-rebound”; in terms of academic cooperation and co-construction, there are loose and low-density academic partnerships in this field. The main content of the research focuses on basic theory, practical application, ethical risk and normative development, talent training and data journalism education. The extension of the research field is limited, mostly involving topics such as “big data” and “visualization”. However, in the face of the new digital information environment, the ecological perspective of “availability” is being introduced into the research field of data journalism, providing a new perspective and innovative research path.
Keywords:Data Journalism, Bibliometrics, CiteSpace, Knowledge Graphs
Copyright © 2023 by author(s) and
This work is licensed under the Creative Commons Attribution International License (CC BY 4.0).
http://creativecommons.org/licenses/by/4.0/
近年来,随着大数据的迅猛发展,“数据新闻”这一概念逐渐流行于各实践领域。特别是在新闻传播行业,大数据被视为新闻创作和信息采集的关键资源。早在2012年英国《卫报》就创作出名为《伦敦骚乱中的谣言》的数据新闻作品,并赢得国际首届“新闻数据奖”的荣誉。不仅如此,从1997年开始,国外学术界便开始兴起了关于数据新闻的学理求证 [
通过对CNKI数据库的初步检索发现,CSSCI期刊收录的关于数据新闻研究文献最早是在2002年,且国内此前已有文献对中外数据新闻的研究进行文献计量分析,样本时间多截止至2018年,但鉴于知识的演进会随着时间及技术的进步而迭代更新,因此本文以CNKI为数据源,以CSSCI期刊收录的与数据新闻相关的628篇文献为研究对象,运用CiteSpace探究数据新闻研究的发展脉络、知识图谱与前沿热点,旨在为深化数据新闻研究、实践应用等方面提供有益参考。
科学知识图谱是以知识域为对象显示科学知识的发展进程与结构的一种图像 [
为保证文献的代表性,本文以“数据新闻”或“数据驱动新闻”或“数字新闻”为主题、以2002~2022年为时间范围、以CSSCI期刊为数据源进行高级检索,共获得628篇有效文献作为样本数据来源。
本部分从数据新闻研究的时间分布、作者及机构等方面描绘国内数据新闻研究的基础知识图景。
对于每一研究领域而言,文献量统计图能够明确反映并直观衡量其科研发展趋势以及研究热度变化。国内数据新闻发文量如图1所示。
图1. 国内数据新闻研究领域年度发文量
由图1可知,在时间维度上,国内数据新闻研究的总体发文趋势呈现阶段性变化,经历了零星出现–爆发式增长–下滑回落–快速回升。在2013年之前,国内关于数据新闻的核心科研成果极少,仅有零星发表,其中2002、2006年各1篇,2011和2013都仅有3篇,除此之外其他年份均无发表相关成果。但2013年至2017年间,研究成果出现井喷式增长,平均每年有60篇文章发表,其中缘由可结合业界实践:2012年,我国首个数据新闻实践平台成功上线,次年几名中国香港学生将《数据新闻手册》翻译出中文版,并致力于搭建中国的数据新闻网 [
为了发现数据新闻领域研究的中坚力量,探寻该领域的核心作者群体,本文将CiteSpace的节点类型设置为“Author”,将时间切片设为1,TopN的阈值设置为30,最终绘制出了发文作者合作共现图谱(见图2)。
图中,发文频次越高的作者,其节点越大,而节点之间的连线则代表合作关系 [
图2. 国内数据新闻研究领域作者合作共现图谱
从作者合作网络看,国内数据新闻研究领域各研究者之间相互合作形成了若干研究团队,其中以常江为中心的研究团队规模最大,共有15人,杨奇光、田浩、喻国明、杨惠涵等学者也分别形成了规模4~6人不等的合作团队。此外,在核心作者群之外还存在大量独立的发文作者,他们之间合作密度较低。纵观来看,国内不少学者围绕数据新闻展开了具体研究,但学术共同体的合作关系较为松散。
通过CiteSpace软件Institution模块可生成国内数据新闻研究机构合作关系图谱(见图3),从而进一步分析研究机构的发文量及其合作关系。
据图3可知,研究机构图谱中共有408个节点,210条连线,网络密度为0.0025,可知在合作网络上,机构间的跨校合作氛围较好,但合作密度较低。具体而言,中心度较高的发文机构分别有中国人民大学新闻学院及其新闻与社会发展研究中心、中国传媒大学、北京师范大学新闻传播学院等机构,表明这些机构与其他机构进行科研合作的频次较高,是机构合作网络中的核心节点。
其次,从发文量上看,表1统计了国内数据新闻研究领域发文量前10的机构,据此可以看出,国内数据新闻研究依然以老牌院校为主导,其中中国人民大学新闻学院及其新闻与社会发展研究中心、清华大学新闻学院等单位是研究数据新闻的主力军。其次,深圳大学在数据新闻领域的研究实力不可小觑,其传播学院及媒体融合与国际传播研究中心的发文量分别位列第3、第6,科研成果显著。
图3. 国内数据新闻研究领域研究机构合作共现图谱
排名 | CSSCI样本数据 | |
---|---|---|
机构 | 发文量/篇 | |
1 | 中国人民大学新闻学院 | 51 |
2 | 清华大学新闻与传播学院 | 41 |
3 | 深圳大学传播学院 | 34 |
4 | 中国人民大学新闻与社会发展研究中心 | 31 |
5 | 复旦大学新闻学院 | 21 |
6 | 深圳大学媒体融合与国际传播研究中心 | 16 |
7 | 南京大学新闻传播学院 | 15 |
8 | 华南理工大学新闻与传播学院 | 14 |
9 | 暨南大学新闻与传播学院 | 13 |
10 | 中国传媒大学新闻学院 | 13 |
表1. 国内数据新闻研究核心机构发文量排名
通过CiteSpace软件可提取21年间国内数据新闻研究的高频和高中心性关键词,据此看出研究的核心领域及主题之间的相关性,继而了解国内数据新闻研究的总体特点。
根据图4及表2,从关键词频次上看,可知除了“数据新闻/数字新闻”本体研究外,国内数据新闻研究热点领域主要集中在“大数据”、“可视化”、“新闻生产”、及“新闻业”等领域。其次,从关键词的中介中心性来看,“数据新闻”的中心性(0.67)最大(见表2),表示以数据新闻为中心的研究数量最具优势,与之相关联的有媒体融合、《卫报》、新闻生产等内容。值得注意的是,图4中的分支集聚圈数量不多且非常小。因此总体而言,21年间国内数据新闻的研究领域延展有限,尚停留在“大数据”“可视化”阶段,且相关领域之间的研究关联性与承接性不足,研究内容松散、孤立等特征显著,研究系统性有待完善。
图4. 国内数据新闻研究领域关键词共现图谱
频次排名 | 关键词 | 初现年份 | 频次 | 中心性排名 | 关键词 | 初现年份 | 中心性 |
---|---|---|---|---|---|---|---|
1 | 数据新闻 | 2006 | 257 | 1 | 数据新闻 | 2006 | 0.67 |
2 | 大数据 | 2013 | 22 | 2 | 新闻业 | 2011 | 0.35 |
3 | 数字新闻 | 2002 | 79 | 3 | 大数据 | 2013 | 0.33 |
4 | 可视化 | 2013 | 72 | 4 | 数字新闻 | 2002 | 0.33 |
5 | 新闻生产 | 2013 | 41 | 5 | 可视化 | 2013 | 0.27 |
6 | 新闻业 | 2011 | 30 | 6 | 新闻生产 | 2013 | 0.25 |
7 | 媒体融合 | 2015 | 8 | 7 | 《卫报》 | 2013 | 0.12 |
8 | 新闻传播 | 2014 | 18 | 8 | 媒体融合 | 2015 | 0.06 |
9 | 新闻价值 | 2011 | 13 | 9 | 新闻传播 | 2014 | 0.06 |
10 | 新闻学 | 2020 | 8 | 10 | 新闻叙事 | 2016 | 0.06 |
11 | 新闻创新 | 2020 | 12 | 11 | 新闻价值 | 2011 | 0.04 |
12 | 客观性 | 2013 | 9 | 12 | 客观性 | 2013 | 0.04 |
13 | 新闻叙事 | 2016 | 8 | 13 | 新闻理论 | 2020 | 0.04 |
14 | 人工智能 | 2018 | 4 | 14 | 主流媒体 | 2015 | 0.04 |
15 | 人才培养 | 2016 | 3 | 15 | 新闻编辑 | 2013 | 0.04 |
16 | 社交媒体 | 2012 | 2 | 16 | 舆论引导 | 2015 | 0.04 |
17 | 《卫报》 | 2013 | 5 | 17 | 算法 | 2017 | 0.03 |
18 | 新闻理论 | 2020 | 11 | 18 | 新闻学 | 2020 | 0.02 |
19 | 新闻生态 | 2021 | 8 | 19 | 人才培养 | 2016 | 0.02 |
20 | 新媒体 | 2012 | 7 | 20 | 新闻生态 | 2021 | 0.02 |
表2. 数据新闻高频及高中心性关键词
通过CiteSpace的LLR算法提取关键词,生成高频关键词聚类图(见图5),其中Modularity = 0.6184 > 0.3, Mean Silhouette = 0.807 > 0.5,说明聚类情况良好 [
图5. 数据新闻关键词聚类图谱
聚类号 | 节点数 | 轮廓值 | 平均年份 | 聚类名称 | 相关关键词 |
---|---|---|---|---|---|
0 | 25 | 0.862 | 2014 | 数据新闻 | 数字新闻、新闻生态、新闻理论、媒体融合 |
1 | 23 | 0.984 | 2014 | 可视化 | 信息图表、交互性、故事化、新闻叙事 |
2 | 23 | 0.817 | 2014 | 数字新闻 | 人才培养、新闻伦理、新闻业、数字新闻学 |
3 | 21 | 0.739 | 2015 | 大数据 | 传统媒体、算法、人工智能、新闻媒体 |
4 | 19 | 0.741 | 2015 | 新闻生产 | 客观性、新闻价值、情感、物质性 |
5 | 17 | 0.99 | 2011 | 新闻业 | 数据新闻、新闻网站、美国媒体、大数据新闻 |
表3. 关键词共现网络13个自动聚类
接着,本文基于前人研究和上述关键词聚类图谱,将数字新闻研究内容分为以下几个板块,以期理顺国内数据新闻研究的学术核心版图。
这类研究主要包括聚类图中的#0、#1、#2、#3,论文内容主要关注数据新闻的内涵与特征、数据新闻的功能与价值的学理性探究等。
一是关于数据新闻的内涵与特征,国内研究对数据新闻的定义经历一个“概念化转向”的过程。2020年以前,“数据”、“可视化”等概念是学界对数据新闻的理解“落脚点”,前者界定数据新闻是“数据经过收集、统计、分析以及可视化处理之后呈现在新闻报道中” [
二是数据新闻的价值及功能探析。学术界广泛认同,大数据正在积极而深刻地影响新闻业,拓展新闻报道的功能和价值。从微观层面来看,数据新闻能够在各方面以其数据优势赋能新闻业的信息传播,譬如在叙事效果上,大数据的可视化手段可以加深新闻叙事的深度及成效 [
这类研究出现于图中的聚类#5,其中案例分析、比较分析、文本分析等研究方法较受青睐。论文内容主要由以下三个部分构成:
(1) 对国外数据新闻实践研究
国内学者多以案例分析为主,聚焦国外代表性媒体在不同新闻情境下的生产实践,继而总结国外数据新闻实践经验。如在突发事件新闻中,方洁等指出,在弗格森枪击案报道中,美国媒体整合多种渠道快速获取数据、结合对背景信息来寻找报道角度、在平时做好数据资料储备等新闻报道技巧给国内媒体以启示 [
(2) 对国内数据新闻本土化研究
在本土化研究中,学者集中于国内代表性的新闻机构,从内容创作、新闻融合、可视化设计等方面对其数据新闻实践进行经验性总结。内容创作层面,周善以我国网易、新浪、腾讯和搜狐四大网络新闻门户网站的数据新闻为例,分析了其选题构成、数据挖掘、可视化表达等方面的特点及不足,并提出了国内网站媒体在专业生产内容方面的可循之途 [
(3) 对比中外数据新闻实践研究
在对比研究方面,主要是借鉴国外优秀的发展经验,以探讨如何完善中国的数据新闻产业的未来发展。刘义昆等探讨了数据新闻的中国实践与中外差异,并反思国内数据新闻生产的局限 [
这类研究主要在图中的聚类#2,论文内容主要探究采集及使用数据时的真实性、侵权等问题,同时探讨在未来如何处理各类数据,保障数据新闻生产的正确性及合理性。王海滨等指出目前数据新闻存在算法、隐私及应用风险,需从坚守新闻理念、风险预防、完善立法、行业监管等多个角度来进行实践规范 [
图中的#2主要提及这类研究,在人才培育上,国内学者立足数据新闻实践要求,结合国外人才培育经验,对新闻从业者专业水平及数据素养的培育路径进行探究并提供参考。刘银娣在考察了欧美数据新闻人才培养方式后,为大数据环境下我国新闻人才培养模式的转型提供借鉴和参考 [
为了更形象地展现国内数据新闻研究领域的演进过程与趋势,本文通过CiteSpace软件绘制出了该领域的关键词聚类时间线视图(见图6)。
图6. 数据新闻关键词聚类时间线图谱
前文已提及,由于在2013年之前国内对数据新闻研究文献资源稀缺,仅有1~3篇的零星发表,不足构成学科发展的起始点,故国内数据新闻的演变应从2013年正式开始的。结合图6、图7的内容,本文对数据新闻的研究趋势阶段进行如下划分:
第一阶段:2013~2014。作为我国数据新闻领域研究的初创期,学界从介绍研究缘起(如精确新闻等)到应用条件(如大数据)再到呈现特征(如信息图表),接着转向国外的数据新闻实践(《卫报》)到呈现我国数据新闻的发展状况(新闻编辑),研究的广度和深度开始增加,并井喷出丰富的研究成果。
第二阶段:2015~2020。一方面,国家积极推进媒体融合发展(见图6主流媒体、媒体融合、新媒体等关键词),加之大数据技术的不断成熟,因此在这一阶段学者将研究重心聚焦于我国数据新闻呈现、内容生产和流程的变革(如新闻叙事、可视化)。另一方面,算法、人工智能在传媒行业的持续渗透也牵引着国内研究视角的转变,即从本体相关研究转向新伦理议题的探讨,与此同时,数据新闻引发的新闻业态变革也对新时代的新闻从业者产生新的专业技能和职业素养要求,因此人才培养方式成为该时期的紧迫性命题。
第三阶段:2021~2022。数字技术的深化深刻影响着新闻业态和实践经验,对新闻学的发展带来了新挑战,并催生新闻学的研究新范式 [
图7. 数据新闻突现词图谱
本文基于CiteSpace以CNKI数据库中有关数据新闻的CSSCI文献为样本,分析了数据新闻研究现状、知识图景、研究前沿等内容,总结如下结论:
(1) 自数据新闻提出和运用以来,引起行业和学术领域的广泛关注,近年来研究热情高涨,总体发展态势良好。在文献量的时间分布上,经历了零星发表–井喷式增长–下滑回落–快速回升的阶段。
(2) 从学术合作与共建的角度看,部分机构的跨校协作氛围良好,但数据新闻学术场域的合作团队比较松散,研究成果多由个人发表,未来数据新闻领域的学术合作尚有一定的发展空间。
(3) 通过文献关键词的共现分析,发现目前该学科的研究领域延展有限,除了“数据新闻/数字新闻”本体研究外,尚聚焦在“大数据”、“可视化”,相关研究之间关联性和承接性不足,研究内容相对松散、孤立。因此未来研究可进一步完善系统性的研究体系,并朝向现实需要,寻找数字新闻学理论的新发展方向,丰富用于解释数字技术环境下的新闻生产与接受实践模式的新路径。
(4) 通过文献关键词的聚类分析,数据新闻的学术版图主要包含四个方面内容:基础理论研究、实践应用研究、伦理风险与规范发展、人才培养与数据新闻教育。基于关键词聚类再分析所展现的研究时区图发现,面对新的时代特点和实践要求,数据新闻的研究也不断深化,一些新型视角如“可供性”正在被引入数据新闻的研究领域。
最后,在文献计量分析中,数据收集至关重要,但本研究的检索范围仅限于国内知网数据库的CSSCI期刊所收录的相关文献,尽管数据在学术领域而言有足够的代表性,但对业界经验的兼顾难以充分实现,因此仍存在进一步优化的可能性,有待后续研究进一步扩充数据样本来全面总结该领域的学术成果。
陈凯莉. 国内数据新闻研究的知识图景与演进 Knowledge Landscape and Evolution of Domestic Data Journalism Research[J]. 新闻传播科学, 2023, 11(04): 908-919. https://doi.org/10.12677/JC.2023.114134
https://doi.org/10.1002/asi.20317
https://m.gmw.cn/baijia/2022-11/29/36195819.html, 2022-11-29.