Opinion Propagation Model Based on Temporal Networks
The development of mobile communication methods has brought about a change in the mode of communication, and online platforms provide a variety of interactive ways while publishing news in real time, and the interaction of netizens has also brought varying degrees of influence to the dissemination of news. Studying the time series network with timeliness and interaction mode can better restore the online propagation process and understand the propagation law. In this paper, the influence of interaction mode on communication is considered in combination with the SI1I2R model, and the time-series mode of communication is reflected by using the activity-driven network, and the public opinion propagation model based on the time-series network is proposed and analyzed theoretically. Then, combined with the model, the influence of time step on public opinion propagation is analyzed, and it is found that time step has a significant impact on propagation. Finally, the model data was fitted using real Weibo propagation data, and the statistical variables were compared with the classic SIR model to demonstrate the effectiveness of the model. The model proposed in this paper also provides a relevant theoretical basis for the analysis of online public opinion propagation.
Social Network
随着通讯交流方式的改变,线上社交媒体已经成为人们获得消息的主要渠道,社交平台的信息也体现出体量大、复杂性高、关联性高
由于舆情传播和传染病传播在传播方式上具有相似性,现有的大部分舆情模型也会在经典感染病模型的基础上,结合实际舆情传播的特点开展相关研究,通过完善传播机制达到刻画传播的目的。文献
与此同时,网络作为消息传播的载体其不同结构和性质也会对消息传播带来不同程度的影响。目前,大部分舆情研究都集中在静态网络中,相关实验的网络也集中在WS小世界网络
考虑到现实网络的动态性和平台互动对舆情传播的影响,本文提出了一个基于时序网络的舆情传播模型,以此分析线上平台的舆情传播特点,并对该模型进行理论推导得出对应的传播公式和阈值。接着,对模型的相关参数进行分析还运用真实接触网络分析不同时间步长对传播的影响。最后,本文选取真实微博传播数据进行仿真实验并与经典的SIR模型进行对比证明模型的有效性。
如今,以微博、微信等社交媒体主导的线上平台,在提供发布消息渠道的同时,也会提供多种互动方式,如点赞、评论、转发等。互动方式能为消息带来热度并使其拥有更多的用户关注,更广泛的传播范围。因此在传播过程中加入对互动方式的刻画能好地描述传播过程。本文结合文献
符号 |
定义 |
解释 |
|
未知者 |
不知晓信息的用户 |
|
轻度传播者 |
对信息进行单种形式互动的用户 |
|
重度传播者 |
对信息进行多种形式互动或者影响力大的用户 |
|
免疫者 |
对信息失去传播兴趣的用户 |
|
传播者 |
对信息进行互动的用户且不区分对信息的传播程度 |
|
轻度传播率 |
用户接触传播者后转变为轻度传播者的概率 |
|
重度传播率 |
用户接触重度传播者后转变为轻度传播者的概率 |
|
轻度免疫率 |
轻度传播者对消息失去兴趣转变为免疫者的概率 |
|
重度免疫率 |
重度传播者对消息失去兴趣转变为免疫者的概率 |
|
转换率 |
轻度传播者转变为重度传播者的概率 |
|
直接免疫率 |
用户直接转变为免疫者的概率 |
在传播时,对于未知者
,其可能会受到轻度传播者
的影响,从而参与信息互动变为轻度传播者
,也有可能受到重度传播者
的影响变为轻度传播者
或重度传播者
。对于轻度传播者
,其可能经过多次互动后转变为重度传播者
。在整个传播过程中,未知者
、轻度传播者
、重度传播者
都有一定概率对消息失去兴趣从而直接转变为免疫者
。
接着,为了弥补上述传播过程在描述动态性方面的不足,本文再结合活动驱动网络
结合现有研究和本文研究的传播特点可知,在较短时间内平台用户的变化并不明显,因此本文假设整个网络中节点个数为 且传播过程中总数不变展开研究。定义节点 ,表示 时刻节点 处在 状态的概率,在计算时 也可能会被记为 ,表示该节点为不区分轻度、重度的传播者。由活动驱动网络定义可知,节点产生连接的方式主要有两种,节点自身被激活或者与激活节点连接。重度传播者 在影响其他节点转变为传播者 时,该节点会以 的概率变为轻度传播者 ,以 的概率变为重度传播者 ,且 。
传播过程中,未知者 转变为轻度传播者 的概率为:
其中, 表示在 状态 节点激活后,与 或 状态节点连接的概率,如下:
同理, 表示 状态的 节点与被激活 或 状态节点连接的概率,如下:
类似地,由于传播过程中,只有受到重度传播者 的影响,未知者 才会转变为重度传播者 ,结合未知者 转变为轻度传播者 的概率可得,未知者 转变为重度传播者 的概率如下:
传播过程中,未知者 接触可能会使其转变轻度传播者 的节点后,仍保持未知状态的概率为:
其中 表示了未知者 对消息有兴趣但未接触到传播者 从而保持自身状态不变的概率,公式中对应变量满足:
随着时间的推移,网络最后会到达平衡状态,可以得到传播状态方程满足:
当传播到达平稳状态后,传播阈值与传播者 相关且未知者 数量较少并满足 ,结合状态转换方可得:
对于整个网络,平均传播概率为 平均免疫概率为 ,结合上式可得:
对上式进行累加求和,可得:
其中, 表示网络中所有节点活跃值 的平均。对于 时刻的免疫者 ,参考上式的求解方法可得:
其中 。
重新将 与 的对应公式写成与传播者 相关的矩阵形式可得:
当有谣言传播时 。网络处于稳态时,可以得到 ,对于免疫者 相关参数满足:
Figure 2. Public opinion propagation process in (a) static networks (b) temporal networks
图2. (a) 静态网络(b) 时序网络情况下的舆情传播过程
在传播中,平台整体活跃程度也会影响其内部信息的传播效果和用户的状态转变,这一影响因素由缩放因子
体现。模型的缩放因子
值越大,网络节点的活跃值
也会因此被放大,被激活的节点数和概率也会因此增加。
相比平台活跃程度对传播的影响,作为影响用户激活的与否的活跃值对传播的影响更直接,这一影响因素由幂律分布函数
对应的指数
来体现。当
的值越大,函数分布的尾部变薄,极端值出现的概率降低且分布的峰值变高且更窄,函数离散程度减小。体现在模型中,其对应表现就是用户的活跃程度会变的更集中,事件讨论的极端者会减少。
作为重度传播者的变化来源之一,轻度传播者在传播者中的占比也相对较高,其数量不仅影响着消息的传播还影响着重度传播者的数量。
由于轻度、重度传播者具有不同传播能力,用户的状态转变容易程度也会影响传播。
由时序网络定义可知,时序网络的结构变化由不同时刻网络节点的连接而产生。在社交网络中,以舆情信息为核心的相关传播信息统计,也会因为时间步长的不同而带来不同结果,如某条微博在整个传播周期的转发量是不变的,但传播过程中以天为单位和以小时为单位的过程统计会存在差异。文献
网络名称 |
LH10 |
InVS15 |
InVS13 |
Theirs13 |
节点总数 |
81 |
232 |
100 |
180 |
静态状态平均度 |
34 |
144 |
78 |
25 |
接触持续小时 |
72 |
276 |
276 |
202 |
时刻(秒) |
节点1 |
节点2 |
0 |
1305 |
1320 |
0 |
1305 |
1391 |
… |
… |
… |
259,180 |
1391 |
1460 |
259,180 |
1547 |
1784 |
结合以上定义,本文分别选取时间步长为1小时、2小时、6小时和整个传播周期72小时作为时间步长,对于接触持续时间大于72小时的网络,则以0到72小时作为整个实验周期。基于前文定义的传播过程,设置初始感染节点为总结点数的1% (不满1个节点的情况下,初始感染节点个数为1)并且规定
单次实验进行50次取平均值,考虑不同轻度传播概率
和对应轻度感染者密度
的峰值,得到如下实验结果
从实验结果中可以发现,在控制轻度传播概率 不变的情况下,轻度传播者 密度峰值会随着时间步长的增加而增加,因为时间步长越长对应的网络连通程度就会变高,受到消息影响的用户数量就会越多。再结合网络的静态特征可得,网络的平均度越高其对应的4条轻度传播者 的峰值曲线在图中的分布会相对紧密,其中InVS15和InVS13与LH10和Theirs13相比接触更紧密。以上实验结果表明,在研究传播过程时,对网络使用不同时间步长刻画会影响传播过程中的网络数据的表示,时间步长越短传播过程的记录效果越符合实际。
微博作为网民获得消息的重要平台,在发布、传播信息的同时也影响着人们的正常生活,本文运用python3.10和微博大数据平台对微博平台2022年12月期间所有带有“低碳生活”的微博内容进行分析实验,其中数据包含:微博id、用户id、用户昵称、微博正文、话题、转发数、评论数、点赞数和发布工具。结合模型构建部分对模型相关参数定义,在该部分实验将整个传播周期内不重复的用户数定义为总用户数,将发布博文的转发数、评论数、点赞数之和大于1的内容创作者即对应的微博用户作为重度传播者。并且随着时间推移如果有用户多次发布话题内容,则代表轻度传播者到重度传播者的转变。由以上定义和相关转变概率计算可得“低碳生活”话题下的时序网络舆情传播模型的相关参数为: ,选择12月中10天进行拟合。以上参数的转变概率的计算为轻度、重度用户占一天总用户数比例的平均值,激活值的计算,节点激活值的分布则是通过微博大数据平台对应用户的传播情况拟合而得。
图9. 时序状态下(a) SI1I2R模型拟合图(b)SIR模型拟合图
如
其中
和
分别表示同一时刻真实值和拟合值的对应值,很明显,当RMSE越小,表示真实值与拟合值的误差越小,模型的有效性就会更高。通过公式计算可以得到如下结果,如
基于时序网络的舆情传播模型 |
时序情况下的SIR模型 |
0.00976 |
0.01571 |
随着消息传播方式的改变,线上平台中的相关互动方式也在很大程度上影响信息的传播,进而影响人们的现实生活。本文运用时序网络结合舆情传播实际,刻画了平台中用户不同的互动情况对舆情传播的影响,并区分了舆情传播过程中的重度、轻度传播者。提出了基于时序网络的舆情传播模型,并进行模型定义的说明和模型推导的完善。接着,结合模型的定义进行实验模型仿真,比较静态网络和动态网络在刻画传播过程中的差异,并分析传播过程中模型不同参数对舆情传播的影响,给出了对应的实际建议。在现实中,可以从平台活跃程度、平台重度传播用户特点和平台不同用户的转换情况等方面入手,实现突发情况下更高效的舆情控制。除此以外,本文结合真实接触网络分析不同记录时间步长对舆情传播的影响,发现网络静态度越小不同时间步长的记录结果差异就越大。因此,在时序情况下,选择合适的时间步长对网络传播效果的记录是很重要的。最后,本文借用真实微博传播数据结合模型参数进行拟合,并与经典SIR模型进行对比证明模型的有效性,说明在时序场景下的模型能帮助人们更好地模拟传播过程,并结合前文参数分析采取有效的舆情控制措施。
本文的工作受到了2020年度国家社会科学基金重大项目“我国青少年网络舆情的大数据预警体系与引导机制研究(20&ZD013)和北京邮电大学教育教学改革项目(2024YB38)的资助。