Home>Schools

  • Complex
  • Title
  • Author
  • Keyword
  • Abstract
  • Scholars
Search

[学位]

基于神经网络和迁移学习的网络事件热度预测方法研究

Share
Edit Delete Claim

Author:

韩勖越 (韩勖越.)

Indexed by:

学位论文库

Abstract:

随着互联网的普及和信息技术不断发展,网络事件在许多领域产生重要影响,引起新闻媒体、网民、乃至整个社会的关注。研究网络事件热度的演化过程,预测网络事件的热度,不仅有助于网民从全局把握网络事件的发展,而且能够为事件的管理决策提供必要的数据支持。目前,有关网络事件热度预测的研究工作有限,缺乏对网络媒体包含的与网络事件相关的新闻报道和用户评论数据的分析与研究,同时,现有的预测方法存在时效性弱、数据集不足的问题。本文以百度新闻以及新浪新闻的网络事件新闻报道和用户评论为研究对象,分析网络事件发展趋势演化过程,利用网络事件之间的相似性,分别从网络事件的新闻报道量、网络事件的新闻报道用户评论量以及网络事件的用户评论量三个方面对网络事件的热度进行预测。具体工作如下:
首先,分析网络事件新闻报道及用户评论的特征。设计并开发了百度新闻和新浪新闻的爬虫程序,在此基础上对网络事件新闻报道和网络事件用户评论的特征进行分析。实验结果表明,不同的网络事件发展生命周期不同、演化曲线有较大区别,大部分网络事件的新闻报道和用户评论都具有爆发特性,网络事件新闻报道发布的时间差与用户评论数不相关。
然后,基于网络事件的新闻报道量预测网络事件热度。引入迁移学习策略,利用网络事件之间的相似性,借助事件热度的预测误差,并考虑事件之间热度峰值的归一化,提出TEELM和TPELM两种方法对网络事件新闻热度进行预测。实验结果表明,在极限学习机的基础上引入迁移学习策略,预测结果的准确度有明显提升。该模型的参数设置少、学习速度快且对数据的适应能力强,能够对网络事件的新闻报道热度进行即时预测,并解决训练集数据不足的问题。
接着,基于事件新闻报道的用户评论量预测网络事件热度。统计每个网络事件的每篇新闻报道的评论数据,按照不同的等待时间建立线性归回预测模型和MLP神经网络预测模型。实验结果表明,不同时间段发布的新闻报道其预测模型的性能有一定的区别,分时段建立预测模型有一定的应用价值,等待时间较短时,使用MLP神经网络相较线性回归模型预测结果更好,当等待时间较长时,MLP神经网络与线性回归模型的预测结果相差不大。
最后,基于网络事件的用户评论量预测网络事件热度。对每个网络事件发生后每小时的评论量,分别选择RNN、LSTM、GRU网络建立预测模型,对比训练集占数据集比例不同对网络事件的评论量时序数据建立预测模型的性能影响。提出了一种结合深度学习和迁移学习策略的网络事件热度预测模型。实验结果表明,在深度学习的基础上引入迁移学习策略,能够准确预测对网络事件用户评论量的趋势和评论量的峰值位置,当辅助训练集较小时,对预测结果有很大改善,模型的性能有较大提升,在实际应用中有一定的价值。

Keyword:

极限学习机 迁移学习 热度预测 深度学习 网络事件

Author Community:

  • [ 1 ] 西安交通大学电子与信息工程学院

Reprint Author's Address:

Show more details

Basic Info :

Degree: 硕士

Mentor: 彭勤科

Year: 2018

Language: Other

Cited Count:

WoS CC Cited Count: 0

30 Days PV: 17

FAQ| About| Online/Total:601/217512957
Address:XI'AN JIAOTONG UNIVERSITY LIBRARY(No.28, Xianning West Road, Xi'an, Shaanxi Post Code:710049) Contact Us:029-82667865
Copyright:XI'AN JIAOTONG UNIVERSITY LIBRARY Technical Support:Beijing Aegean Software Co., Ltd.