本项创新技术涉及假新闻识别技术、系统、工具及存储介质,属于信息检测技术领域,旨在解决现有技术中评论多样性不足和对新闻内容理解不全面的问题。该假新闻识别技术包括:
背景技术
随着互联网的发展,对虚假新闻的检查变得至关重要;虚假新闻是指与客观事实不符的、故意捏造的虚假消息,虚假新闻检测是指根据新闻内容或者与新闻内容相关的其他信息判断新闻真实或者虚假的二分类任务。
现有虚假新闻检测方法通常利用真实用户发表的评论,其数量、覆盖面都很有限,忽视了对未发表评论用户的立场、观点、情感的获取和分析,现有的检测方法主要包括两类:基于新闻内容的方法和基于社交上下文的方法;其中,基于新闻内容的方法通过挖掘新闻内容相关的特征,例如风格特征、语义特征、情感特征,来判断新闻的真实性,然而,由于虚假新闻往往通过模仿真实新闻逃避检测,仅仅利用新闻内容会限制虚假新闻的检测效果;基于社交上下文的方法利用了新闻内容以外更加丰富的信息,例如用户评论、传播路径等,因此具有更好的检测效果;用户评论是一种被广泛使用且已被证明有效的社交上下文信息,因为用户评论中具有的立场、观点、情感等信息可作为帮助理解对应新闻内容,辨别其真实性的有效反馈信号。然而,由于推荐机制导致的曝光偏差、用户的个人发表意愿等因素,这些评论往往是有限的,尤其是在新闻发布早期。因此,现有的虚假新闻检测方法存在评论不够多样性,对新闻内容的理解不够全面等技术问题,进一步影响检测的准确性。
实现思路