数据集

假新闻识别数据集FNC-1-FakeNewsChallenge-hnganhtrn

数据来源：互联网公开数据

标签：假新闻，新闻，文本分析，自然语言处理，机器学习，情感分析，信息检索，文本分类

数据概述：该数据集来自假新闻挑战赛（Fake News Challenge，FNC-1），旨在促进假新闻的自动检测和识别。主要特征如下：时间跨度：数据记录的时间范围为挑战赛期间，数据发布时间集中在特定年份。地理范围：数据主要来源于英语新闻文章，涵盖全球范围内的各种新闻主题。数据维度：数据集包括新闻标题，文章正文，以及标题与正文之间的关系判断（支持，反对，评论或无关），以及文章之间的关联关系。数据格式：数据提供为CSV格式，方便进行文本分析和处理。来源信息：数据来源于FNC-1挑战赛，已进行标注和整理。该数据集适合用于自然语言处理，文本分类，信息检索和机器学习等领域的研究和应用，特别是在假新闻检测，新闻真实性判断等技术任务中具有重要价值。

数据用途概述：该数据集具有广泛的应用潜力，特别适用于以下场景：研究与分析：适用于假新闻检测，文本分类，情感分析等学术研究，如新闻文章的真伪判断，传播模式分析等。行业应用：可以为新闻媒体，社交平台，搜索引擎等提供数据支持，特别是在内容审核，信息过滤等方面。决策支持：支持信息真实性评估，帮助用户识别虚假信息和误导性内容。教育和培训：作为自然语言处理和机器学习课程的辅助材料，帮助学生和研究人员深入理解文本分类，信息检索及相关分析方法。此数据集特别适合用于探索假新闻的识别方法，帮助用户实现假新闻检测，新闻真实性判断等目标，为构建更可靠的信息环境提供技术支持。

数据与资源

假新闻识别数据集FNC-1-FakeNewsChallenge-hnganhtrn.zipZIP
6.78 MiB

下载

附加信息

字段	值
版本	1
数据集大小	6.78 MiB
最后更新	2025年4月24日
创建于	2025年4月24日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。