数据集

新闻真伪鉴别-印度新闻文章数据集2023-2024

新闻真伪鉴别-印度新闻文章数据集2023-2024 数据来源：互联网公开数据标签：假新闻,真新闻,新闻分析,文本分类,自然语言处理,印度,新闻报道,数据挖掘,信息可靠性数据概述：本数据集旨在用于新闻真伪鉴别研究，收录了来自印度不同新闻来源的文章。数据集包含两类文章：一类来自如《印度时报》（Times of India）等被广泛认为是可靠的新闻来源，另一类来自如OpIndia等存在虚假信息或偏颇报道风险的新闻来源。数据涵盖2023年至2024年期间发布的新闻文章，每篇文章都包含了标题、发布日期、文章内容、来源网站URL等关键信息。数据集的设计目标是提供一个平衡的、可用于训练和评估文本分类模型的资源，以帮助研究人员开发和测试识别假新闻的技术。

数据用途概述：该数据集主要用于以下几个方面： 1. 构建和评估假新闻检测模型：可用于训练机器学习模型，以自动识别新闻文章的真伪。 2. 新闻内容分析研究：研究不同来源新闻报道的风格、主题和语言特征。 3. 自然语言处理应用：进行文本分类、情感分析、话题建模等自然语言处理任务。 4. 教育与研究：为学生和研究人员提供一个真实的、可用于实践的案例，帮助他们理解假新闻的传播机制和应对策略。 5. 信息可靠性研究：探索新闻来源的可信度与文章内容之间的关系，有助于提高公众的信息素养。

数据与资源

新闻真伪鉴别-印度新闻文章数据集2023-2024.zipZIP
134.88 MiB

下载

附加信息

字段	值
版本	1.0
数据集大小	134.88 MiB
最后更新	2025年4月19日
创建于	2025年4月19日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。

新闻真伪鉴别-印度新闻文章数据集2023-2024

数据与资源

附加信息

注册成功！