以色列国防军加沙战争2024新闻数据集
数据来源:互联网公开数据
标签:以色列国防军,加沙战争,2024,新闻,自然语言处理,实体识别,趋势分析
数据概述:
本数据集来源于以色列国防军的官方Telegram新闻频道,收录了2023年10月7日至2024年6月20日期间的新闻报道。数据集包含了结构化信息,提取自新闻帖子的发布日期、文本内容及文本中提到的实体,包括地点、人物和组织等,适用于自然语言处理(NLP)任务、实体识别及趋势分析。数据集分为两个版本,第一版包含2023年10月7日至2024年4月23日的新闻,第二版包含2023年10月7日至2024年6月23日的全部新闻。
数据用途概述:
该数据集可用于新闻内容分析、事件趋势追踪、实体关系研究等场景。研究人员可以利用此数据集进行自然语言处理任务,识别新闻中的关键实体;分析师可以借此研究加沙战争期间的各种趋势;媒体机构可以利用数据生成深入的新闻报道;政策制定者则可以参考数据来评估应对冲突的策略。此外,数据集也适用于教育培训,帮助学习者理解新闻报道的结构和内容。
举例:
数据集中的每个新闻条目包含以下字段:
- Date(日期):新闻发布日期,格式为YYYY-MM-DD。
- Text(文本):新闻文本内容。
- Location(地点):新闻中提及的地点列表,包括城市、国家、地标等。
- Person(人物):新闻中提及的人物列表。
- Organization(组织):新闻中提及的组织列表,包括公司、政府机构、非营利组织等。
- Siren(警报):布尔值,指示新闻是否提及警报的使用,1表示提及,0表示未提及。
贡献:
欢迎对数据集进行贡献,包括改进抓取方法、扩展特征集或提高数据质量。请参阅仓库中的贡献指南。
许可:
如果您在研究中使用了本数据集,请引用该数据集的DOI。