-
ArguAna_Based_酒店评论情感分析标注语料库_V2
2026年2月8日 30 43 31
数据集概述 本数据集为ArguAna TripAdvisor酒店评论情感分析语料库,包含2100条情感得分均衡的酒店评论,均被手动标注为事实或正负观点,同时标注了评论中的酒店相关方面。此外还提供近20万条未标注的酒店评论,适用于科学研究用途。 文件详解 标注语料包(含软件) 文件名称:arguana-tripadvisor-annotated-...
-
Bangla_REX_Based_孟加拉语关系抽取数据集_完整标注版
2026年1月23日 30 208 36
数据集概述 本数据集是针对孟加拉语关系抽取任务构建的专用数据集,基于结构化知识库和标注语料的理论框架生成。包含63,256条条目组成的孟加拉语知识库(KB)、90,441条带命名实体识别(NER)和词性标注(POS)的文本语料,以及440个孟加拉语地点助记符,可直接用于关系抽取任务。 文件详解 location_mnemonics.xlsx...
-
MarkupMnA_并购协议标注数据集
2025年12月15日 30 49 33
数据集概述 该数据集包含151份美国上市公司并购协议的标注语料,基于SEC EDGAR数据库的HTML filings,添加了章节标题、章节号、页码等标注,采用BEIOS标签方案。旨在支持法律合同长文档的层级表示研究,可与MAUD数据集结合用于法律NLP研究。 文件详解 压缩包文件:...
-
企业ESG自动评估媒体报道数据挖掘与评估数据集
2025年12月7日 30 187 68
数据集概述 本数据集是企业ESG自动评估研究的复现包,包含标注为环境、治理或社会相关的四万三千二百四十一篇新闻标题语料库,以及用于公司检测、ESG分类和情感模型训练评估的代码笔记本,为ESG相关NLP任务提供基准数据。 文件详解 标注语料库文件:...



