-
Not_So_Weak_PICO_EBM_PICO修正标注及词典资源
2026年1月25日 30 64 46
数据集概述 本数据集包含修正后的EBM-PICO测试集标注及相关词典资源,用于系统综述自动化中的PICO(参与者、干预措施、结局)实体识别。EBM-PICO数据集原分为众包标注训练集和专家标注测试集,存在标注质量问题。本数据集提供经错误修正的测试集标注,以及从临床实验数据库和文献中生成的PICO相关词典文件。 文件详解 修正测试集标注文件...
-
LexiconNewsAnalyzer_Esp_新闻评论情感分析词典扩展数据
2026年1月20日 30 123 44
数据集概述 本数据集为论文《Lexicon-based comments-oriented news sentiment analyzer system》的配套资源,包含新闻评论情感分析的词典及示例扩展内容,由西班牙教育与科学部等机构资助项目支持开发,是自然语言处理领域情感分析任务的基础资源。 文件详解...
-
Croatian_Survey_Data_克罗地亚中小学词典使用调查数据2023
2026年1月19日 30 146 53
数据集概述 本数据集为2023年2月1日至17日开展的克罗地亚中小学词典及其他词典资源使用情况调查数据,记录了克罗地亚中小学教育场景下词典资源的使用现状,仅包含一个文件。 文件详解 文件名称:lexicographic_resources_in_croatian_education_survey_data.xlsx 文件格式:XLSX...
-
Nerwip_Corpus_Named_Entity_Recognition_传记文本实体标注语料库
2026年1月5日 30 93 13
数据集概述 本数据集为Nerwip语料库,包含408篇维基百科传记文章,人工标注了日期、地点、组织、人物四类实体,用于评估和比较NER工具在传记文本上的性能。还包含NER工具所需的模型、词典等文件,需按说明解压使用。 文件详解 文件名称:nerwip-4-data.zip 文件格式:ZIP 字段映射介绍:包含408篇标注传记文本及相关数据...
-
罗马乌尔都语数据集
2025年4月14日 30 202 109
罗马乌尔都语数据集 数据来源:互联网公开数据 标签:罗马乌尔都语,自然语言处理,NLP,情感分析,电子商务,社交媒体,语言转换,词典资源 数据概述:...



