找到7个数据集

标签: NLP分析

过滤结果
  • 瑞士国家科学基金会_SNSF_资助申请中正面词汇的频率分析数据

    2026年2月9日 30 98 95

    数据集概述 本数据集记录瑞士国家科学基金会不同资助项目申请文本中积极词汇的出现频率,包含三类资助项目(职业资助、Spark资助、项目资助)的申请数据。数据涵盖积极词汇计数、申请人特征、申请结果等信息,用于复现Lerchenmueller et al. (2019)的研究方法与发现,支持科研资助申请文本的NLP分析。 文件详解...
    packageimg
  • HCD_Historical_Corpus_of_Dutch_词频统计数据_2023

    2026年1月18日 30 86 29

    数据集概述 本数据集为荷兰历史语料库(HCD)的词频统计数据,涵盖不同地区、世纪和体裁的词频分布情况。HCD是一个包含早期和晚期现代荷兰语的多体裁语料库,数据来源于2023年发表的相关学术论文,可用于荷兰历史语言学和文本分析研究。 文件详解 文件名称:wordcount_overview.xlsx 文件格式:XLSX...
    packageimg
  • 休闲领域复杂已知项搜索请求标注指南与数据集

    2025年12月14日 30 104 17

    数据集概述 本数据集包含休闲领域(书籍、电影、游戏)的已知项搜索请求标注数据,标注内容包括搜索请求帖、正确答案帖及原帖主确认帖,同时提供标注流程说明文档,支持相关检索研究。 文件详解 标注指南文件: 文件名称:Annotation_Guidelines.pdf 文件格式:PDF 内容:详细说明已知项搜索请求的标注流程与规则...
    packageimg
  • 数据16世纪意大利古籍历时性分析方法论及核心概念语义变迁追踪数据集

    2025年12月12日 30 196 143

    数据集概述 该数据集包含16世纪意大利古籍的OCR文本及样本图像,用于支撑历时性分析方法论研究,追踪16世纪意大利思想辩论中核心概念的语义变迁。数据集包含压缩包文件、文本文件和图像文件,文本来源标注于文件首行,当前提供部分文档样本及初始页图像。 文件详解 压缩包文件:...
    packageimg
  • DFPulse_2024数字取证从业者调查数据集

    2025年12月11日 30 118 93

    数据集概述 该数据集是2024年DFPulse数字取证从业者调查的匿名响应数据,包含人口统计学、工作挑战、学术参与三个部分的调查内容。数据旨在了解从业者需求及学术研究与实践的互动关系,为优化数字取证领域的学术研究方向提供依据。 文件详解 格式化响应数据文件: ResponsesFormattedForExcel.xlsx:...
    packageimg
  • Bandcamp销售数据集-2020年9月9日至10月2日-mathurinache

    2025年5月7日 30 155 119

    Bandcamp销售数据集-2020年9月9日至10月2日-mathurinache 数据来源:互联网公开数据 标签:Bandcamp,销售数据,音乐销售,数字专辑,实体商品,销售分析,价格预测,NLP分析 数据概述: 本数据集包含2020年9月9日至10月2日Bandcamp平台100万个销售记录。数据集涵盖的字段包括: -...
    packageimg
  • 印度议会法案文本数据集

    2025年4月14日 30 136 91

    印度议会法案文本数据集 数据来源:互联网公开数据 标签:议会法案,印度立法,文本数据,分块处理,NLP分析,法律文本,政策研究 数据概述:...
    packageimg