找到84个数据集

标签: 主题分布

过滤结果
  • heureCLÉA_Source_项目源文档数据1_0

    2026年2月7日 30 176 120

    数据集概述 本数据集为heureCLÉA项目的源文档数据,版本为1.0。数据以压缩包形式存储,包含项目相关的源文档内容,未区分训练/测试、数据/标签或原始/处理数据类型,无可用的自述文件或内容预览。 文件详解 文件名称:heureclea/sourcedocuments-1.0.zip 文件格式:ZIP...
    packageimg
  • 我们的东方手稿收藏数据库_1810_15

    2026年2月2日 30 180 133

    数据集概述 本数据集是1810-15年Gore Ouseley爵士领导的波斯外交使团相关研究档案的一部分,由独立研究者W H Martin和Sandra Mason整理。内容为Ouseley兄弟收藏的东方手稿目录数据,涵盖牛津博德利图书馆馆藏的手稿信息,部分手稿与波斯使团相关,数据集含6个文件。 文件详解 数据库文件...
    packageimg
  • ICIS_2025_文献综述用匿名论文数据

    2026年2月1日 30 195 81

    数据集概述 本数据集为ICIS 2025会议用于文献综述的匿名论文集合,包含1个Excel文件,无目录结构,未划分训练/测试集、数据/标签集或原始/处理集,可用于信息系统领域的学术文献分析。 文件详解 文件名称:papers_icis2025_v2.xlsx 文件格式:XLSX 字段映射介绍:未提供具体字段信息,推测包含ICIS...
    packageimg
  • MR_Lit_Based_MR_Lit推文原始数据

    2026年1月31日 0 36 14

    数据集概述 本数据集包含MR Lit相关的推文原始数据,涵盖推文时间、内容、曝光量、转发量等信息。包含独立文件压缩包及合并文件,保留推文ID、链接、文本、时间、互动指标等核心字段,共61个文件,支持社交媒体数据的统计与分析。 文件详解 独立CSV文件...
    packageimg
  • MDE_Based_模型驱动工程研究文献分析数据集

    2026年1月31日 30 37 32

    数据集概述 本数据集用于分析模型驱动工程(MDE)领域的研究演进,包含MDE领域的本体、研究文献数据集及会议与领域分析表格。通过自然语言处理和机器学习技术,从学术文献中提取信息,支持对MDE领域的研究趋势、主题分布、核心贡献者等维度的分析。 文件详解 mdeo.ttl:Model-Driven Engineering Ontology 文件格式:TTL...
    packageimg
  • NEH5_2020_2024_北欧经济史五大期刊文献数据

    2026年1月30日 30 18 8

    数据集概述 本数据集收录了2000年至2024年间北欧经济史领域在经济史五大期刊及《斯堪的纳维亚经济史评论》中的出版物信息,共包含一个文件,聚焦北欧经济史研究成果的文献分布与趋势分析。 文件详解 文件名称:REGIONS Scandinavia.xlsx 文件格式:XLSX...
    packageimg
  • Interview_Data_访谈主题分析与频率统计数据

    2026年1月30日 30 125 18

    数据集概述 本数据集包含访谈中识别出的主要主题,以及对这些主题的频率和百分比统计表格。通过单一文档整合访谈主题分析结果与量化统计信息,为研究提供结构化的访谈数据参考。 文件详解 文件名称:Data.docx 文件格式:DOCX...
    packageimg
  • NBC2_4_Based_历史新闻文章主题建模与分类标注数据

    2026年1月29日 30 112 41

    数据集概述 本数据集包含通过主题建模和朴素贝叶斯分类器(NBC2+4)对历史新闻文章进行的标注结果,按文章标题组织。内容涵盖瑞士新闻文章的主题标签及分布、第4轮NBC分类中欧洲反现代概念的前100个显著词,为新闻文本的主题分析提供结构化标注数据。 文件详解 文件1:Bunout-newspaper article-annotations-...
    packageimg
  • COVID_19古巴医学期刊发表文章数据_2020年疫情初期

    2026年1月29日 30 34 21

    数据集概述 本数据集收录了古巴COVID-19疫情前90天内,古巴医学期刊发表的所有相关研究文章信息。数据以结构化形式整理,为了解疫情初期古巴医学研究动态提供支持,共包含一个文件。 文件详解 文件名称:Base de datos investigacion Final.xlsx 文件格式:XLSX...
    packageimg
  • UCS_Dataset_Based_乌尔都语犯罪新闻摘要语料库

    2026年1月29日 30 98 91

    数据集概述 本数据集包含1500篇乌尔都语犯罪新闻文章的摘要内容,主要用于训练抽象式文本摘要模型。数据集仅含一个文件,无目录结构,未划分训练/测试集、数据/标签集或原始/处理数据集,便于集中使用。 文件详解 文件名称:UCS-Dataset.xlsx 文件格式:XLSX...
    packageimg
  • ORKG_Based_DILS_2019论文知识图谱用例数据集

    2026年1月28日 30 194 146

    数据集概述 本数据集为DILS 2019用例数据集,由主题专家收集,将DILS 2019会议论文以机器可读的知识图谱模型形式呈现。数据集包含1个文件,无目录层级,未划分训练/测试、数据/标签或原始/处理数据,便于直接使用。 文件详解 文件名称:JCDL 2019, DILS 2019 papers, ORKG overview.xlsx...
    packageimg
  • 补充材料1_自然保护_罗马尼亚棕熊媒体报道的编码分类与统计数据

    2026年1月28日 0 109 79

    数据集概述 本数据集为论文《The drums of war are beating louder: Media coverage of brown bears in Romania》的补充材料1,包含改编自Hughes et al. 2020的编码分类体系,以及罗马尼亚棕熊相关媒体报道的描述性统计数据,用于支持野生动物保护议题的媒体话语分析。...
    packageimg
  • IRaMuteQ_Based_竞选活动算法研究与科学计量分析数据

    2026年1月28日 30 162 6

    数据集概述 本数据集是论文《竞选活动算法研究:基于IRaMuteQ的分析》的原始数据,包含2008至2018年Scopus数据库中“政治算法在竞选活动”主题的150篇学术文章文本语料,通过科学计量技术和IRaMuteQ内容分析开展探索性研究,涵盖数据挖掘、统计分析、分类等方法。 文件详解 文件名称:STUDY ON ALGORITHMS IN...
    packageimg
  • LDA_Based印尼初中生Instagram标题主题建模数据集

    2026年1月28日 30 7 4

    数据集概述 本数据集围绕印尼初中生Instagram标题的LDA主题建模研究构建,包含原始爬取数据与建模代码文件,支持对青少年社交媒体文本内容的主题挖掘分析,共含2个文件。 文件详解 数据文件 文件名称:crawling.xlsx 文件格式:XLSX 字段映射介绍:原始爬取的印尼初中生Instagram标题数据,具体字段未提供预览 代码文件...
    packageimg
  • INCHER_RIS_2016年高等教育研究期刊与摘要汇编数据集

    2026年1月28日 30 56 46

    数据集概述 本数据集是2016年高等教育研究领域的期刊与摘要汇编,由德国卡塞尔大学INCHER的研究信息服务(RIS)提供。包含学术期刊及其出版物数据,明确提供持久标识符,是对2013-2018年系列年度汇编的修订版,可用于单卷或多卷的进一步评估。 文件详解 文件名称:2016_INCHER-Compilation_1044.xlsx...
    packageimg
  • RoMEMES_Source_罗马尼亚社交媒体表情包多模态标注数据

    2026年1月27日 30 145 85

    数据集概述 本数据集为罗马尼亚语表情包数据集RoMEMES,采集自公共社交媒体平台,包含表情包的文本、图像及相关标注信息。数据经人工标注罗马尼亚语文本、图像复杂度、情感倾向、政治内容属性,文本部分通过RELATE平台自动标注词性、词元及依存句法,同时包含元数据。 文件详解 metadata.tsv 文件格式:TSV...
    packageimg
  • SIGCSE_ITiCSE_2020网络安全教育论文系统综述数据集

    2026年1月27日 30 102 100

    数据集概述 本数据集是SIGCSE 2020会议论文《What Are Cybersecurity Education Papers About?》的补充材料,包含对SIGCSE和ITiCSE会议网络安全教育相关论文的系统综述数据,涵盖自动化搜索到的所有论文、手动排除论文及最终纳入综述的论文三类信息,以压缩包形式提供结构化整理结果。 文件详解...
    packageimg
  • JHR_补充材料_1_贾斯汀_施密特_原创性研究补充文档_2024

    2026年1月27日 30 181 172

    数据集概述 本数据集为《Justin Schmidt's originality》研究的补充材料,包含Justin O. Schmidt的出版物相关信息,是该研究在膜翅目昆虫学领域的辅助支撑资料,仅含一个文档文件。 文件详解 文件名称:oo_1032146.docx 文件格式:DOCX...
    packageimg
  • Dao_Zang_Ji_Yao_Based道藏輯要N元语法统计数据集

    2026年1月27日 30 3 0

    数据集概述 本数据集包含从《道藏輯要》中提取的1元、2元、3元语法(N-gram)统计数据,以及对应书籍的元数据。数据按不同元语法类型分类存储,每本书对应独立的统计文件,可用于分析《道藏輯要》的文本语言特征,总计包含4个文件。 文件详解 一元语法数据集: 文件名称:jiyao_1.7z 文件格式:7z压缩包(内含TXT文件)...
    packageimg
  • Elprama_Based_论文主题编码频率统计数据_2022_2023

    2026年1月22日 30 176 70

    数据集概述 本数据集是从MaxQDA导出的表格,展示了Elprama等人2022-2023年三篇论文中各主题的出现频率,用于反映论文内容中主题的分布情况,为学术文献分析提供结构化数据支持。 文件详解 文件名称:Elprama et al. (2022; 2023a;2023b) - Tables with code frequencies per...
    packageimg