-
RoMEMES_Source_罗马尼亚社交媒体表情包多模态标注数据
数据集概述 本数据集为罗马尼亚语表情包数据集RoMEMES,采集自公共社交媒体平台,包含表情包的文本、图像及相关标注信息。数据经人工标注罗马尼亚语文本、图像复杂度、情感倾向、政治内容属性,文本部分通过RELATE平台自动标注词性、词元及依存句法,同时包含元数据。 文件详解 metadata.tsv 文件格式:TSV...
-
SIGCSE_ITiCSE_2020网络安全教育论文系统综述数据集
数据集概述 本数据集是SIGCSE 2020会议论文《What Are Cybersecurity Education Papers About?》的补充材料,包含对SIGCSE和ITiCSE会议网络安全教育相关论文的系统综述数据,涵盖自动化搜索到的所有论文、手动排除论文及最终纳入综述的论文三类信息,以压缩包形式提供结构化整理结果。 文件详解...
-
JHR_补充材料_1_贾斯汀_施密特_原创性研究补充文档_2024
数据集概述 本数据集为《Justin Schmidt's originality》研究的补充材料,包含Justin O. Schmidt的出版物相关信息,是该研究在膜翅目昆虫学领域的辅助支撑资料,仅含一个文档文件。 文件详解 文件名称:oo_1032146.docx 文件格式:DOCX...
-
Dao_Zang_Ji_Yao_Based道藏輯要N元语法统计数据集
数据集概述 本数据集包含从《道藏輯要》中提取的1元、2元、3元语法(N-gram)统计数据,以及对应书籍的元数据。数据按不同元语法类型分类存储,每本书对应独立的统计文件,可用于分析《道藏輯要》的文本语言特征,总计包含4个文件。 文件详解 一元语法数据集: 文件名称:jiyao_1.7z 文件格式:7z压缩包(内含TXT文件)...
-
Elprama_Based_论文主题编码频率统计数据_2022_2023
数据集概述 本数据集是从MaxQDA导出的表格,展示了Elprama等人2022-2023年三篇论文中各主题的出现频率,用于反映论文内容中主题的分布情况,为学术文献分析提供结构化数据支持。 文件详解 文件名称:Elprama et al. (2022; 2023a;2023b) - Tables with code frequencies per...
-
CyberSecNews_Based_德英网络安全新闻人工分类标注数据集
数据集概述 本数据集包含457篇德语和英语新闻文章,通过RSS源从各类新闻网站和博客收集。每篇文章经AIT数字安全与安全中心同事人工分类,标注为“网络安全”“非网络安全”或“不确定”,并提供文章标题、内容、语言、来源、发布时间、版权声明及参与者分类结果等信息,无缺失值。 文件详解 文件名称:cybersec_news_de_en.json...
-
PBU_SDG_Based_2030议程科学产出开放获取与社会影响分析数据
数据集概述 本数据集围绕玻利瓦尔教皇大学(PBU)与2030议程的关联展开,涵盖该校SDG相关科学产出、开放获取模式及社交媒体影响分析结果,采用混合方法结合科学计量学与数据挖掘技术,揭示科研活动趋势、开放获取相关性及社会关注主题特征。 文件详解...
-
Literature_Review_Based_空间保护文献综述数据库数据
数据集概述 本数据集为空间保护相关的文献综述数据库,用于文献研究分析。数据内容根据期刊文章中描述的提取方法构建,包含一份Excel格式的文献数据库文件,可支持空间保护领域的文献检索与分析工作。 文件详解 文件名称:SpatialConservation_Review_LiteratureDatabase.xlsx 文件格式:XLSX...
-
自然保护_补充材料2_穿山甲新闻报道与公众关注度分析数据2005_2016
数据集概述 本数据集为论文的补充材料2,包含2005年1月至2016年12月期间从Nexis UK检索到的所有含"pangolin"关键词的新闻文章全文,用于分析穿山甲及穿山甲贸易相关事件的媒体活跃度和公众关注度。数据集仅含1个文件。 文件详解 文件名称:oo_246953.docx 文件格式:DOCX...
-
Semantic_Search_Based_语义搜索文献综述与研究议程数据
数据集概述 本数据集为提交至IEEE Access的语义搜索文献综述与研究议程相关数据,包含二十四个文件,涵盖文献引用数据、LDA模型文件、文献库数据等内容,涉及ScienceDirect、Web of Science、IEEE等来源的文献信息及语义分析模型相关文件,为语义搜索领域的研究提供文献支撑与分析基础。 文件详解 文献引用数据文件...
-
Crossref_Based_科学出版物主题演化数据集_2011_2020
数据集概述 本数据集包含基于Crossref科学出版物的主题建模结果,覆盖2011-2015和2016-2020两个时间段。数据通过主题提取技术生成,可用于监测科学主题的演化趋势,支持科研人员、政策制定者等群体分析学术领域动态。 文件详解 2011-2015年主题数据 文件名称:topics-crossref-2011-2015.json...
-
NextFood_Horizon2020_教育转型网络学习定性数据_待更新
数据集概述 本数据集为欧盟Horizon 2020项目“NextFood”的年度联盟会议研讨会成果数据,包含2018年5月起收集的教育转型相关成就、挑战及行动计划的定性内容,旨在支持农业食品领域可持续发展领导者的教育模式创新,数据集将在项目结束时更新。 文件详解 文件名称:SLU_V1.0_Consortium Workshop...
-
Topic_Modeling_Based_女性图书馆员相关文献主题分析数据集
数据集概述 本数据集围绕女性图书馆员相关文章的主题建模展开,包含用于NLP分析的代码文件、数据文件及文献检索查询文件,共4个文件,覆盖主题建模的核心过程与数据基础。 文件详解 代码文件 文件名称:Bertopic_Female_Lib.ipynb、scattertext.ipynb 文件格式:.ipynb...
-
Stack_Overflow_Based_软件设计讨论半监督主题建模研究数据
数据集概述 本数据集是关于软件设计讨论的半监督主题建模研究数据,基于Stack Overflow平台的设计相关问答内容,探索结合专家输入与半监督方法(Anchored CorEx)识别设计主题的有效性,可用于分析软件开发中的设计知识呈现与讨论特征。 文件详解 文件名称:replication-package.zip 文件格式:ZIP...
-
RECOLECTA_Source_西班牙电子游戏与性别学术产品数据库_数据集
数据集概述 本数据集为西班牙RECOLECTA知识库中以“电子游戏与性别”“电子游戏与性别歧视”“电子游戏与女性”为关键词检索到的学术成果集合,包含相关学术作品的检索结果数据,助力了解该领域在西班牙的研究情况。 文件详解 文件名称:dataset_VJyGenero.xlsx 文件格式:XLSX...
-
Bildungsforschung_教育研究期刊文章数据集_2017_2021
数据集概述 本数据集包含2017至2021年期间教育研究领域的期刊及文章相关数据,提供两种格式的文件,便于不同工具的读取与使用,可支持教育研究领域的文献分析、趋势研究等应用场景。 文件详解 文件名称:Zeitschriften_Artikel_Bildungsforschung_2017_2021.xlsx 文件格式:XLSX...
-
World_Press_Photo_获奖照片_标准化数据集_2022_2025
数据集概述 本数据集为2022–2025年世界新闻摄影奖(World Press Photo)获奖照片的标准化数据集,包含一份Excel格式文件,对获奖照片相关信息进行了规范化整理,可用于新闻摄影领域的数据分析与研究。 文件详解 文件名称:World_Press_Photo_Final_Normalized.xlsx 文件格式:XLSX...
-
agroecology_Europe_Based_欧洲社会运动支持农业生态学文档数据
数据集概述 本数据集包含欧洲社会运动支持农业生态学的文档相关数据,共1个文件,内含2个数据表。主要记录相关文档的基本信息及说明图例,为研究欧洲农业生态学社会运动提供结构化资料。 文件详解 文件名称:D2.3 Documents from social movements supporting agroecology in Europe - Annex...
-
Annexe_7_Corpus_Based_法国媒体文章与公民评论完整语料库数据
数据集概述 本数据集为Annexe 7法国媒体文章与公民评论完整语料库,包含法国媒体发布的文章及公民对其的评论内容,以压缩包形式提供,是用于自然语言处理研究的文本语料资源。 文件详解 文件名称:7. Annexe 7 Corpus version complète articles médias et commentaires citoyens...
-
AIWare_Challenge_Based_MSR2022_2023会议日程数据集
数据集概述 本数据集包含MSR 2022和MSR 2023的会议日程数据,用于AIWare 2024挑战赛。数据以JSON格式存储,每份文件对应一届会议的日程,记录了会议论文的标题、摘要、展示地点、时间及所属分会场名称,共包含2个文件。 文件详解 文件名称:msr2023_schedule.json 文件格式:JSON 字段映射介绍:包含MSR...



