-
阿姆哈拉语监督式主题分类语料库
2026年2月12日 30 179 76
数据集概述 本数据集为阿姆哈拉语主题分类监督语料库,由埃塞俄比亚记者专业标注,文件名为Supervised_Topic_Classifier_Corpus.xml。数据集包含一份XML格式文件,未划分训练/测试集、数据/标签集或原始/处理集,可用于自然语言处理领域的阿姆哈拉语文本分类研究,需进一步优化完善。 文件详解...
-
EHSAN可解释医疗保健情感分析NLP数据集
2026年2月1日 30 72 27
数据集概述 本数据集为EHSAN(可解释医疗情感标注)数据集,包含医疗领域的情感标注数据及实验代码相关文件,共6个文件,均为XLSX格式,无目录结构。数据覆盖训练、测试、验证阶段的主题与情感标注内容,以及大语言模型标注的数据集。 文件详解 Final_train_topic_and_sentiment.xlsx 文件格式:XLSX...
-
堆栈交换网站上软件工程与项目管理论坛的分析数据
2026年2月1日 30 74 65
数据集概述 本数据集为Stack Exchange平台上软件工程与项目管理论坛的分析电子表格,包含一份Excel文件,聚焦该类论坛的相关分析内容,为研究论坛主题、用户讨论趋势等提供结构化数据支持。 文件详解 文件名称:Analysis of SE and PM Forums.xlsx 文件格式:XLSX...
-
NASA_Based_系外行星出版物摘要预处理数据集
2026年1月31日 30 46 3
数据集概述 本数据集为NASA收集的系外行星相关出版物摘要预处理数据,包含5个文件,存储为可导入Pandas的JSON格式压缩文件及说明文档,便于研究者快速获取系外行星文献的结构化摘要信息。 文件详解 Readme.md 文件格式:MD 字段映射介绍:包含数据集标题、日期、作者及内容说明,列出各数据文件的核心内容...
-
加泰罗尼亚语_中文平行句子机器翻译评估数据集_测试版
2026年1月31日 30 32 11
数据集概述 本数据集包含来自加泰罗尼亚语维基新闻、加泰罗尼亚语维基百科和西班牙语维基导游的平行句子,共一千零二十二条。数据涵盖加泰罗尼亚语、西班牙语及对应的GPT-4生成中文翻译和人工修订中文翻译,覆盖科学技术、文化、经济等十大主题,可用于机器翻译模型评估与强化学习人类偏好数据研究。 文件详解 文件名称:test.json 文件格式:JSON...
-
国际卫生管理杂志_图书馆员方法学同行评审案例研究数据集
2026年1月31日 30 146 131
数据集概述 本数据集围绕国际卫生治理期刊的案例研究,分析图书馆员与信息专家作为方法学同行评审者的影响,包含13篇证据综合手稿的评审报告、作者回复及编辑决策的定性分析数据,涉及16个主题分类,用于比较方法学与学科同行评审的差异及对编辑决策的影响。 文件详解 文件名称:Background.docx 文件格式:DOCX...
-
SciExpeM_Based_能源与环境科学文献关联数据集
2026年1月30日 30 194 43
数据集概述 本数据集关联SciExpeM平台的文献数据,对应Balaya、Palani于2008年发表在《Energy & Environmental Science》的研究内容,包含1个XML格式文件,用于存储相关文献的结构化元数据信息。 文件详解 文件名称:10.5281/zenodo.6370252.xml 文件格式:XML...
-
ATD_Based_教师群体焦点小组与初始问卷数据_教育研究
2026年1月29日 30 9 3
数据集概述 本数据集包含教育研究中教师群体焦点小组与初始问卷的数据及方法论。通过ATD方法对21份教师初始问卷文本进行处理,包括单位化、分类和元文本撰写,旨在分析教师相关主题,为教育研究提供数据支持。 文件详解 文件名称:Dados da pesquisa - Questionário inicial e Metodologia da...
-
GLARE_Based_全球湖泊研究文献与多源属性整合数据集
2026年1月29日 30 99 56
数据集概述 本数据集整合了58,024篇同行评议文献的元数据与2,542个湖泊的几何、气象及社会经济属性,通过深度学习提取湖泊实体、地理编码及主题分类(17个主题、54个子主题),形成全球湖泊研究图谱(GLARE),为湖泊研究提供文献与多源数据关联的综合资源。 文件详解 文件名称:GLARE_data&code.zip...
-
整合性历史叙事综述_全科医学系统与复杂性思维相关文献数据分析
2026年1月29日 30 38 34
数据集概述 本数据集基于全科医学文献的整合历史叙事综述,涵盖过去七十年系统与复杂性科学理论对全科医学领域的影响。通过系统检索与人工补充筛选,最终纳入五十六篇相关文献,按时间分为四个阶段分析其应用演进,为理解全科医学哲学与理论发展提供参考。 文件详解 文件名称:Supplementary Figures and Tables.docx 文件格式:DOCX...
-
PSECO_Source_专有软件生态系统系统性映射研究数据集
2026年1月29日 30 136 80
数据集概述 本数据集为专有软件生态系统(PSECO)系统性映射研究专用数据,包含一份结构化文件,记录了研究相关的核心信息,可用于支持专有软件生态系统领域的系统性分析与文献综述工作。 文件详解 文件名称:Dataset_Studies Informations_SMS PSECO.xlsx 文件格式:XLSX...
-
Unicamp_IR_Based_人工与AI主题标引对比数据集
2026年1月28日 30 147 110
数据集概述 本数据集来自巴西坎皮纳斯州立大学(Unicamp)机构知识库,包含40篇科学文献的人工标引与AI标引对比数据。通过单份Excel文件呈现,分为人工主题标引表和AI可持续发展目标(SDGs)自动分类表,可用于比较人工与AI元数据的概念一致性、术语相关性及分类准确性。 文件详解...
-
基于社交媒体环境的可持续性研究数据库_One_Earth_发布
2026年1月28日 30 138 128
数据集概述 本数据集为发表于One Earth的论文配套数据库,收录了2011-2021年间415项应用社交媒体数据开展环境可持续性研究的文献记录。数据在Ghermandi和Sinclair 2019年系统综述的169项研究基础上,通过滚雪球法补充灰色文献及学术文章,聚焦社交媒体数据在环境领域的应用机会、风险与伦理问题,为该领域研究提供结构化参考。...
-
Set_2_Thematic_analysis_主题分析编码数据
2026年1月28日 30 111 32
数据集概述 本数据集为Set 2主题分析相关数据,包含一份最终编码文件,用于记录主题分析过程中的编码结果,支持主题分析工作的结果呈现与查阅。 文件详解 文件名称:Set 2 final codes.xlsx 文件格式:XLSX 字段映射介绍:未提供具体字段信息,推测包含主题分析相关的编码内容及对应分类等信息。 适用场景 主题分析结果查阅:用于查看Set...
-
Analysis_口腔修复与种植体社交媒体内容质量与可靠性分析数据
2026年1月27日 30 29 14
数据集概述 本数据集聚焦Instagram、TikTok和YouTube平台上口腔修复与种植体相关社交媒体内容,旨在分析其可靠性与质量。数据集包含一份文件,可用于评估该领域社交媒体信息的准确性、专业性及潜在影响。 文件详解 文件名称:DataSet.xlsx 文件格式:XLSX...
-
ObsEdu_Based_联邦立法机构在疫情首年保障教育权研究数据集
2026年1月26日 30 29 4
数据集概述 本数据集由圣保罗大学教育权观察站开发,记录2020年3月至2021年3月巴西联邦议会提交的教育相关立法提案(PL)信息。包含提案基本信息、立法进程、主题分类、疫情相关性及政策相关性评估等多维度数据,是研究疫情初期联邦立法机构保障教育权实践的核心资料。 文件详解 文件名称:ObsEdu_BaseDeDados.xlsx 文件格式:XLSX...
-
TiLt_HS_Based_立陶宛高中多学科选择题测试数据_2024
2026年1月26日 30 110 20
数据集概述 本数据集为TiLt-HS(立陶宛高中测试),包含立陶宛高中多学科选择题测试数据,用于评估学生知识水平。数据采集于2024年8月,涵盖微观经济学、宏观经济学、财务与簿记三个学术主题,共142个测试问题,可作为多语言模型训练子集使用。 文件详解 文件名称:high_school_economics_lt.json 文件格式:JSON...
-
MID_Based_俄罗斯外交部2003_2019年新闻文件集合数据
2026年1月25日 30 188 107
数据集概述 本数据集为从俄罗斯外交部官网mid.ru抓取的2003年1月至2019年12月的新闻文件集合,包含部长讲话、副部长讲话、电话交谈、简报会等七类文件,共一万一千八百五十七份文档,每份文档对应一行数据,记录了文档的标识、日期、标题、类型、全文、来源链接等信息。 文件详解 数据文件 文件名称:MID.rds 文件格式:RDS...
-
eWTI_Based_1919_1980双边文化协定元数据_2021版
2026年1月23日 30 177 170
数据集概述 本数据集基于电子世界条约索引(eWTI)的子集整理而成,包含1919年至1980年间所有已知双边文化协定的元数据。数据对eWTI原始内容进行了补充和修正,并添加了新标签,作为“The Culture of International Society”研究项目的一部分,用于支持《文化条约的兴起》一文的分析。 文件详解...
-
WSSSPE5_1_Based_速览博客主题框架分析原始数据与编码结果
2026年1月23日 30 96 55
数据集概述 本数据集包含WSSSPE 5.1会议速览博客的原始文本及主题框架分析编码结果,用于学术研究中的博客内容分析。数据集共2个文件,分别存储原始博客文本与编码分析结果,支持对会议速览博客的主题挖掘与框架研究。 文件详解 WSSSPE5.1_blogs.docx 文件格式:DOCX 字段映射介绍:包含WSSSPE...



