-
AspectJ_Source_软件缺陷定位项目数据集
2026年1月31日 30 65 48
数据集概述 本数据集由An Ngoc Lam捐赠,包含AspectJ项目的缺陷定位相关数据,涵盖缺陷报告、代码提交及文件变更信息。数据以Excel和XML两种格式存储,分别提供基础属性和详细变更记录,支持软件缺陷定位技术的研究与评估。 文件详解 文件名称:AspectJ.xlsx 文件格式:XLSX...
-
Crossref_metadata_processed_data
2026年1月28日 30 4 2
数据集概述 本数据集包含来自Crossref的元数据处理文件,主要用于学术文献相关的元数据管理与分析。数据结构简单,无复杂目录层级,仅包含一个核心文件,未进行训练测试、数据标签或原始加工的拆分,专注于提供结构化的元数据信息。 文件详解 文件名称:metadatakrok3.xlsx 文件格式:XLSX...
-
Wikidata_Based_Wikidata电影条目RDF转储数据
2026年1月23日 30 132 121
数据集概述 本数据集是通过wdumps工具生成的Wikidata电影条目RDF转储数据,包含Wikidata中所有电影相关实体,涵盖实体、陈述及三元组信息,共四个文件,支持对Wikidata电影知识的结构化解析与应用。 文件详解 文件名称:info.json 文件格式:JSON...
-
Google_Scholar_Based_排名算法语言偏见研究数据集2021
2026年1月20日 30 184 99
数据集概述 本数据集是论文《Language Bias in the Google Scholar Ranking Algorithm》的配套数据,用于研究Google Scholar排名算法中的语言偏见问题。通过反向工程和统计分析方法,探究非英文发表的学术文献在多语言搜索中的排名位置差异,涉及作者、年份、关键词等维度的分析数据,共包含3个文件。...
-
WSDM2021_Contextualizing_新闻趋势实体上下文分析数据集
2026年1月20日 30 191 83
数据集概述 本数据集是基于《纽约时报标注语料库》开发的富集数据,包含149个趋势事件,涉及12万个实体。数据旨在对新闻中的趋势实体进行上下文关联,按实体对趋势的解释价值排序。数据集分为无监督(149个趋势)和有监督(训练集50个、开发集34个、测试集65个)两类评估数据,支持趋势实体解释性研究。 文件详解 文件名称:contextualizing-...
-
rhdayat_Entity_Matching_Smartphone数据集_数据处理
2026年1月18日 30 109 90
数据集概述 本数据集围绕智能手机领域的实体匹配任务构建,包含2个相关文件,覆盖数据文件与压缩归档文件两种类型,主要用于支持智能手机实体匹配相关的研究与应用开发,提供基础数据资源。 文件详解 数据文件 文件名称:dataset.xlsx 文件格式:XLSX 字段映射介绍:未提供具体字段信息,推测包含智能手机实体匹配任务相关的结构化数据内容 归档文件...
-
Webis_QSpell_17_Based_2017年人工拼写检查网络查询语料库
2026年1月15日 30 173 45
数据集概述 本数据集为Webis Query Spelling Corpus 2017(Webis-QSpell-17),包含54,772条经人工拼写检查的网络查询数据,其中9,171条查询提供了替代拼写变体。数据集仅含一个压缩文件,无训练测试或数据标签分割,可用于自然语言处理领域的拼写检查相关研究。 文件详解 文件名称:corpus-webis-...
-
Webis_Query_Segmentation_Corpus_2010网络查询分割众包标注数据
2026年1月11日 30 74 21
数据集概述 本数据集为Webis Query Segmentation Corpus 2010(Webis-QSeC-10),包含53,437条网络查询的分割标注结果,标注由Mechanical...
-
sgenc_wiki_ref_MediaWiki_API_捷克维基百科社会学百科全书引用监测数据2020
2026年1月1日 30 13 2
数据集概述 本数据集记录2020年3月12日至8月31日期间,捷克维基百科文章对《社会学百科全书》(Sociologická encyklopedie)及其印刷原版著作的引用情况。数据通过定期采集生成,包含每日监测文件夹,内有JSON和CSV格式文件,记录引用链接及特定文本字符串的出现情况,用于学术分析。 文件详解 主文件 文件名称:data.zip...
-
数据2008_2018年基于IRaMuTeQ的Scopus与LISA数据库中Amazônia和Amazon术语检索结果对比分析数据集
2025年12月27日 30 209 160
数据集概述 本数据集基于2008至2018年Scopus和LISA数据库中“Amazônia”与“Amazon”术语的检索结果,采用概念理论、领域分析及IRaMuTeQ软件对80篇文献摘要进行语义距离识别、量化与分析,为学术检索术语差异研究提供支持。 文件详解 文件名称:Dataset from Scopus and LISA.xlsx...
-
Skills4EOSC交付件D6_1现有专业网络映射参考数据与文档
2025年12月23日 30 100 14
数据集概述 该数据集为Skills4EOSC交付件D6.1“现有专业网络映射”的参考资料,包含专业网络数据收集结果及搜索字符串的主文档,支持相关研究与分析工作。 文件详解 Results_Data_Collection_Professional_Networks_v1.0.xlsx:XLSX格式文件,包含专业网络数据收集的结果数据...
-
研究软件发现路径综述数据集
2025年12月23日 30 186 153
数据集概述 该数据集围绕研究软件发现路径展开分析,涵盖代码仓库、软件仓库、目录等多种路径类型,从内容、搜索功能、组织技术层面及项目评估选项等维度进行研究,包含结构化数据文件与综述文档,为研究软件发现机制提供支持。 文件详解 文件名称: Review of discovery pathways -...
-
机器学习数据集搜索行为调查数据集
2025年12月22日 30 28 1
数据集概述 本数据集是一项独立研究的成果,聚焦机器学习从业者对数据集的搜索与评估行为。包含预访谈问卷、访谈脚本及对应的调查和访谈结果数据,旨在为机器学习数据集元数据标准(如Croissant)的开发提供参考,以优化从业者工作流程并推动负责任人工智能实践。 文件详解 调查相关文件:...
-
实体消歧Agnus输入数据集
2025年12月20日 30 50 11
数据集概述 本数据集是用于实体消歧任务的输入数据集合,包含五个压缩文件,涵盖MSNBCt、AQUAINT、ACE2004t、KORE50、AIDA-Syn等不同来源或类型的实体消歧输入数据,为实体消歧算法的训练与测试提供基础数据支持。 文件详解 该数据集包含五个压缩文件,具体说明如下: - 文件名称及格式: -...
-
SciQA基准数据集及RDF转储数据
2025年12月19日 30 67 35
数据集概述 本数据集包含SciQA基准的问题与查询数据,分为人工构建(一百条)和自动生成(两千四百六十五条)两类问题。提供JSON格式的问题/查询文件及RDF NTriples格式的转储文件,支持导入RDF引擎进行查询分析。 文件详解 该数据集包含两个压缩文件,具体说明如下: - 文件名称: SciQA-...
-
Spotify_播放列表_Based_用户创建音乐内容分析完整数据
2025年12月13日 30 177 147
数据集概述 该数据集基于#nowplaying数据集中通过Spotify发布推文的用户子集,包含用户、其创建的播放列表及播放列表内的曲目信息,为音乐推荐相关研究提供结构化数据支持。 文件详解 文件名称: spotify_playlists.zip 文件格式: ZIP压缩包 包含内容: 压缩包内可能包含一个CSV格式的数据文件,字段包括:...
-
DebatePorts_Args_me_2019_Based_论点检索数据集完整数据
2025年12月9日 30 122 46
数据集概述 该数据集为args.me语料库1.0的已清理版本,包含2019年年中从Debatewise、IDebate.org、Debatepedia和Debate.org四个辩论门户网站爬取的382545条论点,为论点检索研究提供结构化数据支持。 文件详解 文件名称:argsme-1.0-cleaned.zip 文件格式:ZIP压缩包(.zip)...
-
Softcite数据集_研究出版物中的软件提及标注数据集
2025年12月4日 30 191 151
数据集概述 该数据集是研究出版物中软件提及的标注数据集,包含生物医学和经济学领域开放获取文献中的软件提及标注,涉及软件名称、版本、访问URL等信息,以TEI/XML格式存储,还包含描述数据集设计与创建过程的论文。 文件详解 文件名称:howisonlab/softcite-dataset-v1.0.zip 文件格式:ZIP压缩包 压缩包内包含:...
-
研究文章主题建模数据集
2025年6月1日 30 140 29
研究文章主题建模数据集 数据来源:互联网公开数据 标签:主题建模,机器学习,研究文章,分类任务,计算机科学,物理学,数学,统计学,定量生物学,定量金融 数据概述:...
-
项目管理实践标准文本分析数据集ProjectManagementPracticeStandardTextAnalysisDataset-maaouiabergaya
2025年4月29日 30 33 31
项目管理实践标准文本分析数据集ProjectManagementPracticeStandardTextAnalysisDataset-maaouiabergaya 数据来源:互联网公开数据 标签:项目管理, 文本分析, 实践标准, PMI, 知识管理, 语料库, 自然语言处理, 文本挖掘 数据概述:...



