-
AntConc_Based_关键词索引文件数据
2026年2月1日 30 70 46
数据集概述 本数据集包含通过AntConc工具结合自定义停用词表生成的15个KWIC(关键词上下文)相关文件,覆盖德语、日语、非洲、女性等主题,包含文本文件、配置文件和表格文件三类,主要用于展示关键词在文本中的左右上下文信息。 文件详解 文档文件(.txt格式,13个)...
-
标注数据集_1986年切尔诺贝利核灾难_荷兰电视新闻
2026年1月31日 30 107 45
数据集概述 本数据集是论文“Speech-to-Local Data: Exploring ASR Files of Archived Television News (2004-2028) on the 1986 Chernobyl Nuclear...
-
Surrage_Ghezzi_免疫相关新闻视频编码数据
2026年1月31日 30 109 52
数据集概述 本数据集为论文“Use of immunology in news and YouTube videos in the context of COVID-19: politicization and information bubbles”的原始数据,包含意大利语和英语中与COVID-19免疫相关的新闻文章和视频的编码信息,共1个文件。...
-
iCOn_MICs_COST_漫画与教育调查数据2024
2026年1月30日 30 59 50
数据集概述 本数据集是COST项目iCOn-MICs第5工作组“漫画与教育”研究的组成部分,聚焦葡萄牙语和西班牙语语境下的漫画教育研究概况。数据集通过标准化调查形式,系统收集相关研究数据,为教育领域漫画应用研究提供结构化参考资料,仅包含一个文件。 文件详解 文件名称:ICon MICs WG5 Encuesta Cómic y Educación...
-
CONTRAST_IT_Based_西班牙语报纸文章语料库数据
2026年1月28日 0 106 81
数据集概述 本数据集是CONTRAST-IT多语言语料库的西班牙语部分,包含2011-2012年来自西班牙《国家报》(elpais.com)和《世界报》(elmundo.es)的476篇完整新闻文章,总字数约30万字,文本具有当代西班牙语报纸语言代表性,用于构建对比语言学研究用的语料库。 文件详解 文件组:CONTRAST-IT西班牙语新闻文章集...
-
NewsSR_Based_塞尔维亚新冠疫情早期新闻语料库_多格式版
2026年1月27日 30 6 0
数据集概述 本数据集为塞尔维亚主要日报及新闻门户网站在新冠疫情早期(2020年3月至9月)发布的疫情相关新闻文章语料库,含纯文本版及带完整元数据的XML版,还配套有公民元语言评论语料库Covid-NEWS-Comm-SR,另有斯洛文尼亚和克罗地亚的平行版本。 文件详解 压缩文件1: 文件名称:SR xml.zip 文件格式:ZIP...
-
TeleSUR_Based_2023_2024新闻文章来源与推文分析数据
2026年1月21日 30 195 76
数据集概述 本数据集包含2023年1月至2024年12月期间TeleSUR西班牙语和英语网站的新闻文章存档,由民主安全联盟于2025年1月通过公开WordPress端点抓取。涵盖西班牙语文章14,758篇、英语文章6,722篇,提取了每篇文章的来源、作者及嵌入推文信息,用于分析TeleSUR的外部影响因素。 文件详解...
-
RAC_Editorial_Tables_2018_管理学期刊社论表格数据
2026年1月21日 30 182 165
数据集概述 本数据集包含《RAC-当代管理评论》2018年第22卷第4期社论的配套表格,提供葡萄牙语和英语两个语言版本,共2个文件,均为DOCX格式,无目录层级结构,未包含训练/测试、数据/标签或原始/处理等数据拆分。 文件详解 文件1:Tables Editorial RAC 22(4)2018.docx 文件格式:DOCX...
-
CONTRAST_IT_Based意大利语新闻语料库数据集2011_2012
2026年1月20日 30 171 113
数据集概述 本数据集为CONTRAST-IT多语言语料库的意大利语部分,包含2011-2012年从意大利三家电子日报(repubblica.it、lastampa.it、corriere.it)采集的531篇真实新闻文章,总计约三十万字,覆盖政治、体育、科技等多个主题,用于多语言对比语言学研究。 文件详解 意大利语新闻文章文件...
-
BASE_EDUCATIONAL_QUALITY_学校教育质量研究文献数据库2017_2022
2026年1月12日 30 77 75
数据集概述 本数据集为2017至2022年学校教育质量主题的研究文献数据库,包含2个文件,分别为英文和西班牙文版本的Excel文件,无目录结构,未划分训练/测试集、数据/标签或原始/处理数据,文件类型统一为.xlsx格式。 文件详解 文件名称:BASE_EDUCATIONAL QUALITY_2017-2022_FINAL_ENGLISH...
-
dictionaria_palula_Based_Palula语言词典数据2019
2026年1月15日 30 55 44
数据集概述 本数据集为Palula语言词典,由Henrik Liljegren于2019年发布,收录于Dictionaria第3卷,共1-2700页。数据以压缩包形式提供,包含Palula语言的词典内容,是研究Palula语言的重要资源。 文件详解 文件名称:dictionaria/palula-v1.2.zip 文件格式:ZIP...
-
阿英德三种语言名词性句子比较分析数据集
2025年12月20日 30 86 22
数据集概述 该数据集包含一篇关于阿拉伯语、英语和德语名词性句子的比较分析文档,旨在探索三种语言名词性句子的相似性与差异,为语言结构对比研究提供资料支持。 文件详解 文件名称:Kholmatova Elnura Sherali qizi.pdf 文件格式:PDF...
-
乌兹别克语生态相关文档_Anvarbekov_Islombek
2025年12月21日 30 195 120
数据集概述 该数据集包含一份以乌兹别克语撰写的、主题与生态学相关的文档,文档标题为“O'RMONCHILIKNING EKOLOGIYA UCHUN AHAMIYATI”,可能探讨林业在生态方面的重要性。 文件详解 该数据集包含一个PDF格式的文档文件,具体如下: - 文件名称: Anvarbekov Islombek.pdf - 文件格式: PDF...
-
瑞典历时词用法图数据集
2025年12月20日 30 78 47
数据集概述 本数据集包含针对瑞典语的历时词用法图(Diachronic Word Usage Graphs, WUGs),提供了瑞典语词汇使用随时间变化的结构化数据,可用于语言演变相关研究。 文件详解 文件名称: dwug_sv.zip 文件格式: ZIP压缩包 内容说明:...
-
意大利情感词典Sentix数据集
2025年12月18日 30 7 4
数据集概述 本数据集为意大利语情感词典Sentix的压缩文件,包含一个情感词典相关的压缩包,可用于意大利语文本的情感分析相关研究与应用。 文件详解 文件名称: valeriobasile/sentix-v3.0.zip 文件格式: ZIP压缩包(.zip) 文件内容: 压缩包内包含Sentix意大利语情感词典相关数据,具体内容需解压后查看 适用场景...
-
东道主球队概念多语言语料数据集2019
2025年12月16日 30 110 54
数据集概述 本数据集包含2019年国际冰球联合会(IIHF)冰球世锦赛期间,德、英、俄三种语言媒体报道中表达“东道主球队”概念的语料库,数据来源于三国主流媒体网页文章。 文件详解 文件名称:TEAM OF HOST COUNTRY - GERMAN 2019.pdf,格式:PDF,内容:2019年德国媒体报道中关于东道主球队概念的德语语料...
-
开罗瓦斯特巴拉德地区伊芙琳阿拉伯语及法语录音描述与评论转录数据集20130529
2025年12月11日 30 139 32
数据集概述 本数据集包含2013年5月29日于埃及开罗瓦斯特巴拉德地区采集的录音转录文本,涉及参与者伊芙琳对自身双耳录音路线的描述与评论,提供阿拉伯语原文及法语译文版本,支持城市声音感知相关研究。 文件详解 压缩文件:Archive Word docs Arabic & French transcript of description and...
-
德国蝴蝶监测公民科学项目问卷数据集
2025年12月11日 30 37 22
数据集概述 该数据集包含德国蝴蝶监测公民科学项目参与者的问卷结果,涵盖英文和德文版本的问卷文档及结构化数据文件,为了解参与者对该项目的反馈提供基础数据支持。 文件详解 该数据集包含三个文件,具体说明如下: - 问卷文档文件: - Questionnaire_TMD_english.pdf:PDF格式,英文版本的蝴蝶监测项目问卷文档 -...
-
英语_乌兹别克语和俄语语言世界图景中的_HEAD_ГОЛОВА_БОШ_概念数据集
2025年12月9日 30 71 15
数据集概述 本数据集聚焦英语、乌兹别克语和俄语中"HEAD/ГОЛОВА/БОШ"概念在语言世界图景中的体现,以单一PDF文档形式呈现相关研究内容,为对比分析不同语言中头部概念的语义与文化内涵提供资料支持。 文件详解 文件名称: Юсупжанова Ф.К.pdf 文件格式: PDF (.pdf) 内容说明:...
-
名词复合词组合性数据集
2025年12月6日 30 35 24
数据集概述 该数据集包含英语、法语和巴西葡萄牙语三种语言的名词复合词组合性评分数据,以及葡萄牙语复合词的词汇替换扩展标注。评分由母语者完成,涵盖整体及各构词成分的组合性;扩展数据包含词汇替换候选及分类,支持多语言词汇语义研究。 文件详解 该数据集包含压缩包和说明文档,具体如下: - 组合性评分数据集压缩包: - comp-datasets-...



