-
用于流行病学事件提取的多语言数据集_LREC_2020
2026年1月30日 30 194 30
数据集概述 本数据集是LREC 2020论文《A Dataset for Multi-lingual Epidemiological Event Extraction》配套数据,包含多语言流行病学事件抽取语料,支持自然语言处理领域相关研究,以压缩包形式提供,仅含一个文件。 文件详解...
-
MappingTemplate_Based_语言无关知识图谱创建映射模板
2026年1月22日 30 36 16
数据集概述 本数据集为用于知识图谱创建的语言无关映射模板,提供标准化的映射规则框架,支持跨语言知识图谱构建流程。数据集包含一个文件,聚焦于知识图谱映射模板的结构化设计,适用于需要统一映射逻辑的知识图谱开发场景。 文件详解 文件名称:Template_SciKnow.xlsx 文件格式:XLSX...
-
Reproduction_Package_多语言跨语言剽窃检测评估复现数据
2026年1月21日 30 141 34
数据集概述 本数据集为学士学位论文《Multi-Language and Cross-Language Plagiarism Detection》的复现包,包含论文评估所用全部数据,可确保论文结果的持续复现。内容涵盖修改版JPlag工具、评估用数据集及自动化运行脚本,支持多语言和跨语言剽窃检测的技术验证与结果复现。 文件详解...
-
Spanish_Workers_Statute_Based_双语问答数据集
2026年1月21日 30 94 66
数据集概述 本数据集为西班牙语劳动法关键文件的双语问答数据集,包含150个问题及其对应答案,答案形式为西班牙《工人法规》130个部分中的条款编号及相关摘录。数据集支持信息检索与问答任务,共包含3个文件。 文件详解 Extracted Terminology of Spanish Worker Statute.txt 文件格式:TXT...
-
语音转换挑战赛2020听力测试数据集
2025年12月22日 30 17 11
数据集概述 本数据集包含2020年语音转换挑战赛(VCC 2020)中,用于跨语言语音转换任务的众包感知评估音频文件及原始听力测试评分,支持语音转换系统性能的主观评价研究。 文件详解 文件名称: nii-yamagishilab/VCC2020-listeningtest-v1.0.1.zip 文件格式: ZIP压缩包(.zip) 内容说明:...
-
欧洲语言社会科学叙词表2024
2025年12月22日 30 68 32
数据集概述 该数据集为欧洲语言社会科学叙词表(ELSST),覆盖政治学、社会学等十余门核心社会科学学科,包含约三千四百个概念,由欧洲社会科学数据档案联盟及其服务提供商发布,用于跨语言、跨资源的数据发现与访问。 文件详解 文件名称:ELSST_R5.ttl,格式:TTL,RDF三元组格式的叙词表数据文件...
-
跨语言缺陷定位数据集
2025年12月16日 30 197 194
数据集概述 该数据集是一个名为BuGL的跨语言缺陷定位数据集,主要用于缺陷定位相关研究。数据集以压缩包形式存储,未划分训练/测试集、数据/标签集或原始/处理数据,为相关领域提供了统一的跨语言缺陷定位数据支持。 文件详解 文件名称: BuGL.zip 文件格式: ZIP (.zip) 文件内容:...
-
不同语言系统谚语中女性形象解读数据集
2025年12月8日 30 138 72
数据集概述 本数据集聚焦不同语言系统谚语中的女性形象解读,通过单一PDF文档呈现相关研究内容,为分析跨语言文化中谚语对女性形象的建构提供资料支持。 文件详解 文件名称:Jumayeva Umida Aburahim kizi.pdf 文件格式:PDF(.pdf) 文件内容:包含关于不同语言系统谚语中女性形象解读的研究内容,具体结构需通过文档阅读确认...
-
跨语言数词系统构成结构数据集2025
2025年12月4日 30 194 177
数据集概述 该数据集呈现了2025年Rubehn等人关于跨语言数词系统构成结构的研究成果,包含数词系统构成结构的标注与推理相关数据,为计算语言类型学和多语言自然语言处理研究提供支持。 文件详解 文件名称:numeralbank/cosinus-v1.1.zip 文件格式:ZIP压缩包(.zip)...
-
文本相关性预测模型预测结果数据集
2025年9月12日 30 113 79
文本相关性预测模型预测结果数据集_Text_Relevance_Prediction_Model_Prediction_Results 数据来源:互联网公开数据 标签:文本匹配, 自然语言处理, 机器翻译, 语义理解, 深度学习, 模型预测结果, 跨语言, 数据分析 数据概述:...
-
国际新闻文本数据集
2025年7月30日 30 138 0
国际新闻文本数据集_International_News_Text_Data 数据来源:互联网公开数据 标签:新闻文本, 自然语言处理, 文本分析, 舆情分析, 情感分析, 跨语言, 新闻内容, 数据挖掘 数据概述: 该数据集包含来自CNN新闻频道的数据,记录了国际新闻报道的文本内容。主要特征如下:...
-
语言词源关系数据集-bilalelebi
2025年6月1日 30 67 6
语言词源关系数据集-bilalelebi 数据来源:互联网公开数据 标签:词源学,语言学,词汇,关系,跨语言,历史,文化,语义 数据概述:...
-
跨语言文本理解多任务数据集Cross-lingualTextUnderstandingMulti-taskDataset-gautamgupta007
2025年5月30日 30 132 98
跨语言文本理解多任务数据集Cross-lingualTextUnderstandingMulti-taskDataset-gautamgupta007 数据来源:互联网公开数据 标签:跨语言, 文本理解, 多任务学习, 机器翻译, 文本分类, 问答系统, 数据集, 自然语言处理 数据概述:...
-
印地语-英语平行语料库数据集-harshityadavjnu
2025年5月28日 30 172 46
印地语-英语平行语料库数据集-harshityadavjnu 数据来源:互联网公开数据 标签:机器翻译,自然语言处理,印地语,英语,语料库,语言学,文本分析,跨语言 数据概述:该数据集包含印地语和英语的平行文本数据,旨在用于机器翻译、跨语言信息检索等任务。主要特征如下: 时间跨度:数据记录的时间跨度不明确,取决于语料库的收集时间。...
-
印地语与英语文本摘要数据集HindiandEnglishTextSummarizationDataset-prajwal600
2025年5月20日 30 17 6
印地语与英语文本摘要数据集HindiandEnglishTextSummarizationDataset-prajwal600 数据来源:互联网公开数据 标签:文本摘要, 机器翻译, 印地语, 英语, 自然语言处理, 跨语言, 摘要生成, 文本分析 数据概述:...
-
多语言问答数据集MultilingualQuestionAnsweringDataset-kishalmandal
2025年5月18日 30 44 30
多语言问答数据集MultilingualQuestionAnsweringDataset-kishalmandal 数据来源:互联网公开数据 标签:问答系统, 机器阅读理解, 跨语言, 自然语言处理, 文本摘要, 知识获取, 印度语, 英语 数据概述: 该数据集包含来自MLQA (Multilingual Question Answering) 和...
-
跨语言视觉问答数据集Cross-lingualVisualQuestionAnsweringDataset-alhajiidibabate
2025年5月12日 30 59 13
跨语言视觉问答数据集Cross-lingualVisualQuestionAnsweringDataset-alhajiidibabate 数据来源:互联网公开数据 标签:视觉问答, 跨语言, 图像识别, 自然语言处理, 机器翻译, 图像检索, Hausa语, 英语 数据概述:...
-
多语言文本分类数据集MultilingualTextClassificationDataset-claudiovaliense
2025年5月7日 30 205 42
多语言文本分类数据集MultilingualTextClassificationDataset-claudiovaliense 数据来源:互联网公开数据 标签:文本分类, 多语言, 机器学习, 自然语言处理, 语料库, 情感分析, 跨语言, 数据集 数据概述: 该数据集包含多种语言的文本数据,旨在用于多语言文本分类任务。主要特征如下:...
-
印地语-尼泊尔语机器翻译平行语料数据集Hindi-NepaliMachineTranslationParallelCorpus-thenepaliguy
2025年5月1日 30 175 168
印地语-尼泊尔语机器翻译平行语料数据集Hindi-NepaliMachineTranslationParallelCorpus-thenepaliguy 数据来源:互联网公开数据 标签:机器翻译, 文本翻译, 印地语, 尼泊尔语, 平行语料, 语言模型, 自然语言处理, 跨语言 数据概述: 该数据集包含印地语-...
-
俄语平行语料机器翻译数据集Russian-EnglishParallelCorpusforMachineTranslation-riapush
2025年5月1日 30 69 50
俄语平行语料机器翻译数据集Russian-EnglishParallelCorpusforMachineTranslation-riapush 数据来源:互联网公开数据 标签:机器翻译, 俄语, 英语, 平行语料, 自然语言处理, 文本对齐, 语言模型, 跨语言 数据概述:...



