找到74个数据集

标签: 跨语言研究

过滤结果
  • COVID_Twitter_Based_巴西和美国COVID_19相关推文主题检测与情感分析数据集

    2026年1月7日   

    数据集概述 本数据集包含2020年4月17日至8月8日期间,巴西和美国与COVID-19相关的推特消息ID,分为葡萄牙语和英语两个文件,各约300万条ID。用户可通过ID下载完整推文对象,用于主题检测和情感分析研究。 文件详解 文件名称:covid-data-pt-unique-ids.zip 文件格式:ZIP...
    packageimg
  • 日本虚假新闻数据集

    2025年12月24日   

    数据集概述 该数据集为日本虚假新闻相关数据,包含一个压缩文件,未提供具体内容预览,可通过项目页面获取更多细节。 文件详解 文件名称: J-fakenews_v1.zip 文件格式: ZIP (.zip) 文件内容: 未提供具体内容预览,为压缩格式的数据集文件 适用场景 虚假新闻检测研究: 可用于训练和测试针对日语文本的虚假新闻识别模型...
    packageimg
  • DP连接是否总是复杂的_儿童格鲁吉亚语与匈牙利语视角的补充材料

    2025年12月24日   

    数据集概述 本数据集为论文《DP连接是否总是复杂的:儿童格鲁吉亚语与匈牙利语视角》的补充材料,包含实验设计文件、原始数据等内容,用于验证DP连接结构的儿童语言理解预测,挑战现有理论解释。 文件详解 README.md:文档格式,说明数据集包含的文件夹及内容,如实验设计、原始数据等信息 dataset.zip:压缩包格式,可能包含以下文件夹:...
    packageimg
  • 英语谚语乌兹别克语翻译方法

    2025年12月23日   

    数据集概述 本数据集围绕英语谚语的乌兹别克语翻译方法展开,核心内容为相关主题的PDF文档,为研究跨语言谚语翻译策略提供基础资料。 文件详解 文件名称: Mirzaahmedov Mirjalol Mansurjon ugli.pdf 文件格式: PDF 内容说明: 文档聚焦英语谚语向乌兹别克语翻译的方法,可能包含翻译策略、案例分析等核心内容。 适用场景...
    packageimg
  • 芬兰独立战争档案访谈记录数据集VAPSA

    2025年12月23日   

    数据集概述 该数据集包含芬兰国家档案馆收录的约六千份与芬兰独立战争相关的访谈记录数据,基于两次世界大战期间收集并归档的独立战争访谈记录建立,覆盖受访者个人信息及访谈相关档案信息。 文件详解 文档类文件(PDF格式): arkivenheter.pdf:档案单元说明文档 kaytetyt_arkistoyksikot.pdf:使用的档案单元说明文档...
    packageimg
  • 评估作为通用语言范畴的分类与表达方式研究文献

    2025年12月23日   

    数据集概述 本数据集包含一篇关于“评估”作为通用语言范畴的学术文献,重点探讨其分类体系与表达方式,为语言研究领域提供理论参考。 文件详解 文件名称: Shevtsova Olga Vladimirovna.pdf 文件格式: PDF (.pdf) 文件内容:...
    packageimg
  • 软件工程与开放式创新_产学研合作数据集

    2025年12月22日   

    数据集概述 本数据集围绕软件工程与开放式创新领域,聚焦产业、学术界与政府间的合作主题,包含盲审表格与问卷翻译文档两类文件,为相关研究提供基础资料。 文件详解 文件名称: RBIE 2025 - Blind Review.xlsx 文件格式: XLSX 内容说明: 可能为2025年相关项目或研究的盲审数据表格,用于记录评审信息 文件名称:...
    packageimg
  • 英语与乌兹别克语中_笑话_言语体裁的社会语言学研究数据集

    2025年12月22日   

    数据集概述 本数据集聚焦英语与乌兹别克语中的“笑话”言语体裁,将其作为社会语言学研究对象,包含相关研究内容的文档资料,为探究跨语言笑话体裁的社会语言学特征提供支持。 文件详解 文件名称:Diyora Avezmuratova.pdf 文件格式:PDF(.pdf)...
    packageimg
  • 基于俚语的委婉语作为英语_俄语和乌兹别克语的文化与语言标记数据集

    2025年12月22日   

    数据集概述 该数据集围绕英语、俄语和乌兹别克语中基于俚语的委婉语展开,聚焦其作为文化与语言标记的特征,包含一份PDF格式的研究文档,为跨语言文化与语言现象研究提供资料支持。 文件详解 文件名称: Dushatova Shohsanam Baxtiyor qizi.pdf 文件格式: PDF (.pdf) 文件内容:...
    packageimg
  • 英语_俄语和乌兹别克语谚语库中的社会价值观反映

    2025年12月21日   

    数据集概述 本数据集聚焦英语、俄语和乌兹别克语谚语库中的社会价值观反映,通过单一PDF文档呈现相关研究内容,为分析不同语言谚语所承载的社会文化价值提供资料支持。 文件详解 文件名称:Носирова Мубина Олимовна.pdf 文件格式:PDF(.pdf)...
    packageimg
  • 数据250种语言的否定并列连词数据库

    2025年12月21日   

    数据集概述 该数据集是针对250种语言样本构建的否定并列连词数据库,以PDF格式呈现,为语言类型学中否定结构的跨语言研究提供基础数据支持。 文件详解 文件名称: Database_of_negative_coordinators.pdf 文件格式: PDF (.pdf) 内容说明:...
    packageimg
  • 英语和乌兹别克语法律文本的元语言特征数据集

    2025年12月21日   

    数据集概述 本数据集包含一份关于英语和乌兹别克语法律文本元语言特征的文档,为研究两种语言法律文本的元语言特性提供了资料支持。 文件详解 文件名称: Raxmatova Bahora Ibodulla qizi.pdf 文件格式: PDF (.pdf) 文件内容: 该PDF文档可能围绕英语和乌兹别克语法律文本的元语言特征展开分析,具体内容需查阅文档获取。...
    packageimg
  • 印地语文本宣传数据集2023_Prop_HiT

    2025年12月21日   

    数据集概述 本数据集是针对印地语文本的宣传检测数据集,包含来自三十二家印地语新闻网站的七百九十篇文章,采用人工标注方式标记十八种宣传技术。数据按训练集(五百五十篇)和测试集(二百四十篇)划分,为印地语宣传内容识别研究提供结构化标注数据。 文件详解 该数据集包含以下文件: - 压缩包文件: - Prop-HiT Dataset.zip:...
    packageimg
  • Emozionalmente意大利语情感语音众包语料库

    2025年12月21日   

    数据集概述 该数据集是意大利语模拟情感语音众包语料库,包含431名业余演员录制的6902条带标签样本,覆盖愤怒、厌恶等六种基础情绪及中性状态,每条样本对应18个固定句子,标签反映演员的情感表达意图,为意大利语情感语音研究提供数据支持。 文件详解 文件名称: emozionalmente.zip 文件格式: ZIP压缩包 包含内容: 音频文件:...
    packageimg
  • 乌兹别克语_英语民间谚语中性别指标意义研究文档

    2025年12月20日   

    数据集概述 本数据集为单一PDF文档,聚焦乌兹别克语与英语民间谚语中的性别指标意义,通过对比分析两种语言谚语中性别相关表达的特征与文化内涵,为跨语言性别研究提供资料支持。 文件详解 文件名称: Rohilabonu G‘o‘chchiyeva.pdf 文件格式: PDF (.pdf) 文件内容: 包含乌兹别克语-...
    packageimg
  • 法律案例文档摘要数据集

    2025年12月19日   

    数据集概述 本数据集包含三个法律案例文档摘要数据集,分别为印度最高法院的抽象式摘要数据、印度最高法院的专家提取式摘要数据以及英国最高法院的抽象式摘要数据,用于支持法律文档摘要方法的研究与评估。 文件详解 README.md:Markdown格式文档,介绍数据集背景、包含的三个子数据集(IN-Abs、IN-Ext、UK-Abs)的来源及内容说明。...
    packageimg
  • 关于消防水带的文档

    2025年12月19日   

    数据集概述 本数据集包含一份PDF格式的文档,标题为“О ПОЖАРНЫХ РУКАВАХ”(关于消防水带),由Кадирова М.А.撰写,内容围绕消防水带相关主题展开。 文件详解 文件名称: Кадирова М.А. .pdf 文件格式: PDF (.pdf) 内容说明: 该文档标题为“О ПОЖАРНЫХ...
    packageimg
  • Objaverse_Не_пипай_Опасно_за_Живота_Based_危险警告主题完整数据集

    2025年12月15日   

    数据集概述 该数据集包含与“Не пипай! Опасно за Живота”主题相关的文件,主要由JPEG格式的图片文件和一个GLB格式的3D模型文件组成,未提供具体内容预览,数据未进行训练/测试、数据/标签等划分。 文件详解 图片文件(共5个): 文件名称:...
    packageimg
  • Umsuka英语_祖鲁语平行语料库

    2025年12月8日   

    数据集概述 该数据集是开源高质量英语-祖鲁语平行语料库,涵盖南非本土及国际英语语境,由专业译者翻译构建。包含10000组平行句对(各5000组双向翻译),并从每组中分离1000组作为评估集,祖鲁语评估集经双重翻译以计算人类水平BLEU分数。 文件详解 训练数据文件(CSV格式): zu-en.training.csv:祖鲁语-...
    packageimg
  • 俄语语音重音感知研究与语音识别技术应用

    2025年12月16日   

    数据集概述 本数据集聚焦俄语语音重音感知问题,结合语音识别技术,分析俄语作为外语学习者的语音特点,通过神经网络算法识别其语音偏差,评估重音对沟通质量的影响,为俄语教学提供实践建议。 文件详解 文件名称: Turg’unboyev Abdullajon Abdubanno o’g’li.pdf 文件格式: PDF (.pdf) 文件内容:...
    packageimg