找到69个数据集

标签: 语言处理

过滤结果
  • S7_Data_利益相关者会议转录_研究工具开发数据

    2026年1月31日 30 141 6

    数据集概述 本数据集包含斯瓦希里语的匿名化公共利益相关者会议转录文本,主要用于研究工具开发,部分内容经翻译后用于研究结果的引文部分。数据集仅包含一个文档文件,无分层或拆分结构。 文件详解 文件名称:S7 Data. Public Stakeholders Meeting transcripts.docx 文件格式:DOCX...
    packageimg
  • OffensiveLang_Based攻击性语言数据集

    2026年1月31日 30 180 155

    数据集概述 本数据集为单文件归档的攻击性语言相关数据,文件类型为压缩包,未包含训练/测试、数据/标签或原始/处理等数据划分,无自述文件或内容预览可供参考。 文件详解 文件名称:OffensiveLang.zip 文件格式:ZIP(压缩包) 字段映射介绍:未提供压缩包内具体内容、字段及结构信息,仅可识别为归档文件类型。 适用场景...
    packageimg
  • TLS_Based_中国语言学词库_2024_07_23

    2026年1月30日 30 4 2

    数据集概述 本数据集为中国语言学词库(Thesaurus Linguae Sericae, TLS)的互联Markdown文件压缩包,包含一份2024年7月23日的词库数据压缩文件,无额外目录结构,主要用于语言学研究与词库应用场景。 文件详解 文件名称:tls-md-2024-07-23.zip 文件格式:ZIP...
    packageimg
  • Interference_Based_语言过程对歌词性非自愿音乐表象的干扰研究数据

    2026年1月15日 30 67 56

    数据集概述 本数据集来自《Journal of Cognitive Psychology》期刊文章,聚焦语言过程对歌词性非自愿音乐表象(INMI)的干扰研究,包含1个核心数据文件,为认知心理学领域相关研究提供结构化数据支持。 文件详解 文件名称:data1(translated)3.xlsx 文件格式:XLSX...
    packageimg
  • RIMES_Based_ICDAR_2011法语手写识别竞赛行片段数据集_2024公开版

    2026年1月13日 30 31 27

    数据集概述 本数据集为2011年ICDAR法语手写识别竞赛第二任务的行片段数据,是RIMES数据库的子集。包含12111行手写文本图像及12107条转录文本,覆盖超87k个单词实例,按标准划分训练、验证和测试集,用于支持手写文本识别研究。 文件详解 文件名称:RIMES-2011-Lines.zip 文件格式:ZIP(压缩包)...
    packageimg
  • 乌兹别克语沐浴设施说明文档

    2025年12月20日 30 87 57

    数据集概述 该数据集包含一份乌兹别克语文档,主题为面向学龄儿童的沐浴设施说明,具体涉及空气浴与日光浴相关内容。 文件详解 文件名称: Cho’poonova Sharifa Bozor qizi.pdf 文件格式: PDF (.pdf) 文件内容: 文档标题为“MAKTABGACHA TA'LIM YOSHIDAGI BOLALAR UCHUN...
    packageimg
  • 负向指称的积极面_语言处理与共同知识的延迟数据集

    2025年12月20日 30 14 9

    数据集概述 本数据集围绕负向指称(如“不是水母”)情境下,语言处理与共同知识在指称理解中的时间差异展开。通过视觉世界眼动追踪技术,记录参与者对两位说话者指令的实时反应,揭示初始语言处理与后续共同知识介入的延迟效应,支持语言处理可暂时独立于共同知识的观点。 文件详解 文件名称: README_for_DataScripts.pdf 文件格式: PDF...
    packageimg
  • 关于消防水带的文档

    2025年12月19日 30 23 20

    数据集概述 本数据集包含一份PDF格式的文档,标题为“О ПОЖАРНЫХ РУКАВАХ”(关于消防水带),由Кадирова М.А.撰写,内容围绕消防水带相关主题展开。 文件详解 文件名称: Кадирова М.А. .pdf 文件格式: PDF (.pdf) 内容说明: 该文档标题为“О ПОЖАРНЫХ...
    packageimg
  • 手势理解与二语听力_虚拟形象研究实验材料

    2025年12月18日 30 82 62

    数据集概述 本数据集为Valentijn Prové2024年博士论文《超越外国人话语:一语-二语互动中的多模态语库》的补充材料,包含论文第六章“手势理解与二语听力”实验所用的刺激材料,如视频和图片。 文件详解...
    packageimg
  • 花园路径句加工的干扰性研究数据集及分析脚本

    2025年12月9日 30 24 16

    数据集概述 本数据集包含论文《Beyond initial misanalysis: the disruptive nature of garden-path sentences processing》所用的实验数据与分析脚本,涉及花园路径句加工的干扰性研究,支持对句子理解过程中认知干扰机制的分析。 文件详解 Data and analytic...
    packageimg
  • 盲人与视力正常个体语言及语义处理模拟研究数据集

    2025年12月6日 30 28 17

    数据集概述 本数据集为补充性研究数据,基于神经生物学约束的皮层模型,模拟盲人与视力正常个体在动作及物体相关词汇语义习得过程中的细胞集合(CA)分布,旨在探究盲人视觉皮层参与语言处理的神经机制。 文件详解 核心数据文件: CA_Structure_Blind VS...
    packageimg
  • Jigsaw比赛前序精选原始数据集

    2025年6月1日 30 124 15

    Jigsaw比赛前序精选原始数据集 数据来源:互联网公开数据 标签:Jigsaw,比赛数据,文本分析,机器学习,评论数据,语言处理,数据集,社交平台评论,情感分析 数据概述:...
    packageimg
  • JovemNerdNerdcast节目文字转录数据集-2024年3月18日-leonardocosta1206

    2025年5月31日 30 82 67

    JovemNerdNerdcast节目文字转录数据集-2024年3月18日-leonardocosta1206 数据来源:互联网公开数据 标签:Jovem Nerd, Nerdcast, 文字转录, 节目内容, 语言处理, 机器学习, 数据分析 数据概述: 本数据集收录了Jovem...
    packageimg
  • 阿拉伯语情感评论数据集ArabicSentimentReviewsDataset-ahmedelsany

    2025年5月29日 30 14 5

    阿拉伯语情感评论数据集ArabicSentimentReviewsDataset-ahmedelsany 数据来源:互联网公开数据 标签:情感分析,自然语言处理,数据集,机器学习,文本挖掘,语言处理,机器翻译,阿拉伯语 数据概述: 该数据集包含来自阿拉伯语社交媒体平台和在线评论网站的情感评论数据,记录了用户对产品、服务或内容的情感表达。主要特征如下:...
    packageimg
  • 印度尼西亚新闻社交媒体文本数据集IndonesiaNewsSocialMediaText-iannarsa

    2025年5月29日 30 170 9

    印度尼西亚新闻社交媒体文本数据集IndonesiaNewsSocialMediaText-iannarsa 数据来源:互联网公开数据 标签:社交媒体, 文本分析, 新闻内容, 舆情分析, 情感分析, 印度尼西亚, 语言处理, 传播分析 数据概述:...
    packageimg
  • 罗马化泰卢固语数据集RomanizedTeluguDataset-teachingmachine

    2025年5月28日 30 107 72

    罗马化泰卢固语数据集RomanizedTeluguDataset-teachingmachine 数据来源:互联网公开数据 标签:语言处理,泰卢固语,罗马化,数据集,自然语言处理,文本分析,语言学,机器翻译 数据概述: 该数据集包含罗马化泰卢固语文本数据,记录了泰卢固语词汇、短语或句子的罗马化转写。主要特征如下:...
    packageimg
  • 考试语音识别数据集ExamSpeechRecognitionDataset-hassanoubrahim

    2025年5月28日 30 19 18

    考试语音识别数据集ExamSpeechRecognitionDataset-hassanoubrahim 数据来源:互联网公开数据 标签:语音识别,数据集,教育技术,机器学习,人工智能,语言处理,教育研究,技术评估 数据概述: 该数据集包含来自教育场景的语音识别数据,记录了学生在考试环境中的语音样本和对应的文本转录。主要特征如下:...
    packageimg
  • 通用英语语法纠错数据集GeneralEnglishCorrectionDataset-ajoydey00001

    2025年5月28日 30 48 15

    通用英语语法纠错数据集GeneralEnglishCorrectionDataset-ajoydey00001 数据来源:互联网公开数据 标签:自然语言处理,语法纠错,数据集,机器学习,文本分析,教育技术,语言处理,智能写作 数据概述: 该数据集专注于英语语法纠错任务,包含大量英语文本及其对应的语法错误标注和修正建议。主要特征如下:...
    packageimg
  • 孟加拉语手写字符数据集BanglalekhaIsolated5Classes数据集-ferdouszislam

    2025年5月28日 30 49 10

    孟加拉语手写字符数据集BanglalekhaIsolated5Classes数据集-ferdouszislam 数据来源:互联网公开数据 标签:手写识别,数据集,图像分析,机器学习,计算机视觉,孟加拉语,字符识别,语言处理 数据概述: 该数据集包含来自孟加拉语手写字符的图像,涵盖了5个不同类别的字符。主要特征如下:...
    packageimg
  • 孟加拉语情感分析数据集BanglaLoveDataset-fuadfab

    2025年5月12日 30 77 2

    孟加拉语情感分析数据集BanglaLoveDataset-fuadfab 数据来源:互联网公开数据 标签:情感分析,自然语言处理,数据集,机器学习,文本分类,孟加拉语,语言处理,情感计算 数据概述: 该数据集包含来自互联网公开渠道的孟加拉语文本数据,记录了用户在不同平台上的情感表达。主要特征如下: 时间跨度:数据记录的时间范围从2019年到2022年。...
    packageimg