找到12个数据集

标签: 自然语言

过滤结果
  • NaturalProofs_Based_数学推理自然语言多源语料库数据

    2026年1月26日 30 44 34

    数据集概述 本数据集是用于研究自然语言中数学推理的多领域语料库,包含约三万条定理陈述及证明、一万五千条定义和两千页补充内容(如公理、推论),统一自ProofWiki、Stacks项目和数学教科书等来源,采用通用模式组织,支持非正式数学相关任务研究。 文件详解 LICENSE 文件格式:无扩展名 字段映射介绍:数据集许可文件,包含使用权限和版权相关说明...
    packageimg
  • NL2Fix_Supplementary_LLM漏洞修复评估补充材料数据

    2026年1月21日 30 180 52

    数据集概述 本数据集是论文“NL2Fix: Evaluating LLMs for Resolving Bugs From Natural Language Intent”的补充材料,包含两个压缩文件,涉及代码漏洞修复相关的嵌入数据和生成补丁数据,为LLM在自然语言意图驱动的漏洞修复任务中的评估提供支持。 文件详解 压缩文件包...
    packageimg
  • 从语音到交互界面_灯具文本指令数据集

    2025年12月22日 30 62 33

    数据集概述 该数据集包含一千二百七十二条针对应急灯具环境的指令样本,每条样本配有自然语言表达的提示文本。数据覆盖英语和西班牙语两个版本,英语版含训练、验证、测试集,西班牙语版仅含测试集。 文件详解 文件名称: data.zip 文件格式: ZIP (.zip) 文件内容:...
    packageimg
  • 词序作为语法现象的学术讲座文档2006

    2025年12月20日 30 45 3

    数据集概述 本数据集为2006年8月在立陶宛萨洛斯举办的Academia grammaticorum Salensis Tertia会议特邀讲座文档,主题围绕自然语言中词序的概念及功能展开,聚焦词序作为语法现象的核心研究。 文件详解 文件名称: Salos 2006.pdf 文件格式: PDF(.pdf) 文件内容:...
    packageimg
  • Kavuza等人2025年研究用视频小片段补充材料

    2025年12月18日 30 165 18

    数据集概述 本数据集为Kavuza等人2025年研究的补充材料,包含机器人外观(类人型、类机器型)与沟通风格(无语义表达、自然语言)的2×2组合视频小片段,以压缩包形式存储。 文件详解 文件名称:video_vignettes.zip 文件格式:ZIP压缩包(.zip)...
    packageimg
  • 标量含义研究方法扩展及其在游记中的应用文档

    2025年12月15日 30 63 19

    数据集概述 本数据集为一份关于标量含义研究方法扩展及其在游记中应用的文档,以PDF格式呈现,聚焦于标量含义研究方法的拓展及其实证应用场景。 文件详解 文件名称: Rakhmatova Mekhriniso Musinovna.pdf 文件格式: PDF (.pdf) 文件内容: 文档标题为《EXPANDING ON RESEARCH METHODS...
    packageimg
  • 英乌两种语言中多元分类法的话语本质研究论文

    2025年12月10日 30 36 21

    数据集概述 该数据集包含一篇关于英语和乌兹别克语中多元分类法话语本质的研究论文,以PDF格式呈现,聚焦两种语言中多元分类法的话语特征分析。 文件详解 文件名称: Nazarova Sevara Jakhongir qizi.pdf 文件格式: PDF (.pdf) 文件内容: 研究论文,主题为英乌两种语言中多元分类法的话语本质 适用场景 语言学研究:...
    packageimg
  • 英俄双语空间概念表达单元语义描述研究

    2025年12月6日 30 71 52

    数据集概述 本数据集为一份PDF文档,核心内容围绕英语和乌兹别克语中表达空间概念的语言单元的语义特征展开研究,可能包含两种语言空间概念表达的对比分析或语义描述框架。 文件详解 文件名称: Nizomova Nargiza Aliyevna.pdf 文件格式: PDF (.pdf) 文件内容:...
    packageimg
  • NIT项目-自然语言处理数据集NITProject-NaturalLanguageProcessingDataset-peculiarview

    2025年5月28日 30 78 70

    NIT项目-自然语言处理数据集NITProject-NaturalLanguageProcessingDataset-peculiarview 数据来源:互联网公开数据 标签:自然语言处理,NLP,数据集,文本分析,机器翻译,情感分析,信息抽取,文本分类 数据概述: 该数据集由NIT项目提供,包含了多种自然语言处理任务的文本数据。主要特征如下:...
    packageimg
  • 社交媒体语言词汇转换数据集SocialMediaLanguageVocabularyTransformation-elfiramayas

    2025年4月29日 30 93 49

    社交媒体语言词汇转换数据集SocialMediaLanguageVocabularyTransformation-elfiramayas 数据来源:互联网公开数据 标签:社交媒体, 文本处理, 词汇转换, 语言分析, 口语化, 数据清洗, 自然语言, 机器学习 数据概述:...
    packageimg
  • 欧洲议会代词数据集ItalianLanguagePronounDataset-harshitdhankhar

    2025年4月24日 30 42 28

    欧洲议会代词数据集ItalianLanguagePronounDataset-harshitdhankhar 数据来源:互联网公开数据 标签:语言处理,数据集,自然语言,机器学习,文本分析,意大利语,代词研究,多语言 数据概述: 该数据集来源于欧洲议会会议记录,专注于意大利语中的代词使用情况。主要特征如下:...
    packageimg
  • OCNLI中文自然语言训练数据集

    2024年11月10日 30 193 139

    OCNLI代表原始中文自然语言推论。它是中文自然语言推理的语料库,紧密按照MNLI的程序收集,但具有增强的策略,旨在实现更具挑战性的推理对。我们想强调的是,我们在创建数据集时没有使用人机翻译,因此我们的中文文本是原创的,没有翻译。
    packageimg