找到15个数据集

格式: ZIP 标签: 词义消歧

过滤结果
  • ChiWUG_Based_中文历时词使用图数据集_2023

    2026年1月29日 30 75 0

    数据集概述 本数据集包含中文历时词使用图(WUGs),聚焦词汇语义的历时变化分析。数据提供了图结构格式的词汇使用记录,可用于研究中文词汇在不同时间维度的语义演变规律,为中文词汇语义变化检测任务提供支撑。 文件详解 文件名称:chiwug.zip 文件格式:ZIP...
    packageimg
  • French_WSD_Based_Princeton_WordNet标识符法语词义消歧数据集

    2026年1月17日 30 152 63

    数据集概述 本数据集用于基于Princeton WordNet标识符的法语词义消歧任务,包含两个自动翻译并对齐的训练语料库(SemCor、WordNet Gloss Corpus),以及一个从SemEval 2013任务12转换而来的测试语料库,总计3个XML文件。 文件详解 训练语料库文件...
    packageimg
  • 俄语词义消歧语料库_RuSemCor

    2025年12月23日 30 25 11

    数据集概述 该数据集是一个为俄语设计的词义消歧语料库,通过WordNet进行语义标注,属于链接开放数据云(LLOD cloud)资源。包含标注数据文件和语料库归档文件,支持自然语言处理领域的词义消歧研究。 文件详解 文件名称: sense_annotations.tsv 文件格式: TSV (.tsv) 字段映射:...
    packageimg
  • 英语历时词用法图数据集_DWUG_EN

    2025年12月22日 30 97 63

    数据集概述 该数据集包含英语的历时词用法图(WUGs),记录词汇用法随时间的变化。数据格式、处理代码及更多相关资源可通过WUGsite获取,为研究词汇语义演变提供支持。 文件详解 文件名称:dwug_en.zip 文件格式:ZIP压缩包 内容说明:压缩包内包含英语历时词用法图的相关数据,具体文件结构与字段信息需解压后查看,未提供预览内容 适用场景...
    packageimg
  • 德语历时词汇使用图谱数据集

    2025年12月21日 30 101 26

    数据集概述 该数据集包含针对德语的历时词汇使用图谱(Diachronic Word Usage Graphs,WUGs),提供了词汇使用随时间变化的结构化数据。数据集以压缩包形式存储,可通过相关网站获取数据格式说明、处理代码及更多资源。 文件详解 文件名称: dwug_de.zip 文件格式: ZIP压缩包 内容说明:...
    packageimg
  • 瑞典历时词用法图数据集

    2025年12月20日 30 140 61

    数据集概述 本数据集包含针对瑞典语的历时词用法图(Diachronic Word Usage Graphs, WUGs),提供了瑞典语词汇使用随时间变化的结构化数据,可用于语言演变相关研究。 文件详解 文件名称: dwug_sv.zip 文件格式: ZIP压缩包 内容说明:...
    packageimg
  • 同形异义词与同音异义词关联数据集

    2025年12月11日 30 154 63

    数据集概述 本数据集聚焦于同形异义词与同音异义词的关联研究,包含一份PDF格式的相关文档,为语言文字领域中词汇语义与语音关系的分析提供基础资料。 文件详解 文件名称: Jurayeva Zulayxo Shamsiddinovna.pdf 文件格式: PDF(.pdf) 内容说明:...
    packageimg
  • 低资源语言监督式词义消歧数据集_Tattbabadhana

    2025年11月27日 30 142 111

    数据集概述 该数据集为低资源语言设计,包含基于"监督"(Tattbabadhana)方法的词义消歧(WSD)相关数据,以单一压缩文件形式存储,未提供具体拆分信息。 文件详解 文件名称: Tattbabadhana/nasiruddinetalTaln2015.tgz 文件格式: TGZ压缩文件(.tgz) 内容说明:...
    packageimg
  • 词义消歧标注数据集WordSenseDisambiguationAnnotationDataset-ekanshchauhan9

    2025年5月18日 30 2 0

    词义消歧标注数据集WordSenseDisambiguationAnnotationDataset-ekanshchauhan9 数据来源:互联网公开数据 标签:词义消歧, 自然语言处理, 语义理解, 语料库, 文本标注, 机器学习, 词义标注, 深度学习 数据概述:...
    packageimg
  • 印尼语词义标注语料一致性分析数据集IndonesianWordSenseAnnotationAgreementAnalysisDataset-misael...

    2025年5月14日 30 117 85

    印尼语词义标注语料一致性分析数据集IndonesianWordSenseAnnotationAgreementAnalysisDataset-misaeljonathann 数据来源:互联网公开数据 标签:词义消歧, 自然语言处理, 语料库, 标注数据, 一致性分析, 语言学, 文本分析, 印尼语 数据概述:...
    packageimg
  • 阿拉伯语语料情感分析标注数据集ArabicCorpusSentimentAnalysisAnnotationDataset-mohamedmakram

    2025年5月9日 30 41 15

    阿拉伯语语料情感分析标注数据集ArabicCorpusSentimentAnalysisAnnotationDataset-mohamedmakram 数据来源:互联网公开数据 标签:情感分析, 阿拉伯语, 文本分类, 语料库, 自然语言处理, 情感标注, 词义消歧, 机器翻译 数据概述:...
    packageimg
  • 词义消歧与词汇语义扩展数据集Dev-WSDDataset-ekanshchauhan9

    2025年4月26日 30 80 49

    词义消歧与词汇语义扩展数据集Dev-WSDDataset-ekanshchauhan9 数据来源:互联网公开数据 标签:自然语言处理,词义消歧,词汇语义,数据集,机器学习,语义分析,人工智能,语言技术 数据概述: 该数据集专注于词义消歧与词汇语义扩展研究,记录了多个词汇在不同上下文中的语义信息。主要特征如下:...
    packageimg
  • 英语词汇与定义数据集VAL-EN-DFDataset-bamps53

    2025年4月25日 30 56 51

    英语词汇与定义数据集VAL-EN-DFDataset-bamps53 数据来源:互联网公开数据 标签:英语词汇,定义,数据集,自然语言处理,词义消歧,语言学,文本分析,机器学习 数据概述: 该数据集包含了大量的英语词汇及其对应的定义,主要用于自然语言处理和语言学研究。主要特征如下: 时间跨度:数据记录的时间范围不限,持续更新。...
    packageimg
  • 词义消歧数据集WSDData-abdelrahmanelbakouri

    2025年4月24日 30 62 27

    词义消歧数据集WSDData-abdelrahmanelbakouri 数据来源:互联网公开数据 标签:自然语言处理,词义消歧,数据集,语义分析,机器学习,文本分析,语言学,人工智能 数据概述: 该数据集包含了用于词义消歧(Word Sense Disambiguation,...
    packageimg
  • 越南语词义消歧与情感分析数据集SegmentedABSAVLSP2018-hailong1610

    2025年4月24日 30 154 153

    越南语词义消歧与情感分析数据集SegmentedABSAVLSP2018-hailong1610 数据来源:互联网公开数据 标签:自然语言处理,情感分析,数据集,词义消歧,机器学习,越南语,文本分析,人工智能 数据概述: 该数据集来自2018年越南语言与处理研讨会(VLS P 2018),专注于越南语中的词义消歧和情感分析任务。主要特征如下:...
    packageimg