找到55个数据集

标签: 词嵌入

过滤结果
  • 社交媒体文本语义相似度分析嵌入数据集

    2026年3月12日 30 142 3

    社交媒体文本语义相似度分析嵌入数据集_Social_Media_Text_Semantic_Similarity_Embedding_Dataset 数据来源:互联网公开数据 标签:文本相似度, 词嵌入, 自然语言处理, 社交媒体, 语义分析, 深度学习, GloVe, 嵌入向量 数据概述:...
    packageimg
  • 深度学习文本分类数据集

    2026年3月1日 0 1 0

    深度学习文本分类数据集_Deep_Learning_Text_Classification_Dataset 数据来源:互联网公开数据 标签:文本分类, 深度学习, 词嵌入, 情感分析, 文本预处理, 模型训练, 数据集, 自然语言处理 数据概述: 该数据集包含用于训练和评估深度学习文本分类模型的数据,适用于各种文本分类任务。主要特征如下:...
    packageimg
  • Tigrinya_Analogy_Test_词嵌入模型评估数据集

    2026年2月13日 30 157 89

    数据集概述 本数据集是提格利尼亚语版的谷歌类比测试集,用于评估词嵌入模型质量。数据经机器翻译后由母语者人工验证,剔除了不适用的条目,最终包含一万八千四百六十五条语义和句法类比条目,分为首都、货币、家庭、时态等九个测试小节。 文件详解 文件名称:TigrinyaAnalogyTest.zip 文件格式:ZIP...
    packageimg
  • Sentiment_Aligned_乌拉尔语系四语言情感分析与词嵌入数据_2023

    2026年1月15日 30 159 81

    数据集概述 本数据集包含厄尔兹亚语、科米-齐良语、莫克沙语和乌德穆尔特语四种乌拉尔语系语言的情感分析相关数据,包括对齐的情感标注数据、词嵌入向量、代码及情感分析模型,适用于低资源语言情感分析研究。 文件详解 情感标注数据文件 文件名称:sentiment_eval_data.json 文件格式:JSON...
    packageimg
  • Replication_Package_Discord开发者问答辅助研究复现包数据

    2026年1月15日 30 64 48

    数据集概述 本数据集是论文“On the Helpfulness of Answering Developer Questions on Discord with Similar Conversations and Posts from the...
    packageimg
  • 德国联邦宪法法院平衡语言使用分析附录与复现数据集

    2025年12月23日 30 157 19

    数据集概述 本数据集包含论文《平衡是否为司法能动主义的手段?德国联邦宪法法院平衡语言使用分析》的在线附录与复现数据,采用文本数据方法(如词嵌入)分析司法推理,验证平衡语言与司法能动主义的关联,为相关法律研究提供实证支持。 文件详解 文件名称: replication.zip 文件格式: ZIP压缩包 内容说明:...
    packageimg
  • Stanford_GloVe_6B_Based_多维度词向量预训练完整数据

    2025年12月21日 30 135 109

    数据集概述 本数据集为GloVe 6B词向量,基于维基百科2014和Gigaword 5语料(共60亿个词元)训练生成,包含40万个词汇,提供50维、100维、200维、300维四种维度的词向量,已转换为gensim二进制格式并压缩为ZIP文件。 文件详解...
    packageimg
  • 西班牙语历时词用法图数据集DWUG_ES

    2025年12月5日 30 70 15

    数据集概述 该数据集包含西班牙语的历时词用法图(WUGs),提供词用法随时间变化的结构化数据,支持语义变化研究。版本为4.0.2,含修正后的词上下文、索引及匿名化标注,通过压缩包形式存储。 文件详解 文件名称:dwug_es.zip 文件格式:ZIP压缩包...
    packageimg
  • 词向量语义分析数据集

    2025年10月20日 30 188 163

    词向量语义分析数据集_Word_Vector_Semantic_Analysis_Dataset 数据来源:互联网公开数据 标签:词向量, 语义分析, 自然语言处理, 文本挖掘, 机器学习, 词嵌入, 语言模型, 情感分析 数据概述: 该数据集包含预训练的词向量数据,记录了词汇的语义表示,适用于各种自然语言处理任务。主要特征如下:...
    packageimg
  • 深度学习文本数据训练数据集

    2025年8月10日 30 187 99

    深度学习文本数据训练数据集_Deep_Learning_Text_Data_Training_Dataset 数据来源:互联网公开数据 标签:文本分类, 深度学习, 词嵌入, 数据预处理, 训练集, 验证集, 测试集, 自然语言处理 数据概述: 该数据集包含用于深度学习模型训练和评估的文本数据。主要特征如下:...
    packageimg
  • 社交媒体用户文本语义相似度分析数据集

    2025年8月10日 30 118 74

    社交媒体用户文本语义相似度分析数据集_Social_Media_User_Text_Semantic_Similarity_Analysis 数据来源:互联网公开数据 标签:文本分析, 语义相似度, 词嵌入, 自然语言处理, 社交媒体, 数据挖掘, 机器学习, 向量空间模型 数据概述:...
    packageimg
  • 文本向量化词嵌入矩阵数据集_Text_Vectorization_Word_Embedding_Matrix

    2025年6月28日 30 48 0

    文本向量化词嵌入矩阵数据集_Text_Vectorization_Word_Embedding_Matrix 数据来源:互联网公开数据 标签:词嵌入, 文本向量化, 自然语言处理, 深度学习, 机器翻译, 文本分析, 词汇表, 嵌入矩阵 数据概述: 该数据集包含用于自然语言处理任务的词嵌入矩阵和词汇索引信息。主要特征如下:...
    packageimg
  • Reddit评论得分预测数据集-2021-ehallmar

    2025年6月4日 30 99 57

    Reddit评论得分预测数据集-2021-ehallmar 数据来源:互联网公开数据 标签:Reddit,评论,预测,机器学习,神经网络,BOW,词嵌入,LSTM,数据集,高赞评论,低赞评论 数据概述:...
    packageimg
  • 慕课视频讲座嵌入向量与主题分布数据集-200门课程-saurabhshahane

    2025年5月31日 30 16 13

    慕课视频讲座嵌入向量与主题分布数据集-200门课程-saurabhshahane 数据来源:互联网公开数据 标签:MOOC,慕课,视频讲座,自然语言处理,Word2Vec,LDA,Gensim,词嵌入,主题分布,教育,在线学习 数据概述:...
    packageimg
  • 蛋白质功能分析抽象嵌入与词汇表数据集2021-adarshr

    2025年5月31日 30 176 165

    蛋白质功能分析抽象嵌入与词汇表数据集2021-adarshr 数据来源:互联网公开数据 标签:蛋白质,功能分析,TF-IDF,词嵌入,词汇表,科学数据 数据概述: 本数据集名为“Abstract_embeds_final”,收录了蛋白质功能分析相关的研究抽象文本嵌入及词汇表信息。数据集中包含了蛋白质ID和对应的Go词汇表术语,用于构建TF-...
    packageimg
  • 土耳其新闻摘要句子数据集-serdarcaglar

    2025年5月31日 30 28 21

    土耳其新闻摘要句子数据集-serdarcaglar 数据来源:互联网公开数据 标签:土耳其,新闻摘要,自然语言处理,NLP,文本挖掘,语言模型,文本分类,文本聚类,词嵌入,文本提取 数据概述:...
    packageimg
  • 书籍标题文本向量数据集BookTitleTextVectorDataset-minorumorioka

    2025年5月31日 30 74 3

    书籍标题文本向量数据集BookTitleTextVectorDataset-minorumorioka 数据来源:互联网公开数据 标签:文本向量化, 词嵌入, 书籍标题, 自然语言处理, 语义分析, 数据降维, 机器学习, 语料库 数据概述: 该数据集包含书籍标题的文本数据及其对应的向量表示,旨在用于文本分析、语义理解和信息检索等任务。主要特征如下:...
    packageimg
  • 词向量共现关系分析数据集WordVectorCo-occurrenceRelationshipAnalysis-qsnlxy72

    2025年5月30日 30 50 0

    词向量共现关系分析数据集WordVectorCo-occurrenceRelationshipAnalysis-qsnlxy72 数据来源:互联网公开数据 标签:词向量, 自然语言处理, 文本分析, 共现矩阵, 词嵌入, 语义关系, 机器学习, 数据挖掘 数据概述: 该数据集包含用于词向量分析的文本数据,记录了词语之间的共现关系。主要特征如下:...
    packageimg
  • 越南语文本语料库构建与分析数据集VietnameseTextCorpusConstructionandAnalysis-dinhnhattruong

    2025年5月30日 30 181 152

    越南语文本语料库构建与分析数据集VietnameseTextCorpusConstructionandAnalysis-dinhnhattruong 数据来源:互联网公开数据 标签:越南语, 文本语料库, 文本分析, 自然语言处理, 语料库构建, 文本摘要, 词嵌入, 语言模型 数据概述:...
    packageimg
  • 梅西与罗纳尔多推特情感分析与词嵌入数据集-2021-ibrahimserouis99

    2025年5月7日 30 32 3

    梅西与罗纳尔多推特情感分析与词嵌入数据集-2021-ibrahimserouis99 数据来源:互联网公开数据 标签:推特,情感分析,词嵌入,GloVe,Sentiment140,梅西,罗纳尔多,社交媒体,数据分析 数据概述:...
    packageimg