-
词嵌入训练数据集-akalyasubramanian
词嵌入训练数据集-akalyasubramanian 数据来源:互联网公开数据 标签:自然语言处理,词嵌入,数据集,文本分析,机器学习,语义分析,文本挖掘,语言模型 数据概述: 该数据集包含用于训练词嵌入模型的大量文本数据,主要用于学习词语的语义表示。主要特征如下: 时间跨度: 数据记录的时间范围不限,涵盖了不同历史时期的文本数据。 地理范围:... -
自然语言处理文件数据集NLPFilesDataset-germanarley
自然语言处理文件数据集NLPFilesDataset-germanarley 数据来源:互联网公开数据 标签:自然语言处理,文本分析,数据集,机器学习,语言模型,语义分析,文本分类,人工智能 数据概述: 该数据集包含来自多个公开来源的自然语言处理相关文本文件,记录了不同类型的文本数据。主要特征如下:... -
古兰经数据集QuranDataDataset-raghadraghad
古兰经数据集QuranDataDataset-raghadraghad 数据来源:互联网公开数据 标签:古兰经,宗教,数据集,文本分析,语言学,文学,语义分析,伊斯兰研究 数据概述: 该数据集包含了古兰经的文本数据,适用于宗教研究,文本分析和语言学研究等任务。主要特征如下: 时间跨度:数据记录的时间范围覆盖了古兰经的成书时期及后续版本。... -
关系谓词预测数据集Relation-Predicate-PredictionDataset-perevalov540
关系谓词预测数据集Relation-Predicate-PredictionDataset-perevalov540 数据来源:互联网公开数据 标签:自然语言处理,关系预测,数据挖掘,语义分析,机器学习,知识图谱,人工智能,语言理解 数据概述: 该数据集专注于关系谓词预测任务,包含大量文本数据,记录了实体之间的关系和对应的谓词信息。主要特征如下:... -
密歇根大学自然语言处理数据集UMICHSI650NLPDataset-seesea0203
密歇根大学自然语言处理数据集UMICHSI650NLPDataset-seesea0203 数据来源:互联网公开数据 标签:自然语言处理,情感分析,数据集,文本分类,机器学习,语义分析,情感识别,语言技术 数据概述: 该数据集由密歇根大学SI650课程提供,主要记录了文本数据的情感倾向分类,适用于自然语言处理和情感分析任务。主要特征如下:... -
维基百科页面信息数据集WikipediaPageInformationDataset-mugentk
维基百科页面信息数据集WikipediaPageInformationDataset-mugentk 数据来源:互联网公开数据 标签:维基百科,数据集,文本分析,自然语言处理,知识图谱,信息检索,数据挖掘,语义分析 数据概述: 该数据集包含来自维基百科的页面信息,记录了维基百科中各个页面的详细信息。主要特征如下:... -
搜索关键词分类数据集-jahangirraina
搜索关键词分类数据集-jahangirraina 数据来源:互联网公开数据 标签:文本分类,关键词分析,自然语言处理,数据集,机器学习,信息检索,数据挖掘,语义分析 数据概述: 该数据集包含大量搜索关键词及其对应的分类标签,用于训练和评估文本分类模型。主要特征如下: 时间跨度:数据无明确的时间范围,通常为近期收集的关键词。... -
自然语言处理与相似度计算训练数据集ParmexTrainSpaCySimilarityDataset-agmeque
自然语言处理与相似度计算训练数据集ParmexTrainSpaCySimilarityDataset-agmeque 数据来源:互联网公开数据 标签:自然语言处理,相似度计算,数据集,文本分析,机器学习,深度学习,语义分析,信息检索 数据概述: 该数据集包含用于训练自然语言处理模型的数据,专注于文本相似度计算任务。主要特征如下:... -
语义相似度评估数据集LSASimilarityDataset-sagarrathore
语义相似度评估数据集LSASimilarityDataset-sagarrathore 数据来源:互联网公开数据 标签:语义分析,数据集,自然语言处理,文本相似度,机器学习,信息检索,学术研究,文本挖掘 数据概述: 该数据集包含来自多个来源的文本数据,记录了文本对之间的相似度评分,适用于语义相似度评估,文本聚类等任务。主要特征如下:... -
古兰经分段数据集Gen-Ref-SegmentedQuranDataset-abdo3id
古兰经分段数据集Gen-Ref-SegmentedQuranDataset-abdo3id 数据来源:互联网公开数据 标签:古兰经,数据集,文本分析,伊斯兰教,自然语言处理,语义分析,宗教研究,文本挖掘 数据概述: 该数据集包含经过分段处理的古兰经文本,旨在为文本分析和自然语言处理研究提供支持。主要特征如下:... -
新闻文章内容相似度分析矩阵数据集-manishkumar866115
新闻文章内容相似度分析矩阵数据集-manishkumar866115 数据来源:互联网公开数据 标签:新闻,文本分析,相似度,自然语言处理,机器学习,信息检索,文本挖掘,语义分析 数据概述: 该数据集包含新闻文章内容相似度分析矩阵数据,记录了不同新闻文章之间的相似度得分。主要特征如下: 时间跨度:数据记录的时间范围不明确,取决于新闻文章的发布时间。... -
元数据管理与知识图谱构建数据集MetzooPR2Dataset-eltongas2018
元数据管理与知识图谱构建数据集MetzooPR2Dataset-eltongas2018 数据来源:互联网公开数据 标签:数据管理,知识图谱,元数据,数据集,信息检索,机器学习,语义分析,数据处理 数据概述: 该数据集由Metzoo项目提供,专注于元数据管理和知识图谱构建任务。主要特征如下: 时间跨度:数据记录的时间范围从2018年到2020年。... -
基于翻译的文本释义数据集Paraphrase-Through-TranslationData-terrychanorg
基于翻译的文本释义数据集Paraphrase-Through-TranslationData-terrychanorg 数据来源:互联网公开数据 标签:文本释义,机器翻译,数据集,自然语言处理,语义分析,多语言,语言模型,深度学习 数据概述: 该数据集包含了通过机器翻译生成的文本释义数据,主要用于训练和评估文本释义模型。主要特征如下: 时间跨度:... -
图八标注文本数据集Figure-EightLabelledTextualDataset-manuelbenedicto
图八标注文本数据集Figure-EightLabelledTextualDataset-manuelbenedicto 数据来源:互联网公开数据 标签:文本标注,数据集,自然语言处理,机器学习,数据挖掘,语义分析,人工智能,信息提取 数据概述: 该数据集由图八公司(Figure-... -
英文文本意图分类数据集IntentClassificationDataset-jooni22
英文文本意图分类数据集IntentClassificationDataset-jooni22 数据来源:互联网公开数据 标签:自然语言处理,文本分类,数据集,机器学习,意图识别,语义分析,人工智能,NLP 数据概述: 该数据集包含了用于英文文本意图分类任务的标注数据,旨在帮助研究人员和开发者训练和评估文本意图识别模型。主要特征如下:... -
词义消歧数据集WSDData-abdelrahmanelbakouri
词义消歧数据集WSDData-abdelrahmanelbakouri 数据来源:互联网公开数据 标签:自然语言处理,词义消歧,数据集,语义分析,机器学习,文本分析,语言学,人工智能 数据概述: 该数据集包含了用于词义消歧(Word Sense Disambiguation,... -
瓦里纳情绪词汇数据集VADRatingsWarrinerDataset-josien
瓦里纳情绪词汇数据集VADRatingsWarrinerDataset-josien 数据来源:互联网公开数据 标签:情感分析,情绪词汇,数据集,心理学,自然语言处理,词汇评价,语义分析,机器学习 数据概述: 该数据集由瓦里纳等人收集和整理,包含了大量英语词汇的情感评分数据,用于情绪分析和情感计算研究。主要特征如下:... -
斯坦福情感树数据集SST5Dataset-mercyfausty
斯坦福情感树数据集SST5Dataset-mercyfausty 数据来源:互联网公开数据 标签:情感分析,自然语言处理,数据集,文本分类,深度学习,情感识别,NLP,语义分析 数据概述: 该数据集来自斯坦福大学,主要用于情感分析任务,包含了电影评论的细粒度情感标注。主要特征如下: 时间跨度:数据记录的时间跨度不明确,但涵盖了电影评论的时间范围。... -
Quora问答平台问题数据集QuoraQuestionsDataset-ayushshandilya15
Quora问答平台问题数据集QuoraQuestionsDataset-ayushshandilya15 数据来源:互联网公开数据 标签:问答平台,自然语言处理,数据集,文本分析,机器学习,语义分析,社交媒体,信息检索 数据概述: 该数据集包含来自Quora问答平台的问题数据,记录了用户提出的各种问题及其相关信息。主要特征如下:... -
关键词与句子关系分析数据集Keyword-SentencesDataset-maheshwarbhosale
关键词与句子关系分析数据集Keyword-SentencesDataset-maheshwarbhosale 数据来源:互联网公开数据 标签:自然语言处理,关键词提取,句子分析,数据集,文本挖掘,机器学习,语义分析,信息检索 数据概述: 该数据集包含关键词与句子之间的关系数据,记录了关键词在句子中的出现位置,语义关联等信息。主要特征如下:...