-
新闻摘要生成验证数据集NewsSummarizationValidationDataset-osamamahmoud14
新闻摘要生成验证数据集NewsSummarizationValidationDataset-osamamahmoud14 数据来源:互联网公开数据 标签:新闻摘要, 自然语言处理, 文本生成, 机器翻译, 文本摘要, 验证数据集, 深度学习, 语料库 数据概述:...
-
新闻文本分类数据集NewsTextClassificationDataset-abdulraffayali
新闻文本分类数据集NewsTextClassificationDataset-abdulraffayali 数据来源:互联网公开数据 标签:文本分类, 新闻分析, 自然语言处理, 机器学习, 文本挖掘, 语料库, 媒体报道, 类别标注 数据概述: 该数据集包含来自英国广播公司(BBC)的新闻文本,记录了不同类别的新闻文章内容。主要特征如下:...
-
新闻文本分类数据集NewsTextClassificationDataset-amunsentom
新闻文本分类数据集NewsTextClassificationDataset-amunsentom 数据来源:互联网公开数据 标签:新闻文本, 文本分类, 机器学习, 自然语言处理, 类别标签, 语料库, 文本分析, 舆情分析 数据概述:...
-
文本分类IAB类别标注数据集TextClassificationIABCategoryDataset-payne18
文本分类IAB类别标注数据集TextClassificationIABCategoryDataset-payne18 数据来源:互联网公开数据 标签:文本分类, IAB分类, 语料库, 自然语言处理, 机器学习, 类别预测, 文本标注, 语料分析 数据概述:...
-
自然语言处理Word2Vec模型文章标题数据集NaturalLanguageProcessingWord2VecModelArticleTitles-al...
自然语言处理Word2Vec模型文章标题数据集NaturalLanguageProcessingWord2VecModelArticleTitles-alisamalakhova 数据来源:互联网公开数据 标签:自然语言处理, 文本分析, 词嵌入, Word2Vec, Gensim, 机器学习, 文本挖掘, 语料库 数据概述:...
-
圣经文本行内容数据集BibleTextLineContent-vincentbutterfield
圣经文本行内容数据集BibleTextLineContent-vincentbutterfield 数据来源:互联网公开数据 标签:圣经, 文本分析, 宗教, 经典, 自然语言处理, 文本挖掘, 语料库, 文本行 数据概述: 该数据集包含来自圣经文本的数据,记录了圣经不同章节的文本行内容。主要特征如下:...
-
越南语用户意图识别数据集VietnameseUserIntentRecognitionDataset-daominhkhanh
越南语用户意图识别数据集VietnameseUserIntentRecognitionDataset-daominhkhanh 数据来源:互联网公开数据 标签:自然语言处理, 意图识别, 文本分类, 越南语, 机器学习, 情感分析, 数据标注, 语料库 数据概述:...
-
波斯语文本情感分析数据集PersianTextSentimentAnalysisDataset-anila1191399
波斯语文本情感分析数据集PersianTextSentimentAnalysisDataset-anila1191399 数据来源:互联网公开数据 标签:情感分析, 自然语言处理, 波斯语, 文本分类, 情绪识别, 机器学习, 语料库, 语言模型 数据概述: 该数据集包含波斯语文本数据,用于情感分析任务。主要特征如下:...
-
语音转录文本数据集SpeechTranscriptionTextDataset-sanjaymalladi29
语音转录文本数据集SpeechTranscriptionTextDataset-sanjaymalladi29 数据来源:互联网公开数据 标签:语音识别, 文本分析, 语音转录, 文本标注, 自然语言处理, 数据挖掘, 语料库, 文本校对 数据概述: 该数据集包含语音转录文本数据,记录了从语音文件中提取的文本内容。主要特征如下:...
-
项目管理实践标准文本分析数据集ProjectManagementPracticeStandardTextAnalysisDataset-maaouiabergaya
项目管理实践标准文本分析数据集ProjectManagementPracticeStandardTextAnalysisDataset-maaouiabergaya 数据来源:互联网公开数据 标签:项目管理, 文本分析, 实践标准, PMI, 知识管理, 语料库, 自然语言处理, 文本挖掘 数据概述:...
-
-
英语语料库词频与逆文档频率数据集EnglishCorpusFrequencyandIDFDataset-nataltiger26
英语语料库词频与逆文档频率数据集EnglishCorpusFrequencyandIDFDataset-nataltiger26 数据来源:互联网公开数据 标签:语料库,词频分析,逆文档频率,自然语言处理,数据集,文本挖掘,机器学习,信息检索 数据概述:...
-
错误标注泰米尔语语料库数据集Error-annotatedTamilCorpusDataset-neechalkaran
错误标注泰米尔语语料库数据集Error-annotatedTamilCorpusDataset-neechalkaran 数据来源:互联网公开数据 标签:自然语言处理,泰米尔语,语料库,错误标注,机器学习,语言技术,文本分析,数据挖掘 数据概述:该数据集包含来自泰米尔语的错误标注语料,记录了泰米尔语文本中的各类错误及其标注信息。主要特征如下:...
-
医学摘要文本分类数据集MedicalAbstractsTextClassificationCorpus-saharalaa
医学摘要文本分类数据集MedicalAbstractsTextClassificationCorpus-saharalaa 数据来源:互联网公开数据 标签:医学,摘要,文本分类,自然语言处理,机器学习,医疗健康,语料库,医学文献 数据概述: 该数据集包含来自医学文献的摘要文本,用于文本分类任务。主要特征如下:...
-
尼泊尔新闻文章摘要数据集-adarsh203
尼泊尔新闻文章摘要数据集-adarsh203 数据来源:互联网公开数据 标签:新闻文章,摘要,尼泊尔,自然语言处理,文本分析,机器学习,文本摘要,语料库 数据概述: 该数据集包含了尼泊尔新闻文章及其对应的摘要。主要特征如下: 时间跨度:数据记录的时间跨度不明确,取决于文章的发布时间。 地理范围:数据主要涵盖尼泊尔地区的新闻报道。...
-
数据5000语料树结构数据集5000ConstituencyandDependencyTreesDataset-pragyanshusingh01
5000语料树结构数据集5000ConstituencyandDependencyTreesDataset-pragyanshusingh01 数据来源:互联网公开数据 标签:语料库,句法分析,依存句法,数据集,自然语言处理,人工智能,语言学,计算机科学...
-
乌尔都语文本词频统计数据集-乌尔都语文本语料库
乌尔都语文本词频统计数据集-乌尔都语文本语料库 数据来源:互联网公开数据 标签:乌尔都语,文本分析,自然语言处理,词频统计,语料库,语言学,N-gram 数据概述: 本数据集基于在线报纸和书籍的抓取构建的乌尔都语语料库,包含了不同长度的N-gram及其对应的出现频率。数据文件包括:...
-
英语语言文本数据集LanguageDataDataset-danruan
英语语言文本数据集LanguageDataDataset-danruan 数据来源:互联网公开数据 标签:自然语言处理,文本分析,数据集,语言学,机器学习,文本挖掘,英语,语料库 数据概述: 该数据集包含来自多种来源的英语文本数据,记录了不同类型的英语文本内容。主要特征如下:...
-
文化遗产文本情感分析数据集-raghadsaeed
文化遗产文本情感分析数据集-raghadsaeed 数据来源:互联网公开数据 标签:文化遗产,文本分析,情感分析,自然语言处理,机器学习,文化研究,语料库,情感标注 数据概述:该数据集包含来自互联网的文化遗产相关文本,主要用于情感分析研究。主要特征如下: 时间跨度:数据记录的时间范围不固定,涵盖了不同时期和不同来源的文化遗产相关文本。...
-
印地语语流中断数据集HindiDisfluencyDataset-daspinaki
印地语语流中断数据集HindiDisfluencyDataset-daspinaki 数据来源:互联网公开数据 标签:语言处理,语料库,数据分析,语音识别,自然语言处理,机器学习,语言学,印地语 数据概述: 该数据集包含来自印地语的语流中断语音和文本数据,记录了印地语语音中的中断,重复,修正等非流畅现象。主要特征如下:...



