-
COVID-19挑战论文分词数据集TokenizedWordsCOVID-19ChallengeDataset-omarkhalil27
COVID-19挑战论文分词数据集TokenizedWordsCOVID-19ChallengeDataset-omarkhalil27 数据来源:互联网公开数据 标签:COVID-19, 数据集, 文本处理, 自然语言处理, 机器学习, 医学研究, 学术资源, 文献分析 数据概述:... -
通用拼音输入法词库数据集GPNUAllWordsDataset-nazmuddhohaansary
通用拼音输入法词库数据集GPNUAllWordsDataset-nazmuddhohaansary 数据来源:互联网公开数据 标签:词库,输入法,数据集,中文,自然语言处理,语言资源,文本处理,机器学习 数据概述: 该数据集包含通用拼音输入法(GPNU)的完整词库数据,记录了中文词语及其对应的拼音信息。主要特征如下:... -
越南语句情感分析数据集-taitruong256
越南语句情感分析数据集-taitruong256 数据来源:互联网公开数据 标签:越南语,情感分析,NLP,数据集,文本处理,机器学习,自然语言处理,语言学 数据概述: 该数据集包含来自越南语的句子及其对应的情感标签,用于情感分析任务。主要特征如下: 时间跨度:数据记录的时间范围跨度不明确,但包含多个不同时期的越南语文本。... -
语言纠错词汇校对数据集LanguageCorrectionVocabularyCalibrationDataset-yeoyunsianggeremie
语言纠错词汇校对数据集LanguageCorrectionVocabularyCalibrationDataset-yeoyunsianggeremie 数据来源:互联网公开数据 标签:语言校对, 文本处理, 词汇纠错, 语法检查, 自然语言处理, 语言模型, 词典, 数据集 数据概述:... -
千言实体链接预处理数据集-kejiewang
千言实体链接预处理数据集-kejiewang 数据来源:互联网公开数据 标签:自然语言处理,实体链接,数据集,中文,文本处理,信息抽取,知识图谱,预处理 数据概述: 该数据集包含经过预处理的中文文本数据,旨在用于实体链接任务。数据的主要特征如下: 时间跨度:数据未明确标注时间范围,主要聚焦于文本内容本身。... -
评论翻译与校对数据集CommentsTranslationandProofreadingDataset-yamak1906
评论翻译与校对数据集CommentsTranslationandProofreadingDataset-yamak1906 数据来源:互联网公开数据 标签:自然语言处理,文本翻译,数据集,语言模型,机器学习,文本校对,机器翻译,文本处理 数据概述: 该数据集包含来自互联网的评论数据,记录了不同语言之间的评论翻译与校对信息。主要特征如下:... -
拉丁字母字母表数据集A-ZAlphabetDataset-pruthwirajghadge
拉丁字母字母表数据集A-ZAlphabetDataset-pruthwirajghadge 数据来源:互联网公开数据 标签:字母表,数据集,字符识别,机器学习,教育,计算机视觉,人工智能,文本处理 数据概述: 该数据集包含拉丁字母表中的字母数据,记录了A到Z每个字母的视觉表示或编码信息。主要特征如下:... -
聊天数据处理后的多模态数据集ChatDataProcessed-MPDataset-monicapatel2203
聊天数据处理后的多模态数据集ChatDataProcessed-MPDataset-monicapatel2203 数据来源:互联网公开数据 标签:多模态,聊天数据,文本处理,图像分析,音频处理,自然语言处理,机器学习,数据挖掘 数据概述: 该数据集包含经过处理的多模态聊天数据,整合了文本、图像和音频信息,旨在为多模态研究和应用提供支持。主要特征如下:... -
消费者评论摘要数据集Review-SumConsumerReviewSummaryDataset-harshalkarangale
消费者评论摘要数据集Review-SumConsumerReviewSummaryDataset-harshalkarangale 数据来源:互联网公开数据 标签:消费者评论,文本摘要,数据集,自然语言处理,情感分析,机器学习,文本处理,数据挖掘 数据概述:... -
机器学习模型训练与测试数据集MachineLearningModelTrainingandTestingDatasets-goldenlock
机器学习模型训练与测试数据集MachineLearningModelTrainingandTestingDatasets-goldenlock 数据来源:互联网公开数据 标签:机器学习, 模型训练, 测试数据集, 数据集, 文本处理, 图像识别, 结构化数据, TensorFlow 数据概述:... -
客户服务对话问答数据集CustomerServiceDialogueQuestionandAnswerDataset-franborjavalero
客户服务对话问答数据集CustomerServiceDialogueQuestionandAnswerDataset-franborjavalero 数据来源:互联网公开数据 标签:客户服务, 对话分析, 问答系统, 文本处理, 自然语言处理, 情感分析, 数据标注, 机器学习 数据概述:... -
Jigsaw翻译与清洗数据集JigsawTranslatedCleanedDataset-jerryqu
Jigsaw翻译与清洗数据集JigsawTranslatedCleanedDataset-jerryqu 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本分类,情感分析,机器学习,数据清洗,翻译数据,文本处理 数据概述:... -
歌词分割数据集SplitLyricDataset-lehoanglonglong
歌词分割数据集SplitLyricDataset-lehoanglonglong 数据来源:互联网公开数据 标签:歌词,文本处理,数据集,自然语言处理,机器学习,文本分割,音乐分析,歌词识别 数据概述: 该数据集包含来自多种来源的歌词文本,记录了不同歌曲的歌词内容,并将其分割成单词或短语。主要特征如下:... -
内容清洗数据集Content-CleanedDataDataset-trngththanhh
内容清洗数据集Content-CleanedDataDataset-trngththanhh 数据来源:互联网公开数据 标签:数据清洗,数据集,文本处理,自然语言处理,数据预处理,数据质量,机器学习,数据挖掘 数据概述: 该数据集包含经过清洗和标准化的文本数据,记录了从互联网公开来源收集的内容,并进行了去噪、去重和格式统一等处理。主要特征如下:... -
客户服务对话问答数据集CustomerServiceDialogueQuestionandAnswerDataset-ouchtoubaneabdou
客户服务对话问答数据集CustomerServiceDialogueQuestionandAnswerDataset-ouchtoubaneabdou 数据来源:互联网公开数据 标签:客户服务, 对话分析, 问答系统, 文本处理, 情感分析, 自然语言处理, 数据标注, 机器学习 数据概述:... -
维基百科如何文章摘要数据集WikiHowSummarizationDataset-varunucl
维基百科如何文章摘要数据集WikiHowSummarizationDataset-varunucl 数据来源:互联网公开数据 标签:自然语言处理,文本摘要,数据集,机器学习,人工智能,信息提取,文本处理,教育技术 数据概述: 该数据集包含来自维基百科“如何”类文章的文本及其对应的摘要,记录了各类操作指南和教程的详细内容和简明摘要。主要特征如下:... -
机器学习模型训练数据集MachineLearningModelTrainingDataset-ethanzhang9371
机器学习模型训练数据集MachineLearningModelTrainingDataset-ethanzhang9371 数据来源:互联网公开数据 标签:机器学习, 模型训练, 文本处理, 数据集, 预训练模型, 自然语言处理, 深度学习, 数据样本 数据概述:... -
孟加拉语文本分句与分割数据集BengaliTextSentenceSegmentationandSplitDataset-jjleesunny
孟加拉语文本分句与分割数据集BengaliTextSentenceSegmentationandSplitDataset-jjleesunny 数据来源:互联网公开数据 标签:孟加拉语, 文本处理, 分句, 文本分割, 自然语言处理, 语料库, 机器学习, 语言学 数据概述:... -
文本信息处理与索引数据集TextProcessingandIndexingDataset-aryanp2702
文本信息处理与索引数据集TextProcessingandIndexingDataset-aryanp2702 数据来源:互联网公开数据 标签:文本处理, 索引, 信息检索, 语料库, 关键词提取, 机器学习, 自然语言处理, 数据清洗 数据概述: 该数据集包含来自不同来源的文本数据,记录了经过处理的文本内容及其对应的索引信息。主要特征如下:... -
俄语推特情感分析数据集RussianTweetsSentimentAnalysisDataset-denislysov
俄语推特情感分析数据集RussianTweetsSentimentAnalysisDataset-denislysov 数据来源:互联网公开数据 标签:情感分析, 俄语, 文本处理, 自然语言处理, 机器学习, 文本预处理, 词干提取, 二分类 数据概述: 该数据集包含来自推特的俄语文本数据,用于情感分析研究。主要特征如下:...