-
对话摘要生成任务数据集DialogueSummarizationTaskDataset-zeyneplda
对话摘要生成任务数据集DialogueSummarizationTaskDataset-zeyneplda 数据来源:互联网公开数据 标签:对话摘要, 文本生成, 自然语言处理, 对话分析, 机器翻译, 深度学习, 文本摘要, 语料库 数据概述: 该数据集包含对话文本及其对应的摘要信息,旨在用于对话摘要生成任务。主要特征如下:... -
电影评论情感分析数据集MovieReviewSentimentAnalysis-ahmedbashir99
电影评论情感分析数据集MovieReviewSentimentAnalysis-ahmedbashir99 数据来源:互联网公开数据 标签:情感分析, 文本分类, 电影评论, 自然语言处理, 情感极性, 机器学习, 数据标注, 语料库 数据概述:... -
软件代码变更语义分析语料库SoftwareCodeChangeSemanticAnalysisCorpus-zheungyik2015
软件代码变更语义分析语料库SoftwareCodeChangeSemanticAnalysisCorpus-zheungyik2015 数据来源:互联网公开数据 标签:代码变更, 语义分析, 软件工程, 机器学习, 文本挖掘, Java, C语言, 语料库 数据概述:... -
图书文本分类数据集BookTextClassificationDataset-kanishanand
图书文本分类数据集BookTextClassificationDataset-kanishanand 数据来源:互联网公开数据 标签:文本分类, 图书, 自然语言处理, 机器学习, 情感分析, 语料库, 行业分析, 数据标注 数据概述: 该数据集包含来自各类图书的文本内容,记录了图书的类别标签和对应的文本摘要。主要特征如下:... -
阿拉伯语文本校对数据集ArabicTextProofreadingDataset-muheshaam
阿拉伯语文本校对数据集ArabicTextProofreadingDataset-muheshaam 数据来源:互联网公开数据 标签:文本校对, 阿拉伯语, 文本纠错, 自然语言处理, 语言模型, 文本相似度, 机器学习, 语料库 数据概述:... -
电影评论情感分析数据集MovieReviewSentimentAnalysis-razaali10
电影评论情感分析数据集MovieReviewSentimentAnalysis-razaali10 数据来源:互联网公开数据 标签:情感分析, 文本分类, 电影评论, 自然语言处理, 机器学习, 二元分类, 数据标注, 语料库 数据概述: 该数据集包含来自电影评论的数据,记录了用户对电影的评价文本及其对应的情感标签。主要特征如下:... -
新闻标题文本分类数据集NewsHeadlineTextClassification-dhananjayr2289
新闻标题文本分类数据集NewsHeadlineTextClassification-dhananjayr2289 数据来源:互联网公开数据 标签:文本分类, 新闻标题, 自然语言处理, 情感分析, 类别识别, 机器学习, 数据标注, 语料库 数据概述: 该数据集包含来自新闻媒体的标题文本数据,记录了新闻标题及其对应的类别信息。主要特征如下:... -
文本分类语料数据集TextClassificationCorpus-jinsama
文本分类语料数据集TextClassificationCorpus-jinsama 数据来源:互联网公开数据 标签:文本分类, 自然语言处理, 语料库, 机器学习, 词向量, 文本特征, 深度学习, 数据集 数据概述: 该数据集包含用于文本分类任务的语料,记录了经过预处理的文本样本。主要特征如下: 时间跨度:数据未明确标注时间信息,可视为静态语料库。... -
新闻主题分类数据集NewsTopicClassificationDataset-reehan31
新闻主题分类数据集NewsTopicClassificationDataset-reehan31 数据来源:互联网公开数据 标签:新闻文本, 文本分类, 机器学习, 自然语言处理, 娱乐新闻, 数据集, BBC新闻, 语料库 数据概述: 该数据集包含来自英国广播公司(BBC)新闻的数据,记录了新闻文章的内容及其对应的类别标签。主要特征如下:... -
电影评论情感分析数据集MovieReviewSentimentAnalysis-akebono
电影评论情感分析数据集MovieReviewSentimentAnalysis-akebono 数据来源:互联网公开数据 标签:情感分析, 文本分类, 自然语言处理, 电影评论, 情绪识别, 机器学习, 语料库, 情感极性 数据概述: 该数据集包含来自互联网的电影评论数据,记录了电影评论文本及其对应的情感极性标签。主要特征如下:... -
安然公司邮件语料库EnronEmailCorpus数据集-minalray
安然公司邮件语料库EnronEmailCorpus数据集-minalray 数据来源:互联网公开数据 标签:邮件, 文本, 语料库, 自然语言处理, 金融, 能源, 文本挖掘, 商业 数据概述: 该数据集包含来自安然公司(Enron Corporation)内部员工的电子邮件数据,记录了公司运营期间的通信内容。主要特征如下:... -
印地语-英语平行语料库数据集Hindi-EnglishParallelCorpus-saumyamishra536
印地语-英语平行语料库数据集Hindi-EnglishParallelCorpus-saumyamishra536 数据来源:互联网公开数据 标签:机器翻译, 文本对齐, 语言模型, 印度语言, 语料库, 自然语言处理, 双语数据, 英语 数据概述: 该数据集包含来自互联网的印地语-... -
英国广播公司新闻文本分类数据集BBCNewsTextClassificationDataset-bedantikalahiri
英国广播公司新闻文本分类数据集BBCNewsTextClassificationDataset-bedantikalahiri 数据来源:互联网公开数据 标签:文本分类, 新闻分析, 自然语言处理, 语料库, 文本挖掘, 机器学习, 情感分析, 媒体报道 数据概述:... -
电影评论情感分析数据集MovieReviewSentimentAnalysis-zahidhasan00
电影评论情感分析数据集MovieReviewSentimentAnalysis-zahidhasan00 数据来源:互联网公开数据 标签:情感分析, 文本分类, 自然语言处理, 电影评论, 情感极性, 机器学习, 数据标注, 语料库 数据概述: 该数据集包含来自互联网的电影评论文本,记录了评论内容及其对应的情感极性标签。主要特征如下:... -
电影评论情感分析数据集MovieReviewSentimentAnalysis-konstantinilkov
电影评论情感分析数据集MovieReviewSentimentAnalysis-konstantinilkov 数据来源:互联网公开数据 标签:情感分析, 文本分类, 自然语言处理, 电影评论, 情感倾向性, 机器学习, 数据标注, 语料库 数据概述:... -
多语言文本分类训练数据集MultilingualTextClassificationTrainingDataset-jvkchaitanya410
多语言文本分类训练数据集MultilingualTextClassificationTrainingDataset-jvkchaitanya410 数据来源:互联网公开数据 标签:文本分类, 多语言, 机器翻译, 语言识别, 自然语言处理, 语料库, 文本挖掘, 数据标注 数据概述:... -
提示词指令微调数据集PromptInstructionFine-tuningDataset-eightina
提示词指令微调数据集PromptInstructionFine-tuningDataset-eightina 数据来源:互联网公开数据 标签:提示词, 指令微调, 自然语言处理, 大语言模型, 文本生成, 机器学习, 对话生成, 语料库 数据概述: 该数据集包含来自开源社区的提示词与对应指令示例,旨在用于大语言模型的指令微调。主要特征如下:... -
新闻文本复杂度分析与摘要生成数据集NewsTextComplexitySummarizationDataset-abdessamadmekkaoui
新闻文本复杂度分析与摘要生成数据集NewsTextComplexitySummarizationDataset-abdessamadmekkaoui 数据来源:互联网公开数据 标签:文本分析, 文本摘要, 可读性评估, 自然语言处理, 机器学习, 新闻文本, 复杂度分析, 语料库 数据概述:... -
情感分析文本情绪标注数据集SentimentAnalysisTextEmotionLabeling-batu9999
情感分析文本情绪标注数据集SentimentAnalysisTextEmotionLabeling-batu9999 数据来源:互联网公开数据 标签:情感分析, 文本分类, 情绪识别, 自然语言处理, 情感标注, 深度学习, 语料库, 情绪标签 数据概述: 该数据集包含从各种来源收集的文本数据,记录了不同文本片段所表达的情绪。主要特征如下:... -
新闻文本分类数据集NewsTextClassification-sainijagjit
新闻文本分类数据集NewsTextClassification-sainijagjit 数据来源:互联网公开数据 标签:文本分类, 新闻, 机器学习, 自然语言处理, 语料库, 文本挖掘, BBC, 多分类 数据概述: 该数据集包含来自英国广播公司(BBC)的新闻文本数据,记录了不同类别的新闻文章内容。主要特征如下:...