-
电影钢铁侠角色对话数据集Movie-IronMan-CharacterDialogue-prprakash02
电影钢铁侠角色对话数据集Movie-IronMan-CharacterDialogue-prprakash02 数据来源:互联网公开数据 标签:电影,剧本,对话,角色,文本分析,自然语言处理,钢铁侠,语料库 数据概述: 该数据集包含电影《钢铁侠》中的角色对话文本,记录了不同角色在电影中的对白内容。主要特征如下:... -
阿拉伯语文本情感分析数据集ArabicTextSentimentAnalysisDataset-imeneamyy
阿拉伯语文本情感分析数据集ArabicTextSentimentAnalysisDataset-imeneamyy 数据来源:互联网公开数据 标签:情感分析, 阿拉伯语, 文本分类, 自然语言处理, 情感极性, 语料库, 机器学习, 语言学 数据概述: 该数据集包含阿拉伯语文本数据,记录了文本的情感倾向。主要特征如下:... -
日常对话情感识别数据集DailyDialogueEmotionRecognitionDataset-va6573
日常对话情感识别数据集DailyDialogueEmotionRecognitionDataset-va6573 数据来源:互联网公开数据 标签:情感分析, 自然语言处理, 文本分类, 对话系统, 情感识别, 机器学习, 语料库, 情感标注 数据概述: 该数据集包含来自日常对话的数据,记录了对话文本及其对应的情感标签。主要特征如下:... -
仇恨言论检测文本数据集HateSpeechDetectionTextDataset-barunikarthika
仇恨言论检测文本数据集HateSpeechDetectionTextDataset-barunikarthika 数据来源:互联网公开数据 标签:仇恨言论, 文本分类, 情感分析, 机器学习, 自然语言处理, 语料库, 数据标注, 社交媒体 数据概述: 该数据集包含来自社交媒体的文本数据,记录了用于识别仇恨言论的样本。主要特征如下:... -
文本聚类分析K-Means数据集TextClusteringAnalysisK-MeansDataset-amitgayar
文本聚类分析K-Means数据集TextClusteringAnalysisK-MeansDataset-amitgayar 数据来源:互联网公开数据 标签:文本聚类, K-Means, 词频统计, 自然语言处理, 数据清洗, 文本分析, 机器学习, 语料库 数据概述:... -
英语-马拉雅拉姆语平行语料库数据集English-MalayalamParallelCorpus-alakaru
英语-马拉雅拉姆语平行语料库数据集English-MalayalamParallelCorpus-alakaru 数据来源:互联网公开数据 标签:机器翻译, 语料库, 双语对照, 自然语言处理, 语言学, 文本数据, 英语, 马拉雅拉姆语 数据概述: 该数据集包含英语和马拉雅拉姆语的平行文本,用于机器翻译和跨语言分析。主要特征如下:... -
阿拉伯语文本转写与标注数据集ArabicTextTranscriptionandAnnotation-mariamfaroukgadalla
阿拉伯语文本转写与标注数据集ArabicTextTranscriptionandAnnotation-mariamfaroukgadalla 数据来源:互联网公开数据 标签:阿拉伯语,文本转录,语音识别,自然语言处理,文本标注,语言学,语料库,数据清洗 数据概述:... -
文学作品作者识别数据集LiteraryWorksAuthorIdentification-lohitashwavaswani
文学作品作者识别数据集LiteraryWorksAuthorIdentification-lohitashwavaswani 数据来源:互联网公开数据 标签:文本分析, 作者识别, 自然语言处理, 文本分类, 文学作品, 数据集构建, 机器学习, 语料库 数据概述:... -
政治新闻文本数据集PoliticalNewsTextDataset-nekuitiefangbiediant
政治新闻文本数据集PoliticalNewsTextDataset-nekuitiefangbiediant 数据来源:互联网公开数据 标签:政治, 新闻, 文本, 语料库, 自然语言处理, 文本分析, 政治评论, 数据清洗 数据概述: 该数据集包含从Wikinews收集的政治新闻文本,主要记录了政治相关的新闻报道和评论文章。主要特征如下:... -
多语言社交媒体内容分析数据集MultilingualSocialMediaContentAnalysisDataset-zakubovich
多语言社交媒体内容分析数据集MultilingualSocialMediaContentAnalysisDataset-zakubovich 数据来源:互联网公开数据 标签:社交媒体, 文本分析, 多语言, 内容分类, 情感分析, 机器翻译, 数据清洗, 语料库 数据概述:... -
新闻文本分类数据集NewsTextClassificationDataset-paramvir705
新闻文本分类数据集NewsTextClassificationDataset-paramvir705 数据来源:互联网公开数据 标签:文本分类, 新闻, 自然语言处理, 机器学习, 政治, 经济, 语料库, 文本分析 数据概述: 该数据集包含来自新闻报道的文本内容,用于文本分类任务,旨在将新闻文章按照主题进行划分。主要特征如下:... -
社交媒体推文摘要生成数据集SocialMediaTweetSummarizationDataset-sarthakharne
社交媒体推文摘要生成数据集SocialMediaTweetSummarizationDataset-sarthakharne 数据来源:互联网公开数据 标签:推文摘要, 自然语言处理, 文本生成, 社交媒体, 文本相似度, 数据清洗, 机器学习, 语料库 数据概述:... -
西班牙语问答语料库SpanishQuestionAnsweringCorpus-rhythmnarula
西班牙语问答语料库SpanishQuestionAnsweringCorpus-rhythmnarula 数据来源:互联网公开数据 标签:问答系统, 自然语言处理, 西班牙语, 文本理解, 语料库, 机器阅读, 语言模型, 数据集 数据概述: 该数据集包含来自公开资料的西班牙语问答对,记录了以西班牙语呈现的上下文信息和对应的提问。主要特征如下:... -
用户指令意图理解意图改写数据集UserCommandIntentParaphrasingDataset-panjie23
用户指令意图理解意图改写数据集UserCommandIntentParaphrasingDataset-panjie23 数据来源:互联网公开数据 标签:意图识别, 文本生成, 语义理解, 机器翻译, 数据增强, 自然语言处理, 对话系统, 语料库 数据概述:... -
韩语论证文本转述数据集KoreanArgumentationTextParaphrasing-iamyourenergy
韩语论证文本转述数据集KoreanArgumentationTextParaphrasing-iamyourenergy 数据来源:互联网公开数据 标签:文本转述, 自然语言处理, 韩语, 语料库, 文本生成, 深度学习, 数据增强, 语言模型 数据概述: 该数据集包含从韩语论证文本中提取的转述文本对,旨在用于训练和评估文本转述模型。主要特征如下:... -
社交媒体情感分析数据集SocialMediaSentimentAnalysis-harnelia
社交媒体情感分析数据集SocialMediaSentimentAnalysis-harnelia 数据来源:互联网公开数据 标签:情感分析, 社交媒体, 文本分类, 情感极性, 自然语言处理, 机器学习, 数据标注, 语料库 数据概述: 该数据集包含来自社交媒体平台的数据,记录了用户发布文本的情感倾向。主要特征如下:... -
学术论文摘要生成训练数据集AcademicPaperSummaryGenerationTrainingDataset-simonemanfroni
学术论文摘要生成训练数据集AcademicPaperSummaryGenerationTrainingDataset-simonemanfroni 数据来源:互联网公开数据 标签:文本摘要, 自然语言处理, 机器学习, 论文分析, 文本生成, 深度学习, 语料库, 数据集 数据概述:... -
安全生产知识问答文本分类数据集SafetyProductionKnowledgeQuestionAnsweringTextClassificationDa...
安全生产知识问答文本分类数据集SafetyProductionKnowledgeQuestionAnsweringTextClassificationDataset-qizilin 数据来源:互联网公开数据 标签:安全生产, 文本分类, 知识问答, 行业标准, 风险评估, 语料库, 数据标注, 机器学习 数据概述:... -
文本语言识别数据集TextLanguageIdentificationDataset-kanhakhantaal
文本语言识别数据集TextLanguageIdentificationDataset-kanhakhantaal 数据来源:互联网公开数据 标签:语言识别, 文本分析, 自然语言处理, 文本分类, 多语言, 机器学习, 语料库, 文本预处理 数据概述: 该数据集包含来自互联网的文本数据,记录了不同文本内容及其对应的语言标签。主要特征如下:... -
中文情感分析训练数据集ChineseSentimentAnalysisTrainingDataset-leusino
中文情感分析训练数据集ChineseSentimentAnalysisTrainingDataset-leusino 数据来源:互联网公开数据 标签:情感分析, 文本分类, 情绪识别, 自然语言处理, 中文文本, 情感标注, 机器学习, 语料库 数据概述: 该数据集包含来自互联网的中文文本数据,记录了文本内容与其对应的情感标签。主要特征如下:...