-
动漫剧本台词分析数据集AnimationScriptDialogueAnalysis-justin2silas
动漫剧本台词分析数据集AnimationScriptDialogueAnalysis-justin2silas 数据来源:互联网公开数据 标签:动漫剧本, 文本数据, 台词分析, 角色对话, 情感分析, 自然语言处理, 语料库, 瑞克与莫蒂 数据概述: 该数据集包含来自《瑞克与莫蒂》动漫剧本的台词数据,记录了剧中角色之间的对话内容。主要特征如下:... -
乌尔都语讽刺文本识别数据集UrduSarcasmTextRecognitionDataset-noorsaeed
乌尔都语讽刺文本识别数据集UrduSarcasmTextRecognitionDataset-noorsaeed 数据来源:互联网公开数据 标签:讽刺文本, 乌尔都语, 文本情感分析, 自然语言处理, 情感识别, 文本分类, 机器学习, 语料库 数据概述: 该数据集包含来自网络公开资源的乌尔都语文本,记录了用于识别讽刺性表达的语言示例。主要特征如下:... -
孟加拉语地区文本分类数据集BengaliRegionTextClassificationDataset-safayetrafi
孟加拉语地区文本分类数据集BengaliRegionTextClassificationDataset-safayetrafi 数据来源:互联网公开数据 标签:文本分类, 孟加拉语, 地理信息, 语言学, 自然语言处理, 多标签分类, 语料库, 情感分析 数据概述: 该数据集包含来自孟加拉地区不同区域的文本内容,旨在用于文本分类任务。主要特征如下:... -
影视剧本对白语料数据集MovieScriptDialogueCorpus-biadxd
影视剧本对白语料数据集MovieScriptDialogueCorpus-biadxd 数据来源:互联网公开数据 标签:剧本分析, 对白语料, 文本数据, 影视制作, 自然语言处理, 语料库, 文本挖掘, 情感分析 数据概述: 该数据集包含来自电影剧本的对白数据,记录了剧本中人物的台词及其对应的场景描述。主要特征如下:... -
摩洛哥阿拉伯语-英语翻译平行语料数据集MoroccanArabic-EnglishParallelCorpus-akrambel
摩洛哥阿拉伯语-英语翻译平行语料数据集MoroccanArabic-EnglishParallelCorpus-akrambel 数据来源:互联网公开数据 标签:机器翻译, 语言学, 摩洛哥阿拉伯语, 英语, 语料库, 翻译, 自然语言处理, 数据集 数据概述:... -
伊斯兰教圣训文本实体标注数据集HadithTextEntityAnnotationDataset-marinamaher
伊斯兰教圣训文本实体标注数据集HadithTextEntityAnnotationDataset-marinamaher 数据来源:互联网公开数据 标签:圣训, 文本标注, 实体识别, 自然语言处理, 阿拉伯语, 宗教, 语料库, 机器学习 数据概述:... -
古登堡项目科学技术领域文本数据集ProjectGutenbergScienceandTechnologyTextDataset-ramachandrabharadwaj
古登堡项目科学技术领域文本数据集ProjectGutenbergScienceandTechnologyTextDataset-ramachandrabharadwaj 数据来源:互联网公开数据 标签:古登堡项目, 文本数据, 科学技术, 语料库, 自然语言处理, 文本分析, 电子书, 数据集 数据概述: 该数据集包含来自古登堡项目(Project... -
哲学文本语义分析数据集PhilosophyTextSemanticAnalysis-abodezoabi1
哲学文本语义分析数据集PhilosophyTextSemanticAnalysis-abodezoabi1 数据来源:互联网公开数据 标签:哲学, 文本分析, 语义理解, 自然语言处理, 文本分类, 知识图谱, 学术研究, 语料库 数据概述: 该数据集包含来自哲学领域的数据,记录了不同哲学家的文本片段,主要用于语义分析和文本挖掘研究。主要特征如下:... -
多语种词语词性标注数据集MultilingualWordPart-of-SpeechTaggingDataset-khlifimohamed
多语种词语词性标注数据集MultilingualWordPart-of-SpeechTaggingDataset-khlifimohamed 数据来源:互联网公开数据 标签:词性标注, 自然语言处理, 多语言, 文本分析, 语言学, 语料库, 机器学习, 词语 数据概述:... -
坦桑尼亚新闻文本分类数据集TanzaniaNewsTextClassificationDataset-rantosarobidy
坦桑尼亚新闻文本分类数据集TanzaniaNewsTextClassificationDataset-rantosarobidy 数据来源:互联网公开数据 标签:文本分类, 新闻, 坦桑尼亚, 自然语言处理, 情感分析, 语料库, 机器学习, 政治 数据概述: 该数据集包含来自坦桑尼亚新闻网站的数据,记录了新闻文章的内容及其所属的类别。主要特征如下:... -
印地语文本语句数据集HindiTextStatements-krishna000
印地语文本语句数据集HindiTextStatements-krishna000 数据来源:互联网公开数据 标签:印地语, 文本数据, 语言分析, 自然语言处理, 文本挖掘, 语料库, 情感分析, 机器翻译 数据概述: 该数据集包含来自不同来源的印地语文本语句。主要特征如下: 时间跨度:数据未明确标注时间,可视为静态文本语料。... -
音乐家传记文本信息数据集MusicianBiographyTextInformation-janldeboer
音乐家传记文本信息数据集MusicianBiographyTextInformation-janldeboer 数据来源:互联网公开数据 标签:音乐家, 传记, 文本分析, 自然语言处理, 文本分类, 音乐史, 语料库, 艺术家 数据概述: 该数据集包含来自互联网的音乐家传记文本信息,记录了多位音乐家的生平、作品、以及相关链接等内容。主要特征如下:... -
自然语言处理命名实体识别数据集NaturalLanguageProcessingNamedEntityRecognitionDataset-aigeeky
自然语言处理命名实体识别数据集NaturalLanguageProcessingNamedEntityRecognitionDataset-aigeeky 数据来源:互联网公开数据 标签:命名实体识别, 自然语言处理, 文本标注, 数据集, 机器学习, 语料库, 信息抽取, 文本分析 数据概述:... -
阿拉伯语问答知识库数据集ArabicQuestionAnsweringKnowledgeBaseDataset-hudamaher
阿拉伯语问答知识库数据集ArabicQuestionAnsweringKnowledgeBaseDataset-hudamaher 数据来源:互联网公开数据 标签:问答系统, 自然语言处理, 阿拉伯语, 文本分类, 情感分析, 知识抽取, 机器阅读理解, 语料库 数据概述:... -
词汇索引构建词表数据集VocabularyIndexingNIPSDataset-von07raphael
词汇索引构建词表数据集VocabularyIndexingNIPSDataset-von07raphael 数据来源:互联网公开数据 标签:词汇索引, 文本处理, 词嵌入, 自然语言处理, 词表构建, 机器学习, 语料库, 数据预处理 数据概述:... -
文本分类意图识别数据集TextClassificationIntentRecognitionDataset-imgremlin
文本分类意图识别数据集TextClassificationIntentRecognitionDataset-imgremlin 数据来源:互联网公开数据 标签:文本分类, 意图识别, 自然语言处理, 语义分析, 数据标注, 机器学习, 语料库, 问答系统 数据概述:... -
电影评论情感分析数据集MovieReviewSentimentAnalysis-ahmetelgn
电影评论情感分析数据集MovieReviewSentimentAnalysis-ahmetelgn 数据来源:互联网公开数据 标签:情感分析, 电影评论, 文本分类, 自然语言处理, 机器学习, 情感极性, 数据标注, 语料库 数据概述: 该数据集包含来自互联网电影数据库(IMDB)的电影评论文本,记录了评论内容及其对应的情感极性标签。主要特征如下:... -
人机对话交互文本数据集Human-MachineDialogueInteractionTextData-swiftchris
人机对话交互文本数据集Human-MachineDialogueInteractionTextData-swiftchris 数据来源:互联网公开数据 标签:人机对话, 聊天记录, 自然语言处理, 文本生成, 对话系统, 情感分析, 机器学习, 语料库 数据概述:... -
论文摘要生成模型训练数据集PaperAbstractGenerationModelTrainingData-pavankandru
论文摘要生成模型训练数据集PaperAbstractGenerationModelTrainingData-pavankandru 数据来源:互联网公开数据 标签:论文摘要, 自然语言处理, 文本摘要, 机器学习, 语义分析, 语料库, 文本生成, 数据集 数据概述:... -
通用问答意图识别训练数据集GeneralQuestionAnsweringIntentRecognitionTrainingDataset-leixinyang
通用问答意图识别训练数据集GeneralQuestionAnsweringIntentRecognitionTrainingDataset-leixinyang 数据来源:互联网公开数据 标签:问答系统, 意图识别, 自然语言处理, 文本分类, 机器学习, 数据标注, 语料库, 知识检索 数据概述:...