-
文本可读性评估测试数据集TextReadabilityAssessmentTestDataset-teeyee314
文本可读性评估测试数据集TextReadabilityAssessmentTestDataset-teeyee314 数据来源:互联网公开数据 标签:文本分析, 可读性评估, 自然语言处理, 文本理解, 教育, 语言学, 机器学习, 语料库 数据概述: 该数据集包含来自CommonLit Readability... -
社交媒体性格分析文本数据集SocialMediaPersonalityTextDataset-anshgupta07
社交媒体性格分析文本数据集SocialMediaPersonalityTextDataset-anshgupta07 数据来源:互联网公开数据 标签:性格分析, 社交媒体, 文本挖掘, 心理学, ENFJ, 语料库, 情感分析, 数据标注 数据概述: 该数据集包含来自社交媒体平台的用户文本数据,旨在用于性格类型的分析与研究。主要特征如下:... -
情感分析诗歌文本数据集SentimentAnalysisPoetryText-atulkrishnan25
情感分析诗歌文本数据集SentimentAnalysisPoetryText-atulkrishnan25 数据来源:互联网公开数据 标签:情感分析, 诗歌, 文本分类, 自然语言处理, 情感词典, 诗歌创作, 文本情感, 语料库 数据概述:... -
命名实体识别俄语文本数据集NamedEntityRecognitionRussianTextDataset-benzom
命名实体识别俄语文本数据集NamedEntityRecognitionRussianTextDataset-benzom 数据来源:互联网公开数据 标签:命名实体识别, 俄语, 自然语言处理, 文本标注, 语言模型, 文本分析, 机器学习, 语料库 数据概述:... -
阿拉伯语APP应用内容分类数据集ArabicAppContentClassificationDataset-ziadhamed
阿拉伯语APP应用内容分类数据集ArabicAppContentClassificationDataset-ziadhamed 数据来源:互联网公开数据 标签:文本分类, 阿拉伯语, 应用内容, 机器学习, 自然语言处理, 语料库, 多标签分类, 移动应用 数据概述:... -
乌尔都语新闻摘要数据集UrduNewsSummaryDataset-muhammedjamalmustafa
乌尔都语新闻摘要数据集UrduNewsSummaryDataset-muhammedjamalmustafa 数据来源:互联网公开数据 标签:新闻摘要, 文本摘要, 乌尔都语, 自然语言处理, 文本分析, 语料库, 深度学习, 语言模型 数据概述: 该数据集包含来自互联网的乌尔都语新闻报道摘要。主要特征如下:... -
阿拉伯语问答ArQuAD数据集ArabicQuestionAnsweringArQuADDataset-ayazjaradat
阿拉伯语问答ArQuAD数据集ArabicQuestionAnsweringArQuADDataset-ayazjaradat 数据来源:互联网公开数据 标签:问答系统, 自然语言处理, 阿拉伯语, 文本理解, 信息检索, 机器阅读, 语料库, 数据集 数据概述:... -
TED演讲西班牙语字幕文本数据集TEDTalksSpanishSubtitles-criscastromaya
TED演讲西班牙语字幕文本数据集TEDTalksSpanishSubtitles-criscastromaya 数据来源:互联网公开数据 标签:TED演讲, 西班牙语, 字幕, 文本分析, 自然语言处理, 语料库, 语言学, 文本挖掘 数据概述: 该数据集包含来自TED演讲的西班牙语字幕文本,记录了演讲者的演讲内容。主要特征如下:... -
亚里士多德悲剧要素分析数据集AristotleTragedyElementsAnalysis-markobeocanin
亚里士多德悲剧要素分析数据集AristotleTragedyElementsAnalysis-markobeocanin 数据来源:互联网公开数据 标签:亚里士多德, 悲剧, 文本分析, 哲学, 语料库, 摘要, 文本摘要, 自然语言处理 数据概述: 该数据集包含来自哲学著作的数据,记录了亚里士多德关于理想悲剧的要素分析文本。主要特征如下:... -
多语言文本相似度评估数据集MultilingualTextSimilarityEvaluationDataset-rookiejing
多语言文本相似度评估数据集MultilingualTextSimilarityEvaluationDataset-rookiejing 数据来源:互联网公开数据 标签:文本相似度, 多语言, 语料库, 机器翻译, 自然语言处理, 文本匹配, 语言学, 数据标注 数据概述: 该数据集包含来自不同语言的文本对,记录了文本对之间的相似度评分。主要特征如下:... -
印地语新闻文本情感分析数据集HindiNewsTextSentimentAnalysis-ridhimasinare17
印地语新闻文本情感分析数据集HindiNewsTextSentimentAnalysis-ridhimasinare17 数据来源:互联网公开数据 标签:情感分析, 文本分类, 自然语言处理, 印地语, 新闻文本, 情感极性, 机器学习, 语料库 数据概述: 该数据集包含来自新闻媒体的印地语文本数据,记录了新闻文章的情感极性标签。主要特征如下:... -
星球大战电影剧本语音数据集StarWarsMovieScriptVoiceDataset-adnannoorullah
星球大战电影剧本语音数据集StarWarsMovieScriptVoiceDataset-adnannoorullah 数据来源:互联网公开数据 标签:电影剧本, 语音识别, 文本分析, 角色对话, 数据标注, 自然语言处理, 星球大战, 语料库 数据概述: 该数据集包含来自星球大战电影剧本的语音文本数据,记录了电影中角色的对话内容。主要特征如下:... -
社交媒体推文讽刺识别数据集SocialMediaTweetIronyDetection-lakshmikeerthana
社交媒体推文讽刺识别数据集SocialMediaTweetIronyDetection-lakshmikeerthana 数据来源:互联网公开数据 标签:讽刺识别, 情感分析, 文本分类, 社交媒体, 自然语言处理, 机器学习, 文本标注, 语料库 数据概述: 该数据集包含来自社交媒体平台推文,记录了用于识别推文中讽刺意味的文本。主要特征如下:... -
命名实体识别训练与测试数据集NamedEntityRecognitionTrainingandTestingDataset-binarybae
命名实体识别训练与测试数据集NamedEntityRecognitionTrainingandTestingDataset-binarybae 数据来源:互联网公开数据 标签:命名实体识别, 自然语言处理, 文本标注, 机器学习, 语料库, 实体识别, 文本分析, 标注数据 数据概述:... -
瑞克与莫蒂剧本台词数据集RickandMortyScriptDialogue-justin2silas
瑞克与莫蒂剧本台词数据集RickandMortyScriptDialogue-justin2silas 数据来源:互联网公开数据 标签:剧本分析, 影视数据, 台词文本, 角色对话, 文本挖掘, 自然语言处理, 动漫, 语料库 数据概述: 该数据集包含来自《瑞克与莫蒂》动画剧集的台词文本,记录了剧集中不同角色之间的对话内容。主要特征如下:... -
印尼语犯罪新闻文本分类数据集IndonesianCriminalNewsTextClassification-idlangrh
印尼语犯罪新闻文本分类数据集IndonesianCriminalNewsTextClassification-idlangrh 数据来源:互联网公开数据 标签:印尼语, 文本分类, 犯罪新闻, 自然语言处理, 语料库, 情感分析, 机器学习, 文本挖掘 数据概述:... -
英语-泰卢固语平行语料翻译数据集English-TeluguParallelCorpus-krizzna69
英语-泰卢固语平行语料翻译数据集English-TeluguParallelCorpus-krizzna69 数据来源:互联网公开数据 标签:机器翻译, 语料库, 语言学, 文本翻译, 英语, 泰卢固语, 自然语言处理, 平行语料 数据概述: 该数据集包含英语与泰卢固语的平行文本,记录了两种语言之间的翻译对应关系。主要特征如下:... -
印度尼西亚语宗教文本翻译数据集IndonesianReligiousTextTranslation-adeliaherlisa91
印度尼西亚语宗教文本翻译数据集IndonesianReligiousTextTranslation-adeliaherlisa91 数据来源:互联网公开数据 标签:印尼语, 宗教文本, 翻译, 文本对齐, 自然语言处理, 机器翻译, 语料库, 文本分析 数据概述: 该数据集包含来自印度尼西亚语的宗教文本,记录了原始文本及其对应的翻译。主要特征如下:... -
印度尼西亚语情感分析数据集IndonesianSentimentAnalysisDataset-dawamaf
印度尼西亚语情感分析数据集IndonesianSentimentAnalysisDataset-dawamaf 数据来源:互联网公开数据 标签:情感分析, 文本分类, 自然语言处理, 印度尼西亚语, 情感标注, 机器学习, 情绪识别, 语料库 数据概述: 该数据集包含来自社交媒体或其他公开渠道的印度尼西亚语文本,记录了不同文本的情感倾向。主要特征如下:... -
性别歧视文本识别数据集SexistTextIdentificationDataset-hudeewu
性别歧视文本识别数据集SexistTextIdentificationDataset-hudeewu 数据来源:互联网公开数据 标签:性别歧视, 文本分类, 情感分析, 社交媒体, 数据标注, 自然语言处理, 语料库, 机器学习 数据概述: 该数据集包含来自社交媒体平台的文本数据,旨在用于识别和分析性别歧视言论。主要特征如下:...