-
社交媒体草坪话题文本数据集SocialMediaLawnTopicTextDataset-gracejin27
社交媒体草坪话题文本数据集SocialMediaLawnTopicTextDataset-gracejin27 数据来源:互联网公开数据 标签:草坪, 社交媒体, 文本数据, 话题分析, 内容提取, 链接, 数据挖掘, 语料库 数据概述: 该数据集包含来自社交媒体平台的数据,记录了与“草坪”相关的话题讨论文本及相关链接。主要特征如下:... -
新闻事件文本分类数据集NewsEventTextClassificationDataset-xuyatian
新闻事件文本分类数据集NewsEventTextClassificationDataset-xuyatian 数据来源:互联网公开数据 标签:文本分类,新闻,事件,自然语言处理,机器学习,情感分析,数据标注,语料库 数据概述: 该数据集包含来自新闻媒体的文本数据,记录了各种新闻事件的描述。主要特征如下:... -
孟加拉语地区文本情感分析数据集BengaliRegionTextSentimentAnalysis-abdullaharean
孟加拉语地区文本情感分析数据集BengaliRegionTextSentimentAnalysis-abdullaharean 数据来源:互联网公开数据 标签:情感分析, 孟加拉语, 文本分类, 地区文本, 自然语言处理, 情感极性, 机器学习, 语料库 数据概述:... -
社交媒体情绪分析语料数据集SocialMediaSentimentAnalysisCorpus-hanadialmograbi
社交媒体情绪分析语料数据集SocialMediaSentimentAnalysisCorpus-hanadialmograbi 数据来源:互联网公开数据 标签:情绪分析, 文本分类, 自然语言处理, 情感识别, 社交媒体, 语料库, 机器学习, 情感极性 数据概述:... -
孟加拉语文本数据集BanglaTextDataset-sameen53
孟加拉语文本数据集BanglaTextDataset-sameen53 数据来源:互联网公开数据 标签:孟加拉语, 文本数据, 自然语言处理, 语料库, 文本分析, 语言模型, 情感分析, 机器翻译 数据概述: 该数据集包含来自互联网的孟加拉语文本数据,记录了各种主题的孟加拉语文本片段。主要特征如下: 时间跨度:数据未标明具体时间,可视为静态文本语料。... -
Discord聊天记录情感分析数据集DiscordChatLogsSentimentAnalysis-mrgentle
Discord聊天记录情感分析数据集DiscordChatLogsSentimentAnalysis-mrgentle 数据来源:互联网公开数据 标签:社交媒体, 聊天记录, 情感分析, 自然语言处理, 文本数据, 情感识别, 数据挖掘, 语料库 数据概述: 该数据集包含来自 Discord... -
印尼姓名数据标注集IndonesianNamesDataset-abcdjslferoakdk
印尼姓名数据标注集IndonesianNamesDataset-abcdjslferoakdk 数据来源:互联网公开数据 标签:印尼姓名, 命名实体识别, 文本标注, 人名识别, 文本分析, 机器学习, 数据清洗, 语料库 数据概述: 该数据集包含印尼人姓名数据,记录了经过标注的姓名信息,用于训练和评估姓名识别模型。主要特征如下:... -
电影评论情感分析IMDb数据集MovieReviewSentimentAnalysisIMDbDataset-randomdream
电影评论情感分析IMDb数据集MovieReviewSentimentAnalysisIMDbDataset-randomdream 数据来源:互联网公开数据 标签:情感分析, 自然语言处理, 文本分类, 电影评论, 情感极性, 数据标注, 机器学习, 语料库 数据概述: 该数据集包含来自IMDb(Internet Movie... -
古兰经经文英阿对照文本数据集QuranicVersesEnglish-ArabicParallelCorpus-mohamedwaelbishr2018
古兰经经文英阿对照文本数据集QuranicVersesEnglish-ArabicParallelCorpus-mohamedwaelbishr2018 数据来源:互联网公开数据 标签:古兰经, 阿拉伯语, 英语翻译, 文本数据, 宗教, 语言学, 语料库, 自然语言处理 数据概述:... -
多语种情感分析文本数据集MultilingualSentimentAnalysisTextDataset-mdnaeem1804120
多语种情感分析文本数据集MultilingualSentimentAnalysisTextDataset-mdnaeem1804120 数据来源:互联网公开数据 标签:情感分析, 多语言, 文本分类, 情感识别, 机器学习, 自然语言处理, 情绪分析, 语料库 数据概述: 该数据集包含来自多个语种的文本数据,记录了不同文本的情感标签。主要特征如下:... -
阿拉伯语文本相似度分析数据集ArabicTextSimilarityAnalysis-elemam
阿拉伯语文本相似度分析数据集ArabicTextSimilarityAnalysis-elemam 数据来源:互联网公开数据 标签:文本相似度, 阿拉伯语, 自然语言处理, 语义分析, 文本匹配, 机器翻译, 语料库, 语言学 数据概述: 该数据集包含阿拉伯语文本对,用于评估和分析文本之间的相似度。主要特征如下:... -
多语言文本自动识别数据集MultilingualTextAuto-IdentificationDataset-rickyaryansah
多语言文本自动识别数据集MultilingualTextAuto-IdentificationDataset-rickyaryansah 数据来源:互联网公开数据 标签:文本识别, 多语言, 自然语言处理, 语言分类, 文本分类, 机器学习, 语料库, 文本分析 数据概述: 该数据集包含多种语言的文本样本,用于训练和评估自动语言识别模型。主要特征如下:... -
问答系统文本匹配数据集Question-AnswerNaturalLanguageInferenceControl-ishanisanturkar
问答系统文本匹配数据集Question-AnswerNaturalLanguageInferenceControl-ishanisanturkar 数据来源:互联网公开数据 标签:文本匹配, 自然语言推理, 问答系统, 语义理解, 数据标注, 机器学习, 文本分类, 语料库 数据概述:... -
印地语-英语混合语料翻译数据集Hindi-EnglishHinglishTranslationDataset-louistom
印地语-英语混合语料翻译数据集Hindi-EnglishHinglishTranslationDataset-louistom 数据来源:互联网公开数据 标签:机器翻译, 语言学, 印度语, 英语, 混合语言, 语料库, 自然语言处理, 多语言 数据概述: 该数据集包含来自互联网的印地语-英语混合语料,记录了英语、印地语以及Hinglish(印地语-... -
文学作品作者风格识别数据集LiteraryWorkAuthorStyleRecognition-allenye66
文学作品作者风格识别数据集LiteraryWorkAuthorStyleRecognition-allenye66 数据来源:互联网公开数据 标签:文学作品, 作者风格, 文本分析, 自然语言处理, 文本分类, 语料库, 风格识别, 机器学习 数据概述: 该数据集包含来自不同作者的文学作品文本,记录了用于识别作者写作风格的文本片段。主要特征如下:... -
泰卢固语新闻文本主题分类数据集TeluguNewsTextTopicClassificationDataset-shaikfardeen1
泰卢固语新闻文本主题分类数据集TeluguNewsTextTopicClassificationDataset-shaikfardeen1 数据来源:互联网公开数据 标签:泰卢固语, 新闻文本, 文本分类, 自然语言处理, 情感分析, 语料库, 机器翻译, 印度 数据概述:... -
英文文本词对齐数据集EnglishTextWordAlignmentDataset-nairsaanvi
英文文本词对齐数据集EnglishTextWordAlignmentDataset-nairsaanvi 数据来源:互联网公开数据 标签:词对齐, 自然语言处理, 文本分析, 语料库, 机器翻译, 文本处理, 数据标注, 语言学 数据概述: 该数据集包含来自不同来源的英文文本数据,记录了词级别的对齐信息,主要用于研究和开发词对齐模型。主要特征如下:... -
印尼语文本分类语料库数据集IndonesianTextClassificationCorpus-hyadukuoningroqal
印尼语文本分类语料库数据集IndonesianTextClassificationCorpus-hyadukuoningroqal 数据来源:互联网公开数据 标签:文本分类, 印尼语, 语料库, 语言学, 自然语言处理, 文本分析, 情感分析, 机器学习 数据概述: 该数据集包含来自印尼语文本的数据,记录了用于文本分类任务的句子样本。主要特征如下:... -
文学作品作者识别训练数据集LiteraryAuthorIdentificationTrainingDataset-jaycobson51
文学作品作者识别训练数据集LiteraryAuthorIdentificationTrainingDataset-jaycobson51 数据来源:互联网公开数据 标签:文本分析, 作者识别, 自然语言处理, 语料库, 机器学习, EAP, HPL, MWS 数据概述:... -
印尼政治意识形态文本标注数据集IndonesiaPoliticalIdeologyTextLabelingDataset-levinasp
印尼政治意识形态文本标注数据集IndonesiaPoliticalIdeologyTextLabelingDataset-levinasp 数据来源:互联网公开数据 标签:政治, 意识形态, 文本分类, 标注数据, 印尼, 机器学习, 语料库, 自然语言处理 数据概述:...