-
阿拉伯语隐喻识别数据集ArabicMetaphorDetectionDataset-linahabuhajar
阿拉伯语隐喻识别数据集ArabicMetaphorDetectionDataset-linahabuhajar 数据来源:互联网公开数据 标签:隐喻检测,自然语言处理,文本分类,阿拉伯语,情感分析,语料库,机器学习,语言学 数据概述: 该数据集包含来自多个来源的阿拉伯语文本,主要用于阿拉伯语文本中的隐喻识别任务。主要特征如下:... -
社交媒体情感分析推文数据集SocialMediaSentimentAnalysisTweets-aguado
社交媒体情感分析推文数据集SocialMediaSentimentAnalysisTweets-aguado 数据来源:互联网公开数据 标签:情感分析, 文本分类, 社交媒体, 推文, 自然语言处理, 机器学习, 情感极性, 语料库 数据概述:... -
文本对比关系识别训练数据集TextComparisonRelationIdentificationTrainingDataset-neeraj003
文本对比关系识别训练数据集TextComparisonRelationIdentificationTrainingDataset-neeraj003 数据来源:互联网公开数据 标签:文本分析, 对比关系, 自然语言处理, 文本分类, 机器学习, 数据标注, 情感分析, 语料库 数据概述:... -
问答匹配与文本摘要数据集QuestionAnsweringandTextSummarizationDataset-kneroma
问答匹配与文本摘要数据集QuestionAnsweringandTextSummarizationDataset-kneroma 数据来源:互联网公开数据 标签:问答系统, 文本摘要, 自然语言处理, 机器阅读理解, 知识检索, 文本匹配, 数据集构建, 语料库 数据概述:... -
互联网评论文本毒性分析数据集InternetCommentTextToxicityAnalysisDataset-vitalychait
互联网评论文本毒性分析数据集InternetCommentTextToxicityAnalysisDataset-vitalychait 数据来源:互联网公开数据 标签:文本分类, 毒性检测, 情感分析, 垃圾评论, 恶意言论, 自然语言处理, 机器学习, 语料库 数据概述:... -
语言模型预训练与评估数据集LanguageModelPretrainingandEvaluationDataset-kunihikofurugori
语言模型预训练与评估数据集LanguageModelPretrainingandEvaluationDataset-kunihikofurugori 数据来源:互联网公开数据 标签:自然语言处理, 语言模型, 预训练, 文本评估, 深度学习, 机器学习, 文本分析, 语料库 数据概述:... -
网络安全检测扩展SQL注入语句数据集CybersecurityDetectionExtendedSQLInjectionSentences-alextrinity
网络安全检测扩展SQL注入语句数据集CybersecurityDetectionExtendedSQLInjectionSentences-alextrinity 数据来源:互联网公开数据 标签:SQL注入, 网络安全, 文本分类, 二分类模型, 恶意代码, 数据标注, 机器学习, 语料库 数据概述:... -
中文词频统计分析数据集ChineseWordFrequencyStatistics-danphan2012
中文词频统计分析数据集ChineseWordFrequencyStatistics-danphan2012 数据来源:互联网公开数据 标签:中文, 词频分析, 自然语言处理, 文本挖掘, 语料库, 统计分析, 语言学, 数据集 数据概述: 该数据集包含来自公开语料库的中文文本数据,记录了词语及其对应的出现频率。主要特征如下:... -
新闻组文本分类数据集NewsgroupTextClassificationDataset-daryashirkalina
新闻组文本分类数据集NewsgroupTextClassificationDataset-daryashirkalina 数据来源:互联网公开数据 标签:文本分类, 自然语言处理, 语料库, 新闻组, 话题分析, 机器学习, 文本挖掘, 情感分析 数据概述:... -
电影评论情感分析数据集MovieReviewSentimentAnalysis-virendrasinhchavda
电影评论情感分析数据集MovieReviewSentimentAnalysis-virendrasinhchavda 数据来源:互联网公开数据 标签:情感分析, 文本分类, 自然语言处理, 电影评论, 情感极性, 机器学习, 数据标注, 语料库 数据概述: 该数据集包含来自互联网的电影评论数据,记录了电影评论文本及其对应的情感极性标签。主要特征如下:... -
文本摘要与分类数据集TextSummarizationandClassificationDataset-abhishek11102000
文本摘要与分类数据集TextSummarizationandClassificationDataset-abhishek11102000 数据来源:互联网公开数据 标签:文本摘要, 文本分类, 自然语言处理, 机器学习, 数据集, 语料库, 文本分析, 信息检索 数据概述:... -
环境污染与文本分析数据集EnvironmentalPollutionandTextAnalysis-tabualkher
环境污染与文本分析数据集EnvironmentalPollutionandTextAnalysis-tabualkher 数据来源:互联网公开数据 标签:环境污染, 文本分析, 负面情绪, 文本情感分析, 自然语言处理, 污染治理, 机器学习, 语料库 数据概述:... -
新闻问答语料库问题集NewsQuestionCorpus-oralia
新闻问答语料库问题集NewsQuestionCorpus-oralia 数据来源:互联网公开数据 标签:问答系统, 自然语言处理, 文本分析, 信息检索, 知识图谱, 语料库, 文本挖掘, 机器学习 数据概述: 该数据集包含来自新闻问答语料库的问题集,记录了各种新闻报道相关的提问。主要特征如下: 时间跨度:数据未标明具体时间,视作静态问题集合。... -
日英字幕语料库数据集-2020年-onslaught
日英字幕语料库数据集-2020年-onslaught 数据来源:互联网公开数据 标签:日英翻译,字幕,机器翻译,语言处理,语料库,自然语言处理,信息提取 数据概述:... -
电影评论情感分析数据集MovieReviewSentimentAnalysis-cyrillicw
电影评论情感分析数据集MovieReviewSentimentAnalysis-cyrillicw 数据来源:互联网公开数据 标签:情感分析, 文本分类, 电影评论, 自然语言处理, 情感极性, 数据标注, 机器学习, 语料库 数据概述: 该数据集包含来自电影评论网站的评论文本,记录了观众对电影的评价信息。主要特征如下:... -
新闻文本分类数据集NewsTextClassificationDataset-nkhan01
新闻文本分类数据集NewsTextClassificationDataset-nkhan01 数据来源:互联网公开数据 标签:文本分类, 新闻, 标题, 描述, 机器学习, 自然语言处理, 语料库, 文本分析 数据概述: 该数据集包含来自新闻报道的文本数据,记录了新闻标题和描述,并附带了类别标签,用于文本分类任务。主要特征如下:... -
问答对话数据集Question-AnswerDialogueDataset-yjdsqfrrfeyn391
问答对话数据集Question-AnswerDialogueDataset-yjdsqfrrfeyn391 数据来源:互联网公开数据 标签:问答系统, 对话生成, 自然语言处理, 文本数据, 机器翻译, 语义理解, 知识检索, 语料库 数据概述: 该数据集包含来自互联网的问答对话对,记录了用户提出的问题及其相应的回答。主要特征如下:... -
法语句对翻译平行语料数据集French-EnglishParallelCorpusforTranslation-giangtranduc
法语句对翻译平行语料数据集French-EnglishParallelCorpusforTranslation-giangtranduc 数据来源:互联网公开数据 标签:机器翻译, 文本翻译, 法语, 英语, 语料库, 自然语言处理, 文本对齐, 语言模型 数据概述:... -
文本情感分析训练数据集TextSentimentAnalysisTrainingDataset-karthikeyanmsk
文本情感分析训练数据集TextSentimentAnalysisTrainingDataset-karthikeyanmsk 数据来源:互联网公开数据 标签:情感分析, 文本分类, 自然语言处理, 机器学习, 情感标注, 语料库, 文本数据, 情感识别 数据概述:... -
新闻标题讽刺性判别数据集NewsHeadlineSarcasmDetection-ankitmakhija98
新闻标题讽刺性判别数据集NewsHeadlineSarcasmDetection-ankitmakhija98 数据来源:互联网公开数据 标签:新闻标题, 讽刺检测, 文本分类, 自然语言处理, 情感分析, 数据标注, 机器学习, 语料库 数据概述: 该数据集包含来自新闻网站的标题数据,记录了新闻标题的讽刺性判断结果。主要特征如下:...