-
法律文书语料库数据集LegalDocumentCorpusDataset-ictworld
法律文书语料库数据集LegalDocumentCorpusDataset-ictworld 数据来源:互联网公开数据 标签:法律,文书,语料库,自然语言处理,文本分析,机器学习,法律科技,法律文书 数据概述: 该数据集包含来自BKAi的法律文书语料库数据,记录了各种类型的法律文书,例如合同、判决书、法律意见书等。主要特征如下:... -
帕金森病PD患者文章摘要生成数据集Parkinson-sDiseaseArticleAbstractGenerationDataset-jaskiratjk
帕金森病PD患者文章摘要生成数据集Parkinson-sDiseaseArticleAbstractGenerationDataset-jaskiratjk 数据来源:互联网公开数据 标签:帕金森病, 摘要生成, 文本摘要, 医学文本, 自然语言处理, 机器学习, 神经退行性疾病, 文本分析 数据概述:... -
新闻文本分类数据集NewsTextClassification-shwe1308
新闻文本分类数据集NewsTextClassification-shwe1308 数据来源:互联网公开数据 标签:新闻文本, 文本分类, 政治, 经济, 机器学习, 自然语言处理, 数据标注, 舆情分析 数据概述: 该数据集包含来自新闻报道的文本数据,记录了新闻标题、正文内容、主题、发布日期和标签信息。主要特征如下:... -
维基百科词向量嵌入数据集WikipediaExportVectorEmbeddingsDataset-jimicy
维基百科词向量嵌入数据集WikipediaExportVectorEmbeddingsDataset-jimicy 数据来源:互联网公开数据 标签:自然语言处理,词向量,数据集,文本分析,机器学习,知识图谱,语义理解,维基百科 数据概述:... -
电影评论情感分析数据集IMDbDatasetAfterPreprocessingRemoveOutliers-japeralrashid
电影评论情感分析数据集IMDbDatasetAfterPreprocessingRemoveOutliers-japeralrashid 数据来源:互联网公开数据 标签:情感分析,数据集,电影评论,自然语言处理,机器学习,文本挖掘,数据清洗,情感识别 数据概述:... -
政治领域有害言论数据集BrainDeadHarmfulDataforPolitics-braindeadiiest
政治领域有害言论数据集BrainDeadHarmfulDataforPolitics-braindeadiiest 数据来源:互联网公开数据 标签:政治言论,有害言论,数据集,自然语言处理,文本分析,机器学习,社交媒体,社会研究 数据概述:该数据集包含从互联网收集的政治领域有害言论数据,旨在用于分析和处理社交媒体上的政治负面言论。主要特征如下:... -
大型语言模型基础对话数据集LLMsBasicConversationDataset-danvictorlofranco
大型语言模型基础对话数据集LLMsBasicConversationDataset-danvictorlofranco 数据来源:互联网公开数据 标签:自然语言处理,对话系统,数据集,机器学习,人工智能,语言模型,文本生成,智能客服 数据概述: 该数据集包含来自大型语言模型基础对话训练的数据,记录了模型与用户之间的对话交互内容。主要特征如下:... -
Jigsaw毒性评论分类挑战数据集JigsawToxicCommentClassificationChallengeDataset-santhoshkakarla
Jigsaw毒性评论分类挑战数据集JigsawToxicCommentClassificationChallengeDataset-santhoshkakarla 数据来源:互联网公开数据 标签:评论分类,数据集,自然语言处理,机器学习,文本分析,社交网络,人工智能,情感分析... -
社交媒体用户情感分析数据集SocialMediaUserSentimentAnalysis-brisingeur
社交媒体用户情感分析数据集SocialMediaUserSentimentAnalysis-brisingeur 数据来源:互联网公开数据 标签:情感分析, 社交媒体, 文本分析, 情绪识别, 自然语言处理, 数据挖掘, 机器学习, 舆情分析 数据概述:... -
医学文献摘要文本分类数据集MedicalLiteratureAbstractTextClassification-bersaliasma
医学文献摘要文本分类数据集MedicalLiteratureAbstractTextClassification-bersaliasma 数据来源:互联网公开数据 标签:医学, 文本分类, 摘要, 疾病研究, 生物医学, 机器学习, 自然语言处理, 肿瘤学 数据概述:... -
语言工具错误检测数据集LanguageToolErrorDetectionDataset-liangqiuyuan1
语言工具错误检测数据集LanguageToolErrorDetectionDataset-liangqiuyuan1 数据来源:互联网公开数据 标签:自然语言处理,文本分析,错误检测,机器学习,语言工具,数据集,语法检查,文本处理 数据概述:... -
住宿评价情感分析数据集AccommodationReviewSentimentAnalysis-nishuchowdhurybd
住宿评价情感分析数据集AccommodationReviewSentimentAnalysis-nishuchowdhurybd 数据来源:互联网公开数据 标签:住宿评价, 情感分析, 文本挖掘, 评价分析, 评分预测, 自然语言处理, 酒店点评, 旅游 数据概述:... -
情感分析模型训练与评估数据集SentimentAnalysisModelTrainingandEvaluationDataset-mafazachabane
情感分析模型训练与评估数据集SentimentAnalysisModelTrainingandEvaluationDataset-mafazachabane 数据来源:互联网公开数据 标签:情感分析, 文本分类, 深度学习, 情感标签, 模型训练, 词嵌入, 自然语言处理, 数据集 数据概述:... -
阿拉伯语推特文本数据集ArabicTwitterTextData-asalhi
阿拉伯语推特文本数据集ArabicTwitterTextData-asalhi 数据来源:互联网公开数据 标签:阿拉伯语, 社交媒体, 文本数据, 推特, 自然语言处理, 情感分析, 文本挖掘, 语料库 数据概述: 该数据集包含来自Twitter平台的阿拉伯语推文文本数据,记录了用户发布的推文内容及其对应的URL链接。主要特征如下:... -
有毒评论挑战数据集ToxicCommentChallengeDataset-jeffjosesvlj
有毒评论挑战数据集ToxicCommentChallengeDataset-jeffjosesvlj 数据来源:互联网公开数据 标签:评论分析,数据集,机器学习,自然语言处理,文本分类,社会伦理,内容过滤,互联网评论 数据概述:该数据集源自“有毒评论挑战”项目,记录了来自Reddit论坛的用户评论及其是否包含有毒内容的标注。主要特征如下:... -
科勒里奇预处理文本数据集ColeridgeProcessedTextDataset-peaceduck
科勒里奇预处理文本数据集ColeridgeProcessedTextDataset-peaceduck 数据来源:互联网公开数据 标签:文本处理,数据集,自然语言处理,机器学习,文本分析,语言模型,数据处理,学术研究 数据概述:该数据集包含来自科勒里奇项目(Coleridge... -
乌克兰语诈骗文本分类数据集UkrainianFraudTextClassificationDataset-maksymyevchuk
乌克兰语诈骗文本分类数据集UkrainianFraudTextClassificationDataset-maksymyevchuk 数据来源:互联网公开数据 标签:文本分类, 诈骗识别, 自然语言处理, 乌克兰语, 欺诈检测, 机器学习, 语料库, 电商诈骗 数据概述:... -
音乐情感与流派分析歌词数据集MusicMoodandGenreLyricsDataset-paulinechaumeron
音乐情感与流派分析歌词数据集MusicMoodandGenreLyricsDataset-paulinechaumeron 数据来源:互联网公开数据 标签:歌词分析, 情感分析, 音乐流派, 自然语言处理, 文本分类, 音乐, 数据挖掘, 机器学习 数据概述: 该数据集包含从互联网收集的音乐歌词数据,旨在用于音乐情感分析和流派分类研究。主要特征如下:... -
图书摘要文本分类与模型训练数据集BookSummaryTextClassificationandModelTrainingDataset-hachane
图书摘要文本分类与模型训练数据集BookSummaryTextClassificationandModelTrainingDataset-hachane 数据来源:互联网公开数据 标签:文本分类, 图书摘要, 自然语言处理, 机器学习, 情感分析, 数据集, 模型训练, 文本语料 数据概述:... -
多语言有毒评论数据集法语-西班牙语-德语训练集-larryfreeman
多语言有毒评论数据集法语-西班牙语-德语训练集-larryfreeman 数据来源:互联网公开数据 标签:自然语言处理,有毒评论,数据集,多语言,机器学习,文本分类,情感分析,数据挖掘 数据概述:该数据集包含来自互联网公开平台的多语言有毒评论数据,记录了法语、西班牙语和德语三种语言的有毒言论样本。主要特征如下:...