-
新闻文本主题分类数据集NewsTextTopicClassification-liliyadav
新闻文本主题分类数据集NewsTextTopicClassification-liliyadav 数据来源:互联网公开数据 标签:文本分类, 新闻, 主题识别, 自然语言处理, 机器学习, 语料库, 文本分析, 情感分析 数据概述: 该数据集包含来自新闻报道的文本内容,记录了不同文章及其对应的主题分类。主要特征如下:... -
文本相似度分析数据集TextSimilarityAnalysisDataset-hoorayyliu
文本相似度分析数据集TextSimilarityAnalysisDataset-hoorayyliu 数据来源:互联网公开数据 标签:文本相似度, 自然语言处理, 文本匹配, 语义分析, 数据标注, 机器学习, 对比分析, 语料库 数据概述:... -
命名实体识别标注数据集NamedEntityRecognitionAnnotationDataset-bajajra
命名实体识别标注数据集NamedEntityRecognitionAnnotationDataset-bajajra 数据来源:互联网公开数据 标签:命名实体识别, 自然语言处理, 文本标注, 序列标注, 机器学习, 深度学习, 语料库, BERT 数据概述:... -
越南语问答意图识别数据集VietnameseQuestionAnsweringIntentRecognitionDataset-khanhdaom
越南语问答意图识别数据集VietnameseQuestionAnsweringIntentRecognitionDataset-khanhdaom 数据来源:互联网公开数据 标签:自然语言处理, 意图识别, 问答系统, 文本分类, 越南语, 机器学习, 对话系统, 语料库 数据概述:... -
医学文献文本分类数据集MedicalLiteratureTextClassification-lunanana1999
医学文献文本分类数据集MedicalLiteratureTextClassification-lunanana1999 数据来源:互联网公开数据 标签:医学文本, 文本分类, 疾病诊断, 医疗研究, 自然语言处理, 机器学习, 语料库, 临床医学 数据概述: 该数据集包含来自医学文献的文本数据,记录了用于疾病诊断和医学研究的文本片段。主要特征如下:... -
越南语文本事实核查数据集VietnameseTextFactVerificationDataset-nguynhngha
越南语文本事实核查数据集VietnameseTextFactVerificationDataset-nguynhngha 数据来源:互联网公开数据 标签:事实核查, 自然语言处理, 文本蕴含, 越南语, 多文档推理, 文本分类, 机器学习, 语料库 数据概述:... -
文本生成对话语料数据集TextGenerationDialogueCorpus-terrychanorg
文本生成对话语料数据集TextGenerationDialogueCorpus-terrychanorg 数据来源:互联网公开数据 标签:文本生成, 对话系统, 语料库, 自然语言处理, 文本摘要, 机器翻译, 语言模型, 数据集 数据概述: 该数据集包含多个CSV文件,记录了用于文本生成和对话系统训练的语料。主要特征如下:... -
英文文档语料库数据集-ashwanillkagechaad
英文文档语料库数据集-ashwanillkagechaad 数据来源:互联网公开数据 标签:文本分析,自然语言处理,数据集,英文,文档,语料库,语言模型,文本挖掘 数据概述:该数据集包含大量的英文文档,涵盖了多种主题和来源。主要特征如下: 时间跨度:数据记录的时间范围不固定,取决于文档的发布时间。 地理范围:数据来源广泛,覆盖全球范围内的英文文档。... -
写作风格评估数据集WritingStyleAssessmentDataset-yus002
写作风格评估数据集WritingStyleAssessmentDataset-yus002 数据来源:互联网公开数据 标签:写作风格, 文本分析, 机器学习, 文本特征, 风格迁移, 自然语言处理, 语料库, 评估指标 数据概述: 该数据集包含多个CSV文件,记录了用于评估写作风格的数据。主要特征如下: 时间跨度:数据未明确标明时间,可视为静态语料库。... -
Zalo推荐系统用户行为数据集ZaloRecommendationSystemUserBehaviorData-thoquang12345
Zalo推荐系统用户行为数据集ZaloRecommendationSystemUserBehaviorData-thoquang12345 数据来源:互联网公开数据 标签:推荐系统, 用户行为, 自然语言处理, 文本分析, 机器学习, 数据挖掘, 社交媒体, 语料库 数据概述:... -
网络社区评论毒性检测数据集OnlineCommunityCommentToxicityDetection-denisgrushentsev
网络社区评论毒性检测数据集OnlineCommunityCommentToxicityDetection-denisgrushentsev 数据来源:互联网公开数据 标签:毒性检测, 文本分类, 自然语言处理, 情感分析, 机器学习, 语料库, 评论分析, 文本标注 数据概述:... -
社交媒体灾难事件文本分类数据集SocialMediaDisasterEventTextClassification-qubeet
社交媒体灾难事件文本分类数据集SocialMediaDisasterEventTextClassification-qubeet 数据来源:互联网公开数据 标签:文本分类, 灾难事件, 社交媒体, 自然语言处理, 机器学习, 情感分析, 预训练词向量, 语料库 数据概述:... -
心理健康文章摘要分析数据集MentalHealthArticleSummaryAnalysis-terrychanorg
心理健康文章摘要分析数据集MentalHealthArticleSummaryAnalysis-terrychanorg 数据来源:互联网公开数据 标签:心理健康, 摘要, 文本分析, 自然语言处理, 摘要生成, 情感分析, 文本长度, 语料库 数据概述: 该数据集包含来自互联网的文章,记录了文章标题、摘要、正文内容及其对应的URL。主要特征如下:... -
仇恨言论检测文本数据集HateSpeechDetectionTextDataset-minhmai17
仇恨言论检测文本数据集HateSpeechDetectionTextDataset-minhmai17 数据来源:互联网公开数据 标签:仇恨言论, 文本分类, 社交媒体, 自然语言处理, 情感分析, 政治言论, 恶意内容, 语料库 数据概述:... -
阿拉伯语文本情感分类数据集ArabicTextSentimentClassificationDataset-alinasir1596
阿拉伯语文本情感分类数据集ArabicTextSentimentClassificationDataset-alinasir1596 数据来源:互联网公开数据 标签:情感分析, 阿拉伯语, 文本分类, 自然语言处理, 情感极性, 机器学习, 语料库, 数据标注 数据概述:... -
编程问答社区问题文本数据集ProgrammingQ-ACommunityQuestionTextData-nandhinirjs
编程问答社区问题文本数据集ProgrammingQ-ACommunityQuestionTextData-nandhinirjs 数据来源:互联网公开数据 标签:编程问答, 文本分析, 自然语言处理, 问答系统, 文本挖掘, 社区数据, 机器学习, 语料库 数据概述:... -
印地语语料库数据集HindiCorpusDataset-flaming0
印地语语料库数据集HindiCorpusDataset-flaming0 数据来源:互联网公开数据 标签:印地语,语料库,自然语言处理,文本分析,语言学,机器学习,数据集,印度 数据概述: 该数据集包含来自互联网和公开资源的印地语文本数据,记录了印地语的丰富文本信息。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2022年。... -
土耳其新闻文章分类数据集TurkishNewsArticlesClassificationDataset-denizhanahin
土耳其新闻文章分类数据集TurkishNewsArticlesClassificationDataset-denizhanahin 数据来源:互联网公开数据 标签:新闻文章, 文本分类, 土耳其语, 内容分析, 类别识别, 自然语言处理, 机器学习, 语料库 数据概述: 该数据集包含来自土耳其TRT... -
邮件礼貌性文本情感分析数据集EmailPolitenessTextSentimentAnalysis-gouravawasthi
邮件礼貌性文本情感分析数据集EmailPolitenessTextSentimentAnalysis-gouravawasthi 数据来源:互联网公开数据 标签:文本情感分析, 邮件数据, 礼貌性, 情感分类, 自然语言处理, 文本标注, 机器学习, 语料库 数据概述:... -
文本校对与润色训练数据集TextProofreadingandPolishingTrainingDataset-hustzx
文本校对与润色训练数据集TextProofreadingandPolishingTrainingDataset-hustzx 数据来源:互联网公开数据 标签:文本校对, 润色, 错误检测, 自然语言处理, 文本纠错, 机器学习, 数据清洗, 语料库 数据概述:...