-
多语言维基百科内容翻译对照数据集MultilingualWikipediaContentTranslationDataset-bamps53
多语言维基百科内容翻译对照数据集MultilingualWikipediaContentTranslationDataset-bamps53 数据来源:互联网公开数据 标签:机器翻译, 文本翻译, 多语言, 维基百科, 自然语言处理, 文本对齐, 语料库, 语言学 数据概述:... -
多语言问答上下文理解训练数据集MultilingualQuestionAnsweringContextUnderstandingTrainingDatas...
多语言问答上下文理解训练数据集MultilingualQuestionAnsweringContextUnderstandingTrainingDataset-ranjanrishabh 数据来源:互联网公开数据 标签:问答系统, 自然语言处理, 文本理解, 机器阅读, 多语言, 文本摘要, 语料库, 深度学习 数据概述:... -
社交平台评论毒性识别数据集SocialPlatformCommentToxicityIdentification-nohjihwan
社交平台评论毒性识别数据集SocialPlatformCommentToxicityIdentification-nohjihwan 数据来源:互联网公开数据 标签:文本分类, 毒性检测, 情感分析, 机器学习, 自然语言处理, 评论分析, 深度学习, 语料库 数据概述:... -
印地语-英语平行语料翻译数据集Hindi-EnglishParallelTranslationCorpus-chinmaycp9
印地语-英语平行语料翻译数据集Hindi-EnglishParallelTranslationCorpus-chinmaycp9 数据来源:互联网公开数据 标签:机器翻译, 语料库, 文本翻译, 自然语言处理, 双语数据, 印地语, 英语, 语言模型 数据概述: 该数据集包含来自互联网的印地语-... -
印度多语种文本转录数据集IndianMulti-languageTextTransliterationDataset-jaswanth431
印度多语种文本转录数据集IndianMulti-languageTextTransliterationDataset-jaswanth431 数据来源:互联网公开数据 标签:文本转录, 多语言, 印度语言, 机器翻译, 自然语言处理, 语料库, 语言学, 深度学习 数据概述:... -
文本数据常用词汇统计分析数据集TextDataCommonWordStatisticsAnalysis-shivamanhar
文本数据常用词汇统计分析数据集TextDataCommonWordStatisticsAnalysis-shivamanhar 数据来源:互联网公开数据 标签:文本分析, 词频统计, 自然语言处理, 语料库, 数据清洗, 文本预处理, 基础词汇, 数据集 数据概述:... -
越南语文本纠错数据集VietnameseTextErrorCorrectionDataset-khanhdaom
越南语文本纠错数据集VietnameseTextErrorCorrectionDataset-khanhdaom 数据来源:互联网公开数据 标签:越南语, 文本纠错, 自然语言处理, 错误检测, 文本校对, 机器学习, 深度学习, 语料库 数据概述:... -
阿拉伯语文本去标点数据集ArabicTextDotlessDataset-ouassimbehlil
阿拉伯语文本去标点数据集ArabicTextDotlessDataset-ouassimbehlil 数据来源:互联网公开数据 标签:阿拉伯语, 文本处理, 文本清洗, 自然语言处理, 语言模型, 字符级分析, 数据预处理, 语料库 数据概述: 该数据集包含经过处理的阿拉伯语文本,记录了原始文本及其对应的去标点版本。主要特征如下:... -
文本情感分类新闻数据集TextSentimentClassificationNewsDataset-premsaikumar
文本情感分类新闻数据集TextSentimentClassificationNewsDataset-premsaikumar 数据来源:互联网公开数据 标签:情感分析, 文本分类, 新闻, 自然语言处理, 深度学习, 语料库, 情感标签, 预训练 数据概述: 该数据集包含来自新闻报道的文本数据,记录了新闻文章的描述信息及其对应的情感类别。主要特征如下:... -
新闻文本分类数据集NewsTextClassificationDataset-brij1823
新闻文本分类数据集NewsTextClassificationDataset-brij1823 数据来源:互联网公开数据 标签:新闻文本, 文本分类, 标题分析, 自然语言处理, 新闻内容, 时间序列, 机器学习, 语料库 数据概述: 该数据集包含来自新闻媒体的文本数据,记录了新闻标题及其对应的类别。主要特征如下:... -
教育内容主题相关性文本数据集EducationalContentTopicRelevanceTextDataset-millerrfu
教育内容主题相关性文本数据集EducationalContentTopicRelevanceTextDataset-millerrfu 数据来源:互联网公开数据 标签:文本分类, 教育, 主题相关性, 自然语言处理, 机器学习, 知识图谱, 语料库, 内容理解 数据概述:... -
新闻摘要文本分析数据集NewsSummaryTextAnalysisDataset-usmannwaheed
新闻摘要文本分析数据集NewsSummaryTextAnalysisDataset-usmannwaheed 数据来源:互联网公开数据 标签:新闻摘要, 文本分析, 自然语言处理, 摘要生成, 标题生成, 文本摘要, 机器学习, 语料库 数据概述: 该数据集包含来自新闻网站的摘要信息,记录了新闻标题和对应的文本正文。主要特征如下:... -
手机与驾驶安全文本分析数据集MobilePhoneandDrivingSafetyTextAnalysis-gmhost
手机与驾驶安全文本分析数据集MobilePhoneandDrivingSafetyTextAnalysis-gmhost 数据来源:互联网公开数据 标签:手机使用, 驾驶安全, 文本分析, 事故风险, 自然语言处理, 舆情分析, 风险评估, 语料库 数据概述:... -
印度英语-阿迪提语料库数据集Hinglish-AditiCorpusDataset-donutkashvi
印度英语-阿迪提语料库数据集Hinglish-AditiCorpusDataset-donutkashvi 数据来源:互联网公开数据 标签:印度英语,语料库,自然语言处理,文本分析,语言学,机器学习,文本数据,语言资源 数据概述: 该数据集包含来自阿迪提语料库的印度英语文本数据,记录了印度英语的各种语言现象。主要特征如下:... -
细胞周期与肿瘤研究文本数据集CellCycleandTumorResearchTextData-madwolf
细胞周期与肿瘤研究文本数据集CellCycleandTumorResearchTextData-madwolf 数据来源:互联网公开数据 标签:细胞周期, 肿瘤研究, 文本分析, 生物医学, 蛋白质, 基因, 机器学习, 语料库 数据概述:... -
文本检索与自然语言处理Zalo数据集TextRetrievalandNLPZaloDataset2021-anhbuivuongtam
文本检索与自然语言处理Zalo数据集TextRetrievalandNLPZaloDataset2021-anhbuivuongtam 数据来源:互联网公开数据 标签:文本检索, 自然语言处理, 机器学习, 深度学习, 语料库, 文本分类, 机器翻译, 数据集 数据概述:... -
金融文本情感分析数据集FinancialTextSentimentAnalysis-ganeshn88
金融文本情感分析数据集FinancialTextSentimentAnalysis-ganeshn88 数据来源:互联网公开数据 标签:情感分析, 金融文本, 自然语言处理, 文本分类, 机器学习, 语料库, FinBERT, 情感标注 数据概述: 该数据集包含来自金融新闻和报告的文本数据,记录了用于情感分析的句子示例。主要特征如下:... -
人口贩卖议题文本分类数据集HumanTraffickingTopicTextClassificationDataset-phucpx
人口贩卖议题文本分类数据集HumanTraffickingTopicTextClassificationDataset-phucpx 数据来源:互联网公开数据 标签:人口贩卖, 文本分类, 议题分析, 道德伦理, 社会问题, 机器学习, 语料库, 数据标注 数据概述: 该数据集包含来自互联网的文本数据,记录了关于人口贩卖议题的讨论与分析。主要特征如下:... -
电影评论情感分析测试数据集MovieReviewsSentimentAnalysisTestData-sarthakgangwal
电影评论情感分析测试数据集MovieReviewsSentimentAnalysisTestData-sarthakgangwal 数据来源:互联网公开数据 标签:情感分析, 文本数据, 电影评论, 自然语言处理, 情感分类, 机器学习, 评论挖掘, 语料库 数据概述: 该数据集包含来自互联网的电影评论文本,记录了观众对电影的评价。主要特征如下:... -
工业化学领域语料库IndustrialChemicalDomainCorpus-shahrukhkhan
工业化学领域语料库IndustrialChemicalDomainCorpus-shahrukhkhan 数据来源:互联网公开数据 标签:工业化学,语料库,文本分析,自然语言处理,学术研究,数据科学,化学工程,机器学习 数据概述:...