-
法文与英文平行语料数据集French-EnglishParallelCorpusDataset-mayankkalbande9
法文与英文平行语料数据集French-EnglishParallelCorpusDataset-mayankkalbande9 数据来源:互联网公开数据 标签:语言翻译,平行语料,数据集,自然语言处理,机器学习,双语研究,文本分析,人工智能 数据概述: 该数据集包含法文与英文的平行语料,记录了两种语言之间的对应翻译文本。主要特征如下:... -
Spacy自然语言处理研究数据集-dsfelix
Spacy自然语言处理研究数据集-dsfelix 数据来源:互联网公开数据 标签:自然语言处理,文本分析,数据集,Spacy,语言模型,文本标注,机器学习,NLP 数据概述: 该数据集包含了用于Spacy自然语言处理研究的多个数据集,涵盖了广泛的NLP任务。主要特征如下: 时间跨度:... -
真实翻译数据集RealTranslatedDataset-tihsrahly
真实翻译数据集RealTranslatedDataset-tihsrahly 数据来源:互联网公开数据 标签:翻译,数据集,语言处理,文本分析,机器学习,自然语言处理,多语言,人工智能 数据概述: 该数据集包含来自真实翻译项目的文本数据,记录了多种语言之间的翻译对。主要特征如下: 时间跨度:数据记录的时间范围不明确,可能跨越多个时间段。... -
情感分析数据集SentimentAnalysisDataset-serkanp
情感分析数据集SentimentAnalysisDataset-serkanp 数据来源:互联网公开数据 标签:情感分析,文本分析,自然语言处理,数据集,机器学习,情感分类,文本情感,NLP 数据概述: 该数据集包含用于情感分析任务的文本数据,主要记录了文本内容及其对应的情感标签。主要特征如下:... -
俄罗斯乌克兰战争2022年4月-5月推文数据集Russia-UkraineWarFilteredTweetsDataset2022April-May-pr...
俄罗斯乌克兰战争2022年4月-5月推文数据集Russia-UkraineWarFilteredTweetsDataset2022April-May-prosenjitchatterjee 数据来源:互联网公开数据 标签:战争,推特,社交媒体,数据集,文本分析,自然语言处理,国际政治,冲突研究 数据概述:... -
阅读障碍预测数据集DyslexiaPredictionDataset-thenikhilnj45
阅读障碍预测数据集DyslexiaPredictionDataset-thenikhilnj45 数据来源:互联网公开数据 标签:阅读障碍,数据集,机器学习,儿童健康,神经科学,文本分析,教育,预测模型 数据概述: 该数据集包含用于预测阅读障碍的数据,记录了儿童的阅读能力,认知能力以及相关行为特征。主要特征如下:... -
越南法律问答数据集VI-Law-QA-3K1Dataset-hiuluc
越南法律问答数据集VI-Law-QA-3K1Dataset-hiuluc 数据来源:互联网公开数据 标签:法律问答,越南,自然语言处理,问答系统,数据集,文本分析,机器学习,法律 数据概述:该数据集包含了来自越南法律领域的问答对,旨在为越南语法律问答系统的开发和研究提供支持。主要特征如下: 时间跨度:数据记录的时间范围不定,涵盖了越南现行法律法规。... -
社交媒体用户故事与高光时刻数据集StoriesandHighlightsCSVDataset-kibs11
社交媒体用户故事与高光时刻数据集StoriesandHighlightsCSVDataset-kibs11 数据来源:互联网公开数据 标签:社交媒体,用户故事,高光时刻,文本分析,情感分析,内容推荐,数据挖掘,用户行为 数据概述:... -
多语言机器翻译结果数据集MT5MultilingualResultsDataset-devtousif
多语言机器翻译结果数据集MT5MultilingualResultsDataset-devtousif 数据来源:互联网公开数据 标签:机器翻译,多语言,数据集,自然语言处理,人工智能,翻译技术,语言学,文本分析 数据概述: 该数据集包含多语言机器翻译模型MT5的翻译结果,记录了多种语言之间的翻译准确性,速度和质量。主要特征如下:... -
个人身份信息PII泄露检测数据集-takaito
个人身份信息PII泄露检测数据集-takaito 数据来源:互联网公开数据 标签:数据安全,PII,数据集,机器学习,文本分析,信息安全,隐私保护,自然语言处理 数据概述:该数据集包含了用于个人身份信息(PII,Personal Identifiable... -
现代英语到莎士比亚英语翻译数据集-abdelazizsidenna
现代英语到莎士比亚英语翻译数据集-abdelazizsidenna 数据来源:互联网公开数据 标签:语言学,翻译,数据集,自然语言处理,文本转换,莎士比亚,机器学习,文本分析 数据概述: 该数据集旨在提供现代英语到莎士比亚英语的翻译对,用于训练和评估翻译模型。主要特征如下:... -
索赔分解-重构与验证数据集ClaimDecomposition-Restructuring-andValidationDataset-swethabalram2410
索赔分解-重构与验证数据集ClaimDecomposition-Restructuring-andValidationDataset-swethabalram2410 数据来源:互联网公开数据 标签:索赔分析,自然语言处理,文本分析,数据集,信息抽取,机器学习,金融科技,风险管理 数据概述:... -
中文文本摘要评估数据集AACLSumEvalCombinedData-shantanupatankar
中文文本摘要评估数据集AACLSumEvalCombinedData-shantanupatankar 数据来源:互联网公开数据 标签:文本摘要评估,自然语言处理,数据集,机器学习,信息检索,学术研究,语言学,文本分析... -
罗曼诗歌数据集RomanPoetryDataset-mustafa2003
罗曼诗歌数据集RomanPoetryDataset-mustafa2003 数据来源:互联网公开数据 标签:诗歌,文学,数据集,文本分析,语言学,机器翻译,文化研究,古典文学 数据概述: 该数据集包含来自罗马时期的诗歌作品,记录了古罗马诗人创作的经典诗歌。主要特征如下: 时间跨度:数据记录的时间范围从公元前2世纪到公元4世纪。... -
虚假广告检测数据集FakeAdvertisingDetectionDataset-syedahmedshah
虚假广告检测数据集FakeAdvertisingDetectionDataset-syedahmedshah 数据来源:互联网公开数据 标签:广告检测,数据集,虚假广告,机器学习,自然语言处理,文本分析,数据挖掘,商业智能 数据概述: 该数据集包含来自公开来源的虚假广告数据,记录了各类广告文本及其标签,适用于虚假广告检测,文本分类等任务。主要特征如下:... -
正负样本对书写数据集Positive-NegativePairHandwritingDataset-mariyamtahir
正负样本对书写数据集Positive-NegativePairHandwritingDataset-mariyamtahir 数据来源:互联网公开数据 标签:手写识别,数据集,模式识别,数据增强,机器学习,计算机视觉,文本分析,自然语言处理 数据概述: 该数据集包含正负样本对的手写数据,记录了手写文本的识别与分类任务所需的训练和验证样本。主要特征如下:... -
自然语言处理与BERT模型评论数据集NLPBERTReviewsDataset-topcoder101
自然语言处理与BERT模型评论数据集NLPBERTReviewsDataset-topcoder101 数据来源:互联网公开数据 标签:自然语言处理,BERT模型,数据集,文本分析,机器学习,情感分析,深度学习,人工智能 数据概述: 该数据集包含来自多个平台的用户评论数据,记录了不同领域的产品或服务的用户评价。主要特征如下:... -
亚马逊机器学习训练数据集AmazonMLTrainDataset-bhavanabandi
亚马逊机器学习训练数据集AmazonMLTrainDataset-bhavanabandi 数据来源:互联网公开数据 标签:机器学习,数据集,亚马逊,训练数据,自然语言处理,文本分析,推荐系统,数据挖掘 数据概述: 该数据集包含来自亚马逊的各种数据,主要用于机器学习模型的训练和评估。主要特征如下:... -
替换逗号数据集ReplacingCommaDataset-rojaramani
替换逗号数据集ReplacingCommaDataset-rojaramani 数据来源:互联网公开数据 标签:数据清理,文本处理,数据集,自然语言处理,数据预处理,文本分析,数据科学,编程 数据概述:该数据集包含来自互联网公开的数据,记录了需要进行逗号替换的文本片段。主要特征如下: 时间跨度:数据记录的时间范围从2020年到2022年。... -
循环神经网络自然语言处理数据集RecurrentNeuralNetworkNLPDataset-jazidesigns
循环神经网络自然语言处理数据集RecurrentNeuralNetworkNLPDataset-jazidesigns 数据来源:互联网公开数据 标签:自然语言处理,循环神经网络,数据集,机器学习,文本分析,深度学习,语言模型,序列建模 数据概述:...