-
真实与虚假论文数据集RealandFakeEssaysDataset-olegnsemenov
真实与虚假论文数据集RealandFakeEssaysDataset-olegnsemenov 数据来源:互联网公开数据 标签:文本分析,自然语言处理,数据集,论文写作,机器学习,文本分类,学术诚信,写作风格 数据概述: 该数据集包含真实论文和虚假论文的数据,旨在用于文本分析和学术诚信研究。主要特征如下: 时间跨度:... -
孟加拉语转罗马字数据集BanglatoRomanTransliterationDataset-nazmuddhohaansary
孟加拉语转罗马字数据集BanglatoRomanTransliterationDataset-nazmuddhohaansary 数据来源:互联网公开数据 标签:孟加拉语,罗马字,转写,数据集,自然语言处理,语言学,机器学习,文本分析 数据概述:... -
推特训练数据集TwitterTrainingDataset-aatithi
推特训练数据集TwitterTrainingDataset-aatithi 数据来源:互联网公开数据 标签:社交媒体,文本分析,机器学习,情感分析,自然语言处理,数据挖掘,情感计算,数据标注 数据概述: 该数据集包含来自推特平台的公开文本数据,记录了用户发布的推文及其相关特征。主要特征如下:... -
表情符号数据集EmojiDataset-thecavemanjonno
表情符号数据集EmojiDataset-thecavemanjonno 数据来源:互联网公开数据 标签:表情符号,数据集,自然语言处理,情感分析,文本分析,机器学习,社交媒体,情感识别 数据概述: 该数据集包含了各种表情符号及其对应的文本描述和上下文信息。主要特征如下: 时间跨度: 数据记录的时间范围不限,涵盖了多种表情符号的发布和使用时间。... -
英语推文数据集Tweet-EnglishDataset-mahdimahdi55
英语推文数据集Tweet-EnglishDataset-mahdimahdi55 数据来源:互联网公开数据 标签:社交媒体,文本分析,数据集,情感分析,自然语言处理,机器学习,情感识别,数据挖掘 数据概述: 该数据集包含来自Twitter平台的英语推文数据,记录了用户在社交媒体上的文本内容。主要特征如下:... -
机器学习工程师岗位描述数据集-hasankumar
机器学习工程师岗位描述数据集-hasankumar 数据来源:互联网公开数据 标签:机器学习,岗位描述,自然语言处理,文本分析,招聘,职位,数据科学,职业发展 数据概述: 该数据集包含了来自互联网的机器学习工程师岗位描述信息,记录了不同公司发布的招聘信息,旨在分析和理解机器学习工程师的职位要求,技能需求,工作职责等。主要特征如下: 时间跨度:... -
原始与清洗后的评论数据集OriginalandCleanedReviewsDatasets-ryancamus
原始与清洗后的评论数据集OriginalandCleanedReviewsDatasets-ryancamus 数据来源:互联网公开数据 标签:文本分析,数据集,情感分析,自然语言处理,机器学习,评论数据处理,数据清洗,文本挖掘 数据概述: 该数据集包含来自多个在线平台的用户评论数据,记录了原始评论文本和经过清洗处理的评论文本。主要特征如下:... -
好书推荐集1960-2022
好书推荐集1960-2022 数据来源:互联网公开数据 标签:好书推荐,书籍描述,书籍封面,书籍分类,书籍评分,文本分析,图像分析 数据概述: 本数据集收录了1960年至2022年间在Goodreads网站上被广泛推荐的书籍信息,包括书籍的封面图片、书籍描述、书籍分类和评分等关键要素。数据集旨在为研究书籍描述和封面与其分类及评分之间的关系提供基础数据。... -
跨站脚本攻击XSS数据集-abdulrahmanalhendi
跨站脚本攻击XSS数据集-abdulrahmanalhendi 数据来源:互联网公开数据 标签:网络安全,XSS攻击,数据集,机器学习,文本分析,恶意代码,安全研究,自然语言处理 数据概述:该数据集包含了用于检测和分析跨站脚本攻击(XSS)的恶意代码样本和正常网页内容。主要特征如下:... -
文档摘要生成数据集DocumentAbstractiveSummarizationGivenQueryDataset-jastorj
文档摘要生成数据集DocumentAbstractiveSummarizationGivenQueryDataset-jastorj 数据来源:互联网公开数据 标签:文档摘要,摘要生成,自然语言处理,机器学习,文本分析,问答系统,数据集,信息检索 数据概述:该数据集包含来自多个来源的文档及其对应的摘要,适用于基于查询的文档摘要生成任务。主要特征如下:... -
人机交互兴趣与道德偏好数据集PromptandResponsesInterestsandMoralsDataset-arunsensei
人机交互兴趣与道德偏好数据集PromptandResponsesInterestsandMoralsDataset-arunsensei 数据来源:互联网公开数据 标签:人机交互,兴趣,道德,自然语言处理,数据集,情感分析,机器学习,文本分析... -
BERT基础模型未分大小写文本处理数据集BERT-base-uncased-fresh-ep1Dataset-blackitten13
BERT基础模型未分大小写文本处理数据集BERT-base-uncased-fresh-ep1Dataset-blackitten13 数据来源:互联网公开数据 标签:自然语言处理,文本分析,机器学习,深度学习,BERT模型,语言模型,数据集,AI应用 数据概述:... -
自然语言处理生成答案数据集NIRGeneratedAnswersDataset-mrsimple07
自然语言处理生成答案数据集NIRGeneratedAnswersDataset-mrsimple07 数据来源:互联网公开数据 标签:自然语言处理,生成答案,数据集,机器学习,文本分析,人工智能,信息检索,语言模型 数据概述: 该数据集包含由自然语言处理技术生成的答案,适用于对话系统,问答系统等任务。主要特征如下:... -
产品文件评论数据集Files-Reviews-ProductsDataset-yashshir7
产品文件评论数据集Files-Reviews-ProductsDataset-yashshir7 数据来源:互联网公开数据 标签:产品评论,数据集,文本分析,自然语言处理,消费者行为,机器学习,商业智能,市场研究 数据概述: 该数据集包含来自多个电商平台的消费者产品评论数据,记录了用户对各类产品的评价和反馈。主要特征如下:... -
印尼电商平台评分与评论数据集
印尼电商平台评分与评论数据集 数据来源:互联网公开数据 标签:电商平台,印尼语,用户评论,评分,文本分析,情感分析,用户体验 数据概述: 本数据集包含从Google Play... -
柯勒律治诗歌伪标签数据集ColeridgePseudo-LabelsDataset-chienhsianghung
柯勒律治诗歌伪标签数据集ColeridgePseudo-LabelsDataset-chienhsianghung 数据来源:互联网公开数据 标签:诗歌,文本分析,自然语言处理,伪标签,机器学习,情感分析,诗歌风格,语料库 数据概述: 该数据集包含由柯勒律治诗歌生成的伪标签数据,旨在用于训练文本分析和自然语言处理模型。主要特征如下:... -
古吉拉特语词性标注数据集POSTaggingforGujaratiLanguageDataset-vedantrajpurohit
古吉拉特语词性标注数据集POSTaggingforGujaratiLanguageDataset-vedantrajpurohit 数据来源:互联网公开数据 标签:自然语言处理,词性标注,古吉拉特语,数据集,语言技术,机器学习,文本分析,多语言处理 数据概述:... -
LLM模型验证数据集ValidationLLMDataset-arunsensei
LLM模型验证数据集ValidationLLMDataset-arunsensei 数据来源:互联网公开数据 标签:LLM,大语言模型,验证,评估,自然语言处理,NLP,文本分析,机器学习 数据概述:该数据集包含用于验证和评估大型语言模型(LLM)性能的数据,记录了各种类型的文本数据和相应的评估指标。主要特征如下:... -
自然语言处理与Twitter文本分析数据集NLP-TwitterTextAnalysisDataset-moeshiro
自然语言处理与Twitter文本分析数据集NLP-TwitterTextAnalysisDataset-moeshiro 数据来源:互联网公开数据 标签:自然语言处理,社交媒体,数据集,文本分析,情感分析,机器学习,数据挖掘,舆情监控 数据概述: 该数据集包含来自Twitter平台的文本数据,记录了用户在特定时间段内的推文内容及相关信息。主要特征如下:... -
统一多源数据集-DAIGT竞赛数据集
统一多源数据集-DAIGT竞赛数据集 数据来源:互联网公开数据 标签:DAIGT竞赛,LLM生成文本,数据增强,训练数据,文本分析,自然语言处理,NLP,Kaggle数据集 数据概述:...