-
代码审查文件数据集OutputChecksFilesDataset-robinlord
代码审查文件数据集OutputChecksFilesDataset-robinlord 数据来源:互联网公开数据 标签:代码审查,代码质量,数据集,软件工程,机器学习,自然语言处理,文本分析,代码分析 数据概述: 该数据集包含了代码审查过程中产生的各种输出文件,主要用于分析代码质量,发现潜在缺陷以及评估代码审查的效果。主要特征如下:... -
Jigsaw评论数据集JigsawCleanedDataV6-moniquebadjemaa
Jigsaw评论数据集JigsawCleanedDataV6-moniquebadjemaa 数据来源:互联网公开数据 标签:文本分析,自然语言处理,数据集,评论,毒性检测,情感分析,机器学习,社交媒体 数据概述: 该数据集由 Jigsaw 团队提供,包含了来自不同在线平台的评论数据,旨在用于毒性检测和情感分析等自然语言处理任务。主要特征如下:... -
保罗-科埃略炼金术士小说文本数据集-stealthtechnologies
保罗-科埃略炼金术士小说文本数据集-stealthtechnologies 数据来源:互联网公开数据 标签:小说,文学,文本分析,数据集,阅读理解,情感分析,自然语言处理,语料库 数据概述: 该数据集包含保罗·科埃略创作的小说《炼金术士》的文本数据,记录了小说的完整内容。主要特征如下: 时间跨度:数据记录的时间范围为小说创作出版至今。... -
CCF金融文本情感分析数据集-danielfme
CCF金融文本情感分析数据集-danielfme 数据来源:互联网公开数据 标签:金融,文本分析,情感分析,自然语言处理,机器学习,数据集,中文,金融科技 数据概述: 该数据集包含来自CCF(中国计算机学会)金融领域的文本数据,主要用于情感分析任务。主要特征如下: 时间跨度:数据记录的时间跨度不明确,但主要反映金融领域相关的文本信息。... -
GDPR咨询问答测试数据集GDPRQ-ATestDataset-iuliabunescu23
GDPR咨询问答测试数据集GDPRQ-ATestDataset-iuliabunescu23 数据来源:互联网公开数据 标签:数据隐私,GDPR,问答系统,自然语言处理,法律合规,数据保护,机器学习,文本分析 数据概述: 该数据集包含与欧盟通用数据保护条例(GDPR)相关的问答对,用于测试和评估问答系统在数据隐私领域的性能。主要特征如下:... -
GPT生成文本数据集GPT-GeneratedTextDataset-manshanand
GPT生成文本数据集GPT-GeneratedTextDataset-manshanand 数据来源:互联网公开数据 标签:自然语言处理,文本生成,数据集,机器学习,人工智能,语言模型,文本分析,深度学习 数据概述: 该数据集包含由GPT(生成预训练转换器)模型生成的文本数据,记录了模型在不同输入下的输出文本。主要特征如下:... -
股票市场新闻数据集-arthuruguendemendona
股票市场新闻数据集-arthuruguendemendona 数据来源:互联网公开数据 标签:股票市场,新闻,情感分析,自然语言处理,金融科技,文本分析,市场预测,机器学习 数据概述: 该数据集包含来自各种新闻来源的股票市场相关新闻文章,记录了股票市场的新闻事件和市场情绪。主要特征如下: 时间跨度:数据记录的时间范围从[起始年份]到[结束年份]。... -
数学问题解答数据集-jaimatadi22
数学问题解答数据集-jaimatadi22 数据来源:互联网公开数据 标签:数学,问题解答,数据集,教育,机器学习,自然语言处理,文本分析,算术 数据概述: 该数据集包含一系列简单的数学问题及其对应的解答。主要特征如下: 时间跨度: 数据记录的时间范围不限。 地理范围: 数据来源不限。 数据维度: 数据集包括数学问题文本,对应的正确答案。 数据格式:... -
垃圾短信分类数据集SpamSMSClassificationDataset-geetmukherjee
垃圾短信分类数据集SpamSMSClassificationDataset-geetmukherjee 数据来源:互联网公开数据 标签:短信分类,垃圾短信,数据集,文本分析,机器学习,自然语言处理,通信安全,数据挖掘 数据概述: 该数据集包含来自公开来源的短信数据,记录了用户收到的短信内容及其是否为垃圾短信的标签。主要特征如下:... -
土耳其语文本数据集Linux-denizhanahin
土耳其语文本数据集Linux-denizhanahin 数据来源:互联网公开数据 标签:土耳其语,文本,数据集,自然语言处理,语言模型,文本分析,机器翻译,Linux 数据概述: 该数据集包含来自Linux环境下的土耳其语文本数据,主要记录了各种Linux系统和应用程序的土耳其语文本信息。主要特征如下:... -
多语言句子对相似度数据集PAWS-XAnchorsDataset-themirachathumina
多语言句子对相似度数据集PAWS-XAnchorsDataset-themirachathumina 数据来源:互联网公开数据 标签:自然语言处理,机器学习,数据集,句子相似度,多语言,文本分析,语义理解,深度学习 数据概述: 该数据集包含来自PAWS-X项目的多语言句子对数据,记录了不同语言中句子对的相似度关系。主要特征如下:... -
电影类型分析数据集MovieDatasetwithGenres-garimatata
电影类型分析数据集MovieDatasetwithGenres-garimatata 数据来源:互联网公开数据 标签:电影,数据集,类型分析,电影推荐,机器学习,文本分析,娱乐,影视 数据概述: 该数据集包含来自互联网的电影数据,记录了电影的详细信息,包括电影名称,上映年份,评分,评论,演员,导演以及电影类型等。主要特征如下:... -
评论余弦相似度结果数据集YorumCosineSimilaritySonuclariDataset-hasankuluk1
评论余弦相似度结果数据集YorumCosineSimilaritySonuclariDataset-hasankuluk1 数据来源:互联网公开数据 标签:文本分析,自然语言处理,数据集,相似度计算,机器学习,情感分析,文本挖掘,信息检索 数据概述: 该数据集包含来自网络评论的余弦相似度计算结果,记录了不同评论之间的相似度分数。主要特征如下:... -
局部敏感哈希LSH文档数据集-massivedatamining
局部敏感哈希LSH文档数据集-massivedatamining 数据来源:互联网公开数据 标签:文本分析,局部敏感哈希,数据集,文档检索,信息检索,机器学习,自然语言处理,相似性搜索 数据概述:该数据集包含了用于研究和评估局部敏感哈希(LSH)算法的文档集合。主要特征如下: 时间跨度:数据记录的时间范围不限,取决于文档的创建时间。... -
Formspring问答社交平台数据集FormspringDataset-ppujari
Formspring问答社交平台数据集FormspringDataset-ppujari 数据来源:互联网公开数据 标签:社交媒体,问答,数据集,文本分析,自然语言处理,用户行为,情感分析,社交网络 数据概述: 该数据集包含来自 Formspring 社交问答平台的数据,记录了用户在平台上的提问,回答及相关互动信息。主要特征如下:... -
美国高中生议论文写作能力评估数据集AESPersuadeDataset-mcqueencaine
美国高中生议论文写作能力评估数据集AESPersuadeDataset-mcqueencaine 数据来源:互联网公开数据 标签:教育评估,议论文写作,数据集,机器学习,文本分析,教育技术,自然语言处理,高中教育 数据概述: 该数据集包含来自美国高中生议论文写作能力评估项目(Automated Essay Scoring -... -
微信公众号新闻数据数据集-mastermust
微信公众号新闻数据数据集-mastermust 数据来源:互联网公开数据 标签:微信公众号,新闻,社交媒体,文本分析,自然语言处理,舆情分析,数据集,内容分析 数据概述: 该数据集包含来自微信公众号的新闻文章数据,记录了微信公众号发布的文章内容,发布时间,阅读量,点赞量等信息。主要特征如下:... -
消费者情感分析数据集SentimentAnalysisofRelianceDataset-vivekshah2004
消费者情感分析数据集SentimentAnalysisofRelianceDataset-vivekshah2004 数据来源:互联网公开数据 标签:情感分析,消费者行为,数据集,自然语言处理,机器学习,零售业,文本分析,商业智能 数据概述: 该数据集记录了消费者对Reliance公司及其产品的情感评价,适用于情感分析,文本挖掘等任务。主要特征如下:... -
最近10篇帖子数据集Last10PostsDataDataset-agrimjain0206
最近10篇帖子数据集Last10PostsDataDataset-agrimjain0206 数据来源:互联网公开数据 标签:社交媒体,帖子数据,数据集,文本分析,情感分析,自然语言处理,数据挖掘,网络行为 数据概述: 该数据集包含来自社交媒体平台的最近10篇帖子数据,记录了用户发布的内容。主要特征如下:... -
电影多标签分类验证集数据集-chizhauhan
电影多标签分类验证集数据集-chizhauhan 数据来源:互联网公开数据 标签:电影,多标签分类,数据集,机器学习,文本分析,情感分析,电影推荐,自然语言处理 数据概述: 该数据集包含了电影的多标签分类验证集数据,用于评估和验证多标签分类模型在电影领域的表现。主要特征如下: 时间跨度:数据记录的时间跨度不明确,主要关注于电影本身的内容和属性。...