-
PyTorch深度学习教材配套数据集PyTorchBookDataset-joelorellana
PyTorch深度学习教材配套数据集PyTorchBookDataset-joelorellana 数据来源:互联网公开数据 标签:深度学习,PyTorch,数据集,机器学习,计算机视觉,自然语言处理,数据科学,编程教材 数据概述:... -
文本评论有毒性检测数据集TextCommentToxicityDetection-weihengluo
文本评论有毒性检测数据集TextCommentToxicityDetection-weihengluo 数据来源:互联网公开数据 标签:文本分类, 毒性检测, 评论分析, 情感分析, 机器学习, 自然语言处理, 深度学习, 数据标注 数据概述: 该数据集包含来自在线评论平台的数据,记录了用户发布的评论文本及其对应的毒性标签。主要特征如下:... -
预处理新闻数据集Roberta版本新闻数据集Pre-ProcessedNewsDatasetsforRoberta-crypticghost
预处理新闻数据集Roberta版本新闻数据集Pre-ProcessedNewsDatasetsforRoberta-crypticghost 数据来源:互联网公开数据 标签:新闻数据集,预处理,自然语言处理,机器学习,文本分析,Roberta模型,文本分类,情感分析 数据概述:... -
德国政治人物推特文本分析数据集GermanPoliticiansTwitterTextAnalysis-ianfischer
德国政治人物推特文本分析数据集GermanPoliticiansTwitterTextAnalysis-ianfischer 数据来源:互联网公开数据 标签:推特数据, 政治人物, 文本分析, 自然语言处理, 社交媒体, 舆情分析, 德国政治, 情感分析 数据概述:... -
大语言模型输出偏好对比数据集LargeLanguageModelOutputPreferenceComparison-rushali98
大语言模型输出偏好对比数据集LargeLanguageModelOutputPreferenceComparison-rushali98 数据来源:互联网公开数据 标签:大语言模型, 模型评估, 偏好分析, 文本对比, 自然语言处理, 机器学习, 模型训练, 人工智能 数据概述:... -
中文文本情感分析数据集ChineseTextSentimentAnalysis-anasmashadchowdhury
中文文本情感分析数据集ChineseTextSentimentAnalysis-anasmashadchowdhury 数据来源:互联网公开数据 标签:情感分析, 文本分类, 中文文本, 情感极性, 自然语言处理, 机器学习, 情感标注, 数据集 数据概述: 该数据集包含来自互联网的中文文本数据,记录了文本内容及其对应的情感极性。主要特征如下:... -
语音识别与自然语言处理对话数据集SAMVAAD-HIV1-GEMMADataset-harveenchadha
语音识别与自然语言处理对话数据集SAMVAAD-HIV1-GEMMADataset-harveenchadha 数据来源:互联网公开数据 标签:语音识别,自然语言处理,对话系统,数据集,机器学习,语音合成,多语言处理,人工智能 数据概述: 该数据集来自SAMVAAD-HI... -
法律文档检索数据集BKALegalDocumentRetrievalCorpus-ictunivers
法律文档检索数据集BKALegalDocumentRetrievalCorpus-ictunivers 数据来源:互联网公开数据 标签:法律,文档检索,数据集,信息检索,自然语言处理,文本分类,法律科技,机器学习 数据概述: 该数据集包含来自德国联邦刑事警察局(BKA)的法律文档检索数据,记录了法律文档的检索和分类信息。主要特征如下:... -
社交平台评论毒性评估数据集SocialPlatformCommentToxicityAssessment-simonmeoni
社交平台评论毒性评估数据集SocialPlatformCommentToxicityAssessment-simonmeoni 数据来源:互联网公开数据 标签:文本分类, 毒性检测, 评论分析, 自然语言处理, 机器学习, 情感分析, 社交媒体, 语料库 数据概述:... -
越南语图片文字识别数据集VietnameseImageTextRecognitionDataset-thanhnguyen44
越南语图片文字识别数据集VietnameseImageTextRecognitionDataset-thanhnguyen44 数据来源:互联网公开数据 标签:图像识别, OCR, 越南语, 文字检测, 数据标注, 深度学习, 自然语言处理, 文本识别 数据概述:... -
学生写作质量评估数据集StudentEssayQualityAssessment-jay12332
学生写作质量评估数据集StudentEssayQualityAssessment-jay12332 数据来源:互联网公开数据 标签:文本分析, 写作评估, 机器学习, 自然语言处理, 情感分析, 文本分类, 教育, 语料库 数据概述: 该数据集包含来自不同来源的学生写作文章,旨在用于评估学生的写作质量。主要特征如下:... -
餐厅评论情感分析数据集RestaurantReviewSentimentAnalysisDataset-sree1ekha
餐厅评论情感分析数据集RestaurantReviewSentimentAnalysisDataset-sree1ekha 数据来源:互联网公开数据 标签:餐厅,评论,情感分析,自然语言处理,数据集,文本挖掘,机器学习,情感分类 数据概述:该数据集包含来自不同餐厅的评论数据,记录了顾客对餐厅的评价。主要特征如下:... -
酒店评论情感分析数据集HotelReviewSentimentAnalysisDataset-anastasiia6666
酒店评论情感分析数据集HotelReviewSentimentAnalysisDataset-anastasiia6666 数据来源:互联网公开数据 标签:酒店评论, 情感分析, 文本挖掘, 客户体验, 评分预测, 自然语言处理, 旅游行业, 酒店管理 数据概述:... -
社交媒体平台仇恨言论与攻击性内容分析数据集SocialMediaHateSpeechandOffensiveContentAnalysis-jujoooo
社交媒体平台仇恨言论与攻击性内容分析数据集SocialMediaHateSpeechandOffensiveContentAnalysis-jujoooo 数据来源:互联网公开数据 标签:仇恨言论, 攻击性内容, 文本分析, 情感分析, 社交媒体, 文本分类, 自然语言处理, 数据标注 数据概述:... -
Zalo推荐系统竞赛数据集ZaloRecommendationSystemCompetitionDataset-thoquang12345
Zalo推荐系统竞赛数据集ZaloRecommendationSystemCompetitionDataset-thoquang12345 数据来源:互联网公开数据 标签:推荐系统, 机器学习, 自然语言处理, 文本分析, 用户行为, 数据挖掘, 竞赛数据集, 深度学习 数据概述:... -
法律文本语料库2010-2020年中国法律文本语料库-lthnhtinostic
法律文本语料库2010-2020年中国法律文本语料库-lthnhtinostic 数据来源:互联网公开数据 标签:法律文本,语料库,法律研究,数据集,自然语言处理,文本分析,法学,法律应用 数据概述:该数据集包含来自中国公开法律数据库的法律文本数据,记录了2010年至2020年间发布的法律、法规、司法解释等详细信息。主要特征如下:... -
消费者金融投诉数据集CFPBConsumerComplaintsDataset-z4r4zone
消费者金融投诉数据集CFPBConsumerComplaintsDataset-z4r4zone 数据来源:互联网公开数据 标签:消费者金融,投诉,数据集,金融服务,消费者保护,文本分析,自然语言处理,政府数据 数据概述: 该数据集包含来自美国消费者金融保护局(CFPB)的消费者投诉数据,记录了消费者对各种金融产品和服务的投诉信息。主要特征如下:... -
电子产品用户评价数据集-pritech
电子产品用户评价数据集-pritech 数据来源:互联网公开数据 标签:用户评价,电子产品,情感分析,文本挖掘,自然语言处理,机器学习,产品推荐,消费者行为 数据概述: 该数据集包含来自亚马逊等电商平台的电子产品用户评价数据,记录了用户对各种电子产品的评价信息。主要特征如下: 时间跨度:数据记录的时间范围通常为数年,具体取决于数据集的创建时间。... -
虚假新闻综合数据集CombinedFakeNewsDataset-saidurabir
虚假新闻综合数据集CombinedFakeNewsDataset-saidurabir 数据来源:互联网公开数据 标签:虚假新闻,新闻分析,文本分类,自然语言处理,机器学习,舆情分析,社交媒体,信息真伪 数据概述: 该数据集整合了多个来源的虚假新闻数据,旨在为研究人员提供一个全面的、用于虚假新闻检测和分析的资源。主要特征如下:... -
扩散模型与GPT4生成数据集DiffusionDBGPT4GeneratedDataset-jennga
扩散模型与GPT4生成数据集DiffusionDBGPT4GeneratedDataset-jennga 数据来源:互联网公开数据 标签:人工智能,扩散模型,生成数据,自然语言处理,机器学习,数据集,文本生成,深度学习 数据概述: 该数据集包含了由扩散模型与GPT4协同生成的文本数据,记录了不同主题和风格的文本内容。主要特征如下:...