-
Jigsaw毒性评论分类挑战数据集JigsawToxicCommentClassificationChallengeDataset-santhoshkakarla
Jigsaw毒性评论分类挑战数据集JigsawToxicCommentClassificationChallengeDataset-santhoshkakarla 数据来源:互联网公开数据 标签:评论分类,数据集,自然语言处理,机器学习,文本分析,社交网络,人工智能,情感分析... -
社交媒体用户情感分析数据集SocialMediaUserSentimentAnalysis-brisingeur
社交媒体用户情感分析数据集SocialMediaUserSentimentAnalysis-brisingeur 数据来源:互联网公开数据 标签:情感分析, 社交媒体, 文本分析, 情绪识别, 自然语言处理, 数据挖掘, 机器学习, 舆情分析 数据概述:... -
民宿房源信息分析数据集AirbnbListingInformationAnalysis-franciscomisa
民宿房源信息分析数据集AirbnbListingInformationAnalysis-franciscomisa 数据来源:互联网公开数据 标签:民宿, 房源, 租赁, 价格, 住宿, 预测, 机器学习, 文本分析 数据概述:... -
语言工具错误检测数据集LanguageToolErrorDetectionDataset-liangqiuyuan1
语言工具错误检测数据集LanguageToolErrorDetectionDataset-liangqiuyuan1 数据来源:互联网公开数据 标签:自然语言处理,文本分析,错误检测,机器学习,语言工具,数据集,语法检查,文本处理 数据概述:... -
Web搜索与数据挖掘竞赛WSDMCup数据集WebSearchandDataMiningCompetitionDataset-vicks18
Web搜索与数据挖掘竞赛WSDMCup数据集WebSearchandDataMiningCompetitionDataset-vicks18 数据来源:互联网公开数据 标签:数据挖掘,搜索引擎,机器学习,文本分析,信息检索,推荐系统,数据集,算法竞赛 数据概述:该数据集来自Web搜索与数据挖掘竞赛(WSDM... -
科勒里奇预处理文本数据集ColeridgeProcessedTextDataset-peaceduck
科勒里奇预处理文本数据集ColeridgeProcessedTextDataset-peaceduck 数据来源:互联网公开数据 标签:文本处理,数据集,自然语言处理,机器学习,文本分析,语言模型,数据处理,学术研究 数据概述:该数据集包含来自科勒里奇项目(Coleridge... -
用户行为与故事互动数据集UserBehavior-StoryInteractionDataset-erdzhemadinov
用户行为与故事互动数据集UserBehavior-StoryInteractionDataset-erdzhemadinov 数据来源:互联网公开数据 标签:用户行为分析, 故事互动, 推荐系统, 客户画像, 交易数据, 文本分析, 机器学习, 行为预测 数据概述:... -
数据2019年4月至9月搜索Feed新闻聚合数据集RSSFeedApril-September2019fromSearchFeedIME-davidesantangelo
2019年4月至9月搜索Feed新闻聚合数据集RSSFeedApril-September2019fromSearchFeedIME-davidesantangelo 数据来源:互联网公开数据 标签:新闻聚合,数据集,RSS,文本分析,信息检索,机器学习,媒体研究,网络数据 数据概述:... -
英语作文评分预测模型结果数据集EssayScoringPredictionModelResults-ye11725
英语作文评分预测模型结果数据集EssayScoringPredictionModelResults-ye11725 数据来源:互联网公开数据 标签:作文评分, 机器预测, 模型结果, 机器学习, 文本分析, 模型评估, 回归分析, OOF预测 数据概述:... -
在线教育反馈文本分析数据集OnlineEducationFeedbackTextAnalysis-kagglemini
在线教育反馈文本分析数据集OnlineEducationFeedbackTextAnalysis-kagglemini 数据来源:互联网公开数据 标签:在线教育, 文本分析, 情感分析, 教育评价, 自然语言处理, 观点挖掘, 写作评估, 机器学习 数据概述:... -
新闻订阅源数据RSSNewsFeedData-kopaldixit
新闻订阅源数据RSSNewsFeedData-kopaldixit 数据来源:互联网公开数据 标签:新闻,RSS,数据集,自然语言处理,文本分析,信息检索,机器学习,新闻聚合 数据概述: 该数据集包含来自RSS新闻订阅源的数据,记录了新闻文章的标题、摘要、正文、发布时间、来源网站等信息。主要特征如下:... -
维基文本清洗数据集第二部分WikitextCleanDataPart2Dataset-yingpengchen
维基文本清洗数据集第二部分WikitextCleanDataPart2Dataset-yingpengchen 数据来源:互联网公开数据 标签:自然语言处理,文本数据,数据集,文本清洗,机器学习,语言模型,信息检索,文本分析 数据概述: 该数据集是维基文本清洗数据集的第二部分,包含了从维基百科中提取和清洗过的文本数据。主要特征如下:... -
孟加拉文化遗产图像问答数据集BanglaCulturalHeritageImageQuestionAnsweringDataset-nisha0202
孟加拉文化遗产图像问答数据集BanglaCulturalHeritageImageQuestionAnsweringDataset-nisha0202 数据来源:互联网公开数据 标签:图像问答, 孟加拉文化, 图像识别, 自然语言处理, 历史建筑, 文化遗产, 多模态数据, 文本分析 数据概述:... -
推特推文数据集TwitterTweetsData-pratikpujarichef
推特推文数据集TwitterTweetsData-pratikpujarichef 数据来源:互联网公开数据 标签:社交媒体,推文,数据集,文本分析,情感分析,自然语言处理,机器学习,舆情分析 数据概述: 该数据集包含来自Twitter(推特)的推文数据,记录了用户发布的文本内容及相关信息。主要特征如下:... -
商品描述及分类数据集ProductDescriptionandClassificationDataset-tusharsarkar
商品描述及分类数据集ProductDescriptionandClassificationDataset-tusharsarkar 数据来源:互联网公开数据 标签:商品描述, 商品分类, 文本分析, 品牌, 电商, 零售, 文本挖掘, 机器学习 数据概述:... -
泰卢固语图书数据集TeluguBooksDataset-vishnugandavarapu
泰卢固语图书数据集TeluguBooksDataset-vishnugandavarapu 数据来源:互联网公开数据 标签:泰卢固语,图书,数据集,语言学,文化研究,文本分析,机器学习,数字资源 数据概述: 该数据集包含来自互联网的泰卢固语图书数据,记录了泰卢固语文学作品的相关信息。主要特征如下: 时间跨度:数据记录的时间范围从19世纪至今。... -
商品标题文本数据集ProductTitleTextData-composto
商品标题文本数据集ProductTitleTextData-composto 数据来源:互联网公开数据 标签:商品标题, 文本数据, 商品识别, 文本分析, 巴西市场, 零售商品, 自然语言处理, 命名实体识别 数据概述: 该数据集包含来自巴西市场的商品标题文本,记录了各种商品的名称和对应的商品ID。主要特征如下:... -
公司信息行业分类数据集CompanyInformationIndustryClassification-kaleab1
公司信息行业分类数据集CompanyInformationIndustryClassification-kaleab1 数据来源:互联网公开数据 标签:公司信息, 行业分类, 商业数据, 企业分析, 市场调研, 数据挖掘, 机器学习, 文本分析 数据概述: 该数据集包含来自公开渠道的公司信息,记录了公司的基本属性及行业分类信息。主要特征如下:... -
阿拉伯语文本对比分析数据集ArabicTextComparativeAnalysisDataset-ynawal
阿拉伯语文本对比分析数据集ArabicTextComparativeAnalysisDataset-ynawal 数据来源:互联网公开数据 标签:阿拉伯语, 文本分析, 文本对比, 自然语言处理, 语言学, 语料库, 文本挖掘, 语义分析 数据概述: 该数据集包含来自不同来源的阿拉伯语文本,记录了用于文本对比分析的语料。主要特征如下:... -
葡萄酒品鉴笔记分析数据集WineTastingNotesAnalysis-statiana
葡萄酒品鉴笔记分析数据集WineTastingNotesAnalysis-statiana 数据来源:互联网公开数据 标签:葡萄酒, 品鉴笔记, 文本分析, 自然语言处理, 情感分析, 葡萄酒产区, 数据清洗, 机器学习 数据概述: 该数据集包含来自葡萄酒品鉴笔记的数据,记录了不同年份、不同葡萄酒的品鉴描述。主要特征如下:...