-
图书推荐系统用户行为数据集BookRecommendationSystemUserBehaviorDataset-prinom
图书推荐系统用户行为数据集BookRecommendationSystemUserBehaviorDataset-prinom 数据来源:互联网公开数据 标签:图书推荐, 用户行为, 协同过滤, 数据挖掘, 图书信息, 用户画像, 评分预测, 文本分析 数据概述:... -
AI文本检测数据集-deepaksingh2510
AI文本检测数据集-deepaksingh2510 数据来源:互联网公开数据 标签:文本检测,人工智能,数据集,自然语言处理,机器学习,文本分析,图像识别,深度学习 数据概述: 该数据集旨在用于AI文本检测任务,包含了各种类型的文本图像和标注信息。主要特征如下: 时间跨度:数据记录的时间范围不限,持续更新。... -
新闻爬取与分析数据集-kennykurniadi
新闻爬取与分析数据集-kennykurniadi 数据来源:互联网公开数据 标签:新闻,文本分析,自然语言处理,数据集,舆情分析,情感分析,机器学习,新闻爬取 数据概述: 该数据集包含从多个新闻网站爬取的新闻文章数据,记录了不同来源的新闻内容、发布时间、作者、标题、正文等信息。主要特征如下: 时间跨度:数据记录的时间范围从[起始时间]到[结束时间]。... -
阿拉伯语新闻文本摘要数据集ArabicNewsTextSummarization-ynawal
阿拉伯语新闻文本摘要数据集ArabicNewsTextSummarization-ynawal 数据来源:互联网公开数据 标签:文本摘要, 阿拉伯语, 自然语言处理, 机器翻译, 文本分析, 新闻语料库, 深度学习, 语料库 数据概述: 该数据集包含来自阿拉伯语新闻文章的文本内容及其对应的摘要。主要特征如下:... -
新闻文章内容挖掘数据集NewsArticleContentMiningDataset-tousifmdaminfaisal
新闻文章内容挖掘数据集NewsArticleContentMiningDataset-tousifmdaminfaisal 数据来源:互联网公开数据 标签:新闻文章,内容挖掘,自然语言处理,文本分析,情感分析,主题建模,信息检索,机器学习 数据概述: 该数据集包含了来自各种新闻媒体的文章内容,旨在用于内容挖掘、文本分析和自然语言处理研究。主要特征如下:... -
维基百科训练数据集Wiki-TrainDataset-victoriasaz
维基百科训练数据集Wiki-TrainDataset-victoriasaz 数据来源:互联网公开数据 标签:自然语言处理,文本分析,数据集,机器学习,维基百科,文本分类,语言模型,信息检索 数据概述: 该数据集包含来自维基百科的文本数据,主要用于训练自然语言处理模型。主要特征如下:... -
泰语光学字符识别数据集OCRThaiDataset-kontheeboonmeeprakob
泰语光学字符识别数据集OCRThaiDataset-kontheeboonmeeprakob 数据来源:互联网公开数据 标签:光学字符识别,OCR,泰语,数据集,自然语言处理,图像识别,机器学习,文本分析 数据概述: 该数据集包含用于泰语光学字符识别(OCR)任务的图像数据,记录了泰语文字的图像及其对应的文本。主要特征如下:... -
OkCupid用户公开资料数据集OkCupidPublicProfileData-umairnsr87
OkCupid用户公开资料数据集OkCupidPublicProfileData-umairnsr87 数据来源:互联网公开数据 标签:社交网络,约会,用户画像,数据集,文本分析,机器学习,情感分析,用户行为 数据概述: 该数据集包含来自 OkCupid 约会网站的用户公开资料,记录了用户的个人信息和回答的问卷调查结果。主要特征如下:... -
小说阅读用户评价数据集NovelReadingUserReviews-leonerd
小说阅读用户评价数据集NovelReadingUserReviews-leonerd 数据来源:互联网公开数据 标签:小说评论, 用户评价, 文本分析, 阅读行为, 情感分析, 推荐系统, 数据挖掘, 内容推荐 数据概述: 该数据集包含来自小说阅读平台的两类数据,记录了用户对小说的评价信息。主要特征如下:... -
推荐系统与自然语言处理Zalo用户行为数据集RecommendationSystem-NLPZaloUserBehaviorDataset-anhbuivuongtam
推荐系统与自然语言处理Zalo用户行为数据集RecommendationSystem-NLPZaloUserBehaviorDataset-anhbuivuongtam 数据来源:互联网公开数据 标签:推荐系统, 自然语言处理, 用户行为分析, 文本分析, 机器学习, 数据挖掘, 社交媒体, 深度学习 数据概述:... -
阿拉伯语新闻摘要数据集ArabicNewsSummarizationDataset-fadyelkbeer
阿拉伯语新闻摘要数据集ArabicNewsSummarizationDataset-fadyelkbeer 数据来源:互联网公开数据 标签:新闻摘要, 阿拉伯语, 自然语言处理, 文本摘要, 机器翻译, 新闻语料库, 文本分析, 语言模型 数据概述: 该数据集包含来自BBC新闻的阿拉伯语新闻文章及其摘要,旨在用于文本摘要任务。主要特征如下:... -
中文社交媒体情感分析数据集ChineseSocialMediaSentimentAnalysisData-xuhangcn
中文社交媒体情感分析数据集ChineseSocialMediaSentimentAnalysisData-xuhangcn 数据来源:互联网公开数据 标签:情感分析, 社交媒体, 文本分析, 情感分类, 中文NLP, 数据标注, 机器学习, 舆情监测 数据概述:... -
词向量与联系人评估数据集-dionisistotsila
词向量与联系人评估数据集-dionisistotsila 数据来源:互联网公开数据 标签:自然语言处理,联系人管理,数据集,词向量,文本分析,机器学习,关系提取,信息检索 数据概述: 该数据集包含用于评估词向量在联系人信息处理中的应用的数据,侧重于联系人之间的关系分析和信息提取。主要特征如下: 时间跨度:... -
企业财报文本分析数据集CorporateFinancialReportTextAnalysis-utkuumur
企业财报文本分析数据集CorporateFinancialReportTextAnalysis-utkuumur 数据来源:互联网公开数据 标签:企业财报, 文本分析, 自然语言处理, SEC, 10-K, 文本挖掘, 财务指标, 商业分析 数据概述:... -
大型语言模型人工智能公开数据组合数据集LLMAIPublicDataCombinedDataset-droidbaza
大型语言模型人工智能公开数据组合数据集LLMAIPublicDataCombinedDataset-droidbaza 数据来源:互联网公开数据 标签:大型语言模型,人工智能,数据集,自然语言处理,机器学习,文本分析,数据整合,开源数据 数据概述:... -
网络仇恨言论数据集HateSpeechDatasets-kylewang1999
网络仇恨言论数据集HateSpeechDatasets-kylewang1999 数据来源:互联网公开数据 标签:仇恨言论,数据集,自然语言处理,社交媒体,文本分析,机器学习,情感分析,网络安全 数据概述: 该数据集包含来自多个社交媒体平台和网络论坛的仇恨言论数据,记录了用户发布包含仇恨、歧视或攻击性内容的文本信息。主要特征如下:... -
Jigsaw原创数据集JigsawOriginalDataDataset-gonnbe
Jigsaw原创数据集JigsawOriginalDataDataset-gonnbe 数据来源:互联网公开数据 标签:数据集,自然语言处理,文本分析,机器学习,情感分析,文本分类,人工智能,研究资源 数据概述: 该数据集包含来自Jigsaw平台提供的原创数据,记录了互联网上的文本内容及相关标签信息。主要特征如下:... -
安然公司电子邮件数据集20-样本-adriancampos
安然公司电子邮件数据集20-样本-adriancampos 数据来源:互联网公开数据 标签:电子邮件,数据集,安然公司,文本分析,自然语言处理,信息检索,欺诈检测,公司治理 数据概述: 该数据集包含来自安然公司(Enron)员工的电子邮件数据,是原始数据集的20%样本。主要特征如下: 时间跨度:数据记录的时间范围主要集中在2000年至2002年之间。... -
越南诗歌数据集VietnamesePoemDataset-hoang1808
越南诗歌数据集VietnamesePoemDataset-hoang1808 数据来源:互联网公开数据 标签:诗歌,越南,文学,数据集,自然语言处理,文本分析,情感分析,文化研究 数据概述: 该数据集包含越南诗歌作品,记录了大量越南诗歌的文本内容。主要特征如下: 时间跨度:数据涵盖了不同历史时期的越南诗歌作品,具体时间跨度取决于数据来源。... -
arXiv论文摘要数据集extracted-abstract-736-lunanana1999
arXiv论文摘要数据集extracted-abstract-736-lunanana1999 数据来源:互联网公开数据 标签:arXiv论文,摘要,自然语言处理,文本分析,机器学习,学术研究,文本挖掘,科研 数据概述: 该数据集包含来自arXiv预印本服务器的论文摘要,旨在为自然语言处理和文本分析研究提供数据支持。主要特征如下: 时间跨度:...