-
多语言复杂问答数据集-涵盖8种语言
多语言复杂问答数据集-涵盖8种语言 数据来源:互联网公开数据 标签:多语言,问答,自然语言处理,NLP,机器翻译,语言模型,数据集,复杂问题,文本分析 数据概述: 本数据集由Hugging Face... -
抑郁症检测数据集
抑郁症检测数据集 数据来源:互联网公开数据 标签:抑郁症,社交媒体,情感分析,心理健康,文本分析 数据概述: 本数据集包含两个字段:推文文本和标签。推文文本字段记录了用户的社交媒体内容,标签字段则标注了该推文是否涉及抑郁症。数据集提供了广泛的社会媒体文本数据,为抑郁症检测模型的开发与训练提供了必要的基础。 数据用途概述:... -
学术引用意图分类数据集
学术引用意图分类数据集 数据来源:互联网公开数据 标签:学术引用,意图分类,科学文章,计算机科学,生物医学,生态学,数据挖掘,机器学习,文本分析,自然语言处理 数据概述: 本数据集来源于Huggingface... -
印度尼西亚垃圾邮件检测短信数据集1963-2021
印度尼西亚垃圾邮件检测短信数据集1963-2021 数据来源:互联网公开数据 标签:垃圾邮件检测,短信数据,文本分析,分类模型,电子邮件,合法邮件,印度尼西亚 数据概述:... -
垃圾邮件分类邮件数据集
垃圾邮件分类邮件数据集 数据来源:互联网公开数据 标签:垃圾邮件,邮件分类,文本分析,机器学习,数据挖掘,自然语言处理, Spam Detection 数据概述:... -
阿拉伯语推特情感分析数据集
阿拉伯语推特情感分析数据集 数据来源:互联网公开数据 标签:阿拉伯语,推特,情感分析,社交媒体,文本分析,自然语言处理,情感趋势 数据概述: 本数据集来源于推特,包含用阿拉伯语书写的推文,并根据内容被标注为正面或负面。数据集涵盖了广泛的主题和情感表达,适用于分析阿拉伯语社交媒体上的公众情绪和观点。 数据用途概述:... -
马来西亚新闻推特账户数据集
马来西亚新闻推特账户数据集 数据来源:互联网公开数据 标签:马来西亚,新闻,推特,社交媒体分析,文本分析,时间序列,新闻媒体 数据概述: 本数据集包含2021年7月22日至2021年8月12日期间马来西亚4个主要新闻推特账户的推文信息,包括推文内容、推文来源、地理位置以及每个账户的粉丝数量。这四个账户分别是Berita Harian、Harian... -
俄罗斯矿业行业文本数据集2009-2023
俄罗斯矿业行业文本数据集2009-2023 数据来源:互联网公开数据 标签:矿业,俄罗斯,新闻,行业报告,文本分析,自然语言处理,数据挖掘 数据概述: 本数据集收录了2009年至2023年间约9万条新闻文章、新闻稿和矿业公司公共报告的俄语文本数据。数据通过自动抓取网站内容生成,经过句法切分处理,每行包含一个句子,适用于矿业行业文本分析。 数据用途概述:... -
-
Discord游戏改进建议与投票数据集-Discord服务器-时间不限
Discord游戏改进建议与投票数据集-Discord服务器-时间不限 数据来源:互联网公开数据 标签:游戏改进,Discord,社区反馈,NLP,文本分析,投票,建议,开发者,用户生成内容 数据概述:... -
COVID-19研究文章数据集
COVID-19研究文章数据集 数据来源:互联网公开数据 标签:COVID-19, 研究文章, 文本分析, 时间序列, 推荐系统, 情感分析, 机器学习 数据概述... -
调整文本数据集
调整文本数据集 数据来源:互联网公开数据 标签:文本调整,数据优化,文本处理,文本分析,数据可视化,数据集共享 数据概述: 本数据集包含与调整文本相关的数据集,适用于文本布局优化、数据可视化调整等场景。数据集内容涵盖文本调整的具体参数、调整前后对比数据以及相关算法实现的示例数据,为研究人员和开发者提供标准化的文本调整数据支持。 数据用途概述:... -
谷歌新闻原始数据集
谷歌新闻原始数据集 数据来源:互联网公开数据 标签:谷歌新闻,原始数据,自然语言处理,文本分析,数据科学,新闻内容 数据概述: 本数据集包含从谷歌新闻收集的新闻文章集合,数据通过网络抓取获得,涵盖多个新闻来源的原始、未加工文本。该数据集提供了广泛的新聞内容,适用于自然语言处理项目、文本分析和其他需要原始文本数据的数据科学应用。 数据用途概述:... -
Goodreads书籍样本数据清洗与整理数据集
Goodreads书籍样本数据清洗与整理数据集 数据来源:互联网公开数据 标签:书籍,Goodreads,数据清洗,文本分析,图书推荐,Python,数据整理 数据概述:... -
AskReddit热门评论数据集-NLP文本分析
AskReddit热门评论数据集-NLP文本分析 数据来源:互联网公开数据 标签:AskReddit,评论,Reddit,文本分析,NLP,自然语言处理,情感分析,热门评论,数据分析,EDA 数据概述: 本数据集包含了过去一个月内AskReddit版块中,最热门的评论数据。... -
-
数据科学领域访谈博客文章互动表现数据集
数据科学领域访谈博客文章互动表现数据集 数据来源:互联网公开数据 标签:数据科学,访谈,博客,机器学习,人物访谈,文本分析,社交媒体,互动分析 数据概述: 本数据集包含了Sanyam... -
印度巴拉特生物科技公司Covaxin新冠疫苗推文数据集
印度巴拉特生物科技公司Covaxin新冠疫苗推文数据集 数据来源:互联网公开数据 标签:Covaxin,新冠疫苗,疫苗,推文,社交媒体,巴拉特生物科技,疫情,公共卫生,文本分析 数据概述: 本数据集包含了巴拉特生物科技公司(Bharat Biotech)在Twitter平台上发布的超过200条关于Covaxin新冠疫苗的推文。... -
古兰经数字奇迹分析数据集1990-2023
古兰经数字奇迹分析数据集1990-2023 数据来源:互联网公开数据 标签:古兰经,数字奇迹,伊斯兰教,文化研究,历史文献,文本分析,数据科学 数据概述:... -
孟加拉每日英语新闻文章数据集
孟加拉每日英语新闻文章数据集 数据来源:互联网公开数据 标签:孟加拉,新闻,自然语言处理,文本分析,时间序列,媒体研究,信息提取 数据概述: 本数据集收录了孟加拉每日英语新闻文章,数据来源包括五个主要的孟加拉英语新闻门户:The Daily Star、The Financial Express、New Age bd、Dhaka Tribune 和...