-
-
星巴克评论数据集
星巴克评论数据集 数据来源:互联网公开数据 标签:星巴克,评论,情感分析,自然语言处理,文本分类,数据清洗,商业分析 数据概述: 本数据集包含700条星巴克评论数据,涵盖5个字段:用户名称、位置、日期、评分和评论内容。评论内容为原始文本,未经过预处理。数据集旨在为自然语言处理任务提供基础数据支持,适用于情感分析、文本分类等场景。 数据用途概述:... -
俄罗斯敏感话题不适当言论数据集
俄罗斯敏感话题不适当言论数据集 数据来源:互联网公开数据 标签:敏感话题,不适当言论,网络言论,俄罗斯,自然语言处理,文本分析,社会学研究 数据概述: 本数据集专注于收集和分析涉及敏感话题的不适当言论,这些言论可能引起读者的不适或损害发言者的声誉。不适当性概念接近于毒性,但明确的毒性和明显的... -
写作质量分析文本变化补充数据集
写作质量分析文本变化补充数据集 数据来源:互联网公开数据 标签:写作质量,文本变化,竞赛数据,学术研究,自然语言处理,数据补充,文本分析 数据概述:... -
土耳其新闻文章数据集2017-2021
土耳其新闻文章数据集2017-2021 数据来源:互联网公开数据 标签:土耳其新闻,文章数据,自然语言处理,停用词,作者分析,时间序列,新闻研究 数据概述:... -
基因组生物医学事件数据集
基因组生物医学事件数据集 数据来源:互联网公开数据 标签:生物医学文本,事件标注,自然语言处理,NLP,药物效果分析,医学条件识别,数据集简化版 数据概述: 本数据集是GENIA事件标注数据集的简化版本,来源于TEES平台,基于BioNLP共享任务2011(BioNLP Shared Task... -
-
LinkedIn职位招聘信息数据集-2024年
LinkedIn职位招聘信息数据集-2024年 数据来源:互联网公开数据 标签:LinkedIn,招聘,职位,就业,数据分析,自然语言处理,文本挖掘,职位描述 数据概述: 本数据集来源于LinkedIn网站的职位招聘信息抓取结果,包含了多个关键字段,用于深入分析职位招聘趋势和就业市场动态。数据主要包含以下字段:... -
Quora平台重复问题识别数据集
Quora平台重复问题识别数据集 数据来源:互联网公开数据 标签:Quora,问答平台,重复问题,自然语言处理,文本相似度,数据挖掘,用户体验 数据概述:... -
立场检测多领域用户观点数据集2021
立场检测多领域用户观点数据集2021 数据来源:互联网公开数据 标签:立场检测,自然语言处理,社交媒体分析,情感分析,讽刺检测,COVID-19疫苗,数字转型,女性赋权 数据概述:... -
新闻文章摘要数据集
新闻文章摘要数据集 数据来源:互联网公开数据 标签:新闻,文章,摘要,标题,超链接,内容,文本分析,自然语言处理 数据概述: 本数据集包含了新闻文章的标题、超链接和正文内容。数据集覆盖了广泛的新闻来源,提供了丰富的文本信息,适用于新闻分析、文本摘要生成和自然语言处理等多种应用场景。 数据用途概述:... -
基于文本的分类数据集
基于文本的分类数据集 数据来源:互联网公开数据 标签:文本分类,区块链,机器学习,自然语言处理,数据标注,监督学习,领域特定文本 数据概述 本数据集旨在基于文本内容对样本进行分类,数据来源于区块链领域相关的文本资料。数据集包含两部分内容: -... -
电影壮志凌云2-独行侠影评情感分析数据集-2022年
电影壮志凌云2-独行侠影评情感分析数据集-2022年 数据来源:互联网公开数据 标签:电影,影评,情感分析,自然语言处理,NLP,好莱坞,票房,评论,观众反馈 数据概述: 本数据集包含电影《壮志凌云2:独行侠》(Top Gun:... -
恐怖小说作者识别数据集
恐怖小说作者识别数据集 数据来源:互联网公开数据 标签:恐怖小说,作者识别,文本分析,机器学习,自然语言处理 数据概述: 本数据集包含多篇由不同恐怖小说作者撰写的文本样本,旨在用于作者识别任务。数据集涵盖了多位著名恐怖小说作者的作品,每篇文本均标注了相应的作者身份,为研究和开发作者识别模型提供了丰富的训练和测试材料。 数据用途概述:... -
阿拉伯语指令与响应文化相关性研究数据集
阿拉伯语指令与响应文化相关性研究数据集 数据来源:互联网公开数据 标签:阿拉伯语指令,文化相关性,语言模型训练,自然语言处理,跨文化研究,人工智能,机器学习 数据概述:... -
Eedi数学竞赛学生解题思维链增强数据集-2023
Eedi数学竞赛学生解题思维链增强数据集-2023 数据来源:互联网公开数据 标签:Eedi,数学,思维链,ChatGPT,增强,竞赛,教育,机器学习,自然语言处理 数据概述: 本数据集是Eedi数学竞赛数据的思维链(Chain-of-Thought,... -
全球社交平台Pinterest热门内容数据集
全球社交平台Pinterest热门内容数据集 数据来源:互联网公开数据 标签:内容分析, 图像分析, 自然语言处理, 社交媒体, 趋势分析, 图网络分析 数据集简介: 本数据集汇总了Pinterest平台上高人气内容(Pins)的结构化信息,包含图像内容、文本描述、标题信息与受欢迎程度(Repin次数)等关键指标。该数据集由Oneli... -
英国广播公司BBC新闻文章文本分类数据集
英国广播公司BBC新闻文章文本分类数据集 数据来源:互联网公开数据 标签:新闻文章,文本分类,自然语言处理,机器学习,BBC,媒体,文本数据,分类任务 数据概述:... -
抓取的职位描述数据集
抓取的职位描述数据集 数据来源:互联网公开数据 标签:职位描述,抓取,自然语言处理,研究,数据集,就业市场,招聘分析 数据概述: 本数据集包含4413条职位描述,来源于单一网络平台抓取的数据。这些职位描述可能已不再有效,因此数据集主要用于自然语言处理(NLP)实践和研究项目。 数据用途概述:... -
StackOverflowPython3-0常见问题及解答数据集
StackOverflowPython3-0常见问题及解答数据集 数据来源:互联网公开数据 标签:Stack Overflow, Python 3.0, 编程问答, 自然语言处理, 常见问题, 代码, 技术支持, 问答系统 数据概述: 本数据集收录了Stack Overflow上关于Python...