-
Reddit平台热门科技子版块帖子互动数据分析数据集
Reddit平台热门科技子版块帖子互动数据分析数据集 数据来源:互联网公开数据 标签:Reddit,科技,社区,社交媒体,帖子,互动,情感分析,自然语言处理 数据概述:...
-
Steam游戏评论关键要素标注数据集-英语评论-2024
Steam游戏评论关键要素标注数据集-英语评论-2024 数据来源:互联网公开数据 标签:游戏评论,Steam,用户评价,文本分析,情感分析,自然语言处理,机器学习,数据标注 数据概述:...
-
印度尼西亚垃圾邮件检测短信数据集1963-2021
印度尼西亚垃圾邮件检测短信数据集1963-2021 数据来源:互联网公开数据 标签:垃圾邮件检测,短信数据,文本分析,分类模型,电子邮件,合法邮件,印度尼西亚 数据概述:...
-
斯瓦希里语自然语言处理数据集
斯瓦希里语自然语言处理数据集 数据来源:互联网公开数据 标签:斯瓦希里语,自然语言处理,网络内容检测,机器学习,深度学习,人工智能,文本分类,数据安全 数据概述:...
-
希腊语COVID-19疫苗接种推文数据集
希腊语COVID-19疫苗接种推文数据集 数据来源:互联网公开数据 标签:希腊语,COVID-19,疫苗接种,社交媒体分析,自然语言处理,文本分类,公共卫生,数据标注 数据概述: 本数据集包含2021年7月至8月期间收集的希腊语推文,内容聚焦于COVID-19疫苗接种相关话题。数据集中的推文经过人工标注,为研究希腊语社交媒体内容提供了高质量的文本资源。...
-
原神游戏用户评论情感分析数据集
原神游戏用户评论情感分析数据集 数据来源:互联网公开数据 标签:原神,游戏评论,情感分析,NLP,市场研究,用户反馈,文本分类,情绪检测 数据概述: 本数据集包含了从Google Play...
-
写作者数据集
写作者数据集 数据来源:互联网公开数据 标签:写作者,自然语言处理,文本分类,审计,多语言训练 数据概述: 本数据集包含从1963年至2021年间关于写作者的文本记录,文本主要以俄语撰写。数据集涵盖了各种类型的文档,包括但不限于文章、报告等,为自然语言处理和文本分类提供了丰富的训练素材。 数据用途概述:...
-
格鲁吉亚语情感分析数据集
格鲁吉亚语情感分析数据集 数据来源:互联网公开数据 标签:情感分析,格鲁吉亚语,自然语言处理,文本分类,社会研究 数据概述: 本数据集包含标注了情感标签的格鲁吉亚语句子,涵盖正面、负面和中性三种情感类型。数据集为研究格鲁吉亚语的情感表达和文本分析提供了丰富的语料资源。 数据用途概述:...
-
阿拉伯新闻分类研究数据集1963-2021
阿拉伯新闻分类研究数据集1963-2021 数据来源:互联网公开数据 标签:阿拉伯新闻,分类研究,NLP,创业,科技,其他,灵感 数据概述:...
-
汽车广告标题数据集
汽车广告标题数据集 数据来源:互联网公开数据 标签:汽车广告,模型预测,文本分类,机器学习,NLP,数据预处理,广告分析 数据概述: 本数据集包含从伊朗主流在线市场Divar抓取的汽车广告标题,每个标题均标注了对应的汽车型号,为训练和评估汽车模型预测的机器学习模型提供了宝贵资源。数据集经过预处理,包括文本规范化和标点符号去除,确保数据的一致性和可用性。...
-
印度巴拉特生物科技公司Covaxin新冠疫苗推文数据集
印度巴拉特生物科技公司Covaxin新冠疫苗推文数据集 数据来源:互联网公开数据 标签:Covaxin,新冠疫苗,疫苗,推文,社交媒体,巴拉特生物科技,疫情,公共卫生,文本分析 数据概述: 本数据集包含了巴拉特生物科技公司(Bharat Biotech)在Twitter平台上发布的超过200条关于Covaxin新冠疫苗的推文。...
-
古兰经文本数据集1963-2021
古兰经文本数据集1963-2021 数据来源:互联网公开数据 标签:古兰经,伊斯兰教,自然语言处理,情感分析,文本分类,主题建模,语言生成,宗教文本,文化研究 数据概述:...
-
互联网公开简历数据集分析
标题:互联网公开简历数据集分析 数据内容: 该数据集包含2484条记录,每条记录包括以下字段: - ID:唯一标识符,共有2484种不同值。 - Resume_str:简历文本内容,共有2482种不同值。 - Resume_html:简历HTML格式内容,共有2482种不同值。 - Category:简历分类,共有24种不同值。 数据来源:...
-
互联网公开文本数据集统计分析报告
标题:互联网公开文本数据集统计分析报告 数据内容: 该数据集包含两个主要字段: 1. full_text:包含1263种不同的文本内容,每条记录代表一个完整的文本段落或短文本。 2. labels:包含2种不同的标签值,可能是二分类标签,用于对文本进行分类。 数据来源: 互联网公开数据 数据用途: 该数据集可用于多个行业的文本分析任务,例如: -...
-
互联网公开数据集多源文本标注数据集
标题:互联网公开数据集多源文本标注数据集 数据内容:该数据集包含了来自多个来源的文本数据,每个文本都经过标注处理,具有明确的分类标签。数据集中包含文本内容、标签以及数据来源三个主要字段。具体字段统计信息如下: text: 290,390 种不同文本内容 label: 3 种不同的分类标签 src: 11 种不同的数据来源 数据来源:互联网公开数据...
-
互联网公开数据集垃圾邮件分类与文本分析
标题:互联网公开数据集垃圾邮件分类与文本分析 数据内容:该数据集包含文本内容(text)和垃圾邮件分类(spam)两个字段。文本内容字段包含5695种不同的文本值,垃圾邮件分类字段包含两种不同的分类值(0和1)。 数据来源:互联网公开数据...
-



