-
阿拉伯新闻分类研究数据集1963-2021
阿拉伯新闻分类研究数据集1963-2021 数据来源:互联网公开数据 标签:阿拉伯新闻,分类研究,NLP,创业,科技,其他,灵感 数据概述:...
-
汽车广告标题数据集
汽车广告标题数据集 数据来源:互联网公开数据 标签:汽车广告,模型预测,文本分类,机器学习,NLP,数据预处理,广告分析 数据概述: 本数据集包含从伊朗主流在线市场Divar抓取的汽车广告标题,每个标题均标注了对应的汽车型号,为训练和评估汽车模型预测的机器学习模型提供了宝贵资源。数据集经过预处理,包括文本规范化和标点符号去除,确保数据的一致性和可用性。...
-
印度巴拉特生物科技公司Covaxin新冠疫苗推文数据集
印度巴拉特生物科技公司Covaxin新冠疫苗推文数据集 数据来源:互联网公开数据 标签:Covaxin,新冠疫苗,疫苗,推文,社交媒体,巴拉特生物科技,疫情,公共卫生,文本分析 数据概述: 本数据集包含了巴拉特生物科技公司(Bharat Biotech)在Twitter平台上发布的超过200条关于Covaxin新冠疫苗的推文。...
-
古兰经文本数据集1963-2021
古兰经文本数据集1963-2021 数据来源:互联网公开数据 标签:古兰经,伊斯兰教,自然语言处理,情感分析,文本分类,主题建模,语言生成,宗教文本,文化研究 数据概述:...
-
互联网公开简历数据集分析
标题:互联网公开简历数据集分析 数据内容: 该数据集包含2484条记录,每条记录包括以下字段: - ID:唯一标识符,共有2484种不同值。 - Resume_str:简历文本内容,共有2482种不同值。 - Resume_html:简历HTML格式内容,共有2482种不同值。 - Category:简历分类,共有24种不同值。 数据来源:...
-
互联网公开文本数据集统计分析报告
标题:互联网公开文本数据集统计分析报告 数据内容: 该数据集包含两个主要字段: 1. full_text:包含1263种不同的文本内容,每条记录代表一个完整的文本段落或短文本。 2. labels:包含2种不同的标签值,可能是二分类标签,用于对文本进行分类。 数据来源: 互联网公开数据 数据用途: 该数据集可用于多个行业的文本分析任务,例如: -...
-
互联网公开数据集多源文本标注数据集
标题:互联网公开数据集多源文本标注数据集 数据内容:该数据集包含了来自多个来源的文本数据,每个文本都经过标注处理,具有明确的分类标签。数据集中包含文本内容、标签以及数据来源三个主要字段。具体字段统计信息如下: text: 290,390 种不同文本内容 label: 3 种不同的分类标签 src: 11 种不同的数据来源 数据来源:互联网公开数据...
-
互联网公开数据集垃圾邮件分类与文本分析
标题:互联网公开数据集垃圾邮件分类与文本分析 数据内容:该数据集包含文本内容(text)和垃圾邮件分类(spam)两个字段。文本内容字段包含5695种不同的文本值,垃圾邮件分类字段包含两种不同的分类值(0和1)。 数据来源:互联网公开数据...
-



