-
COVID-19开放研究论文与作者数据集
COVID-19开放研究论文与作者数据集 数据来源:互联网公开数据 标签:COVID-19, 论文文本, 作者信息, 开放研究, 科研协作, 数据提取, 文本挖掘 数据概述: 本数据集是对CORD-19(COVID-19开放研究数据集挑战)的论文文本和作者信息进行提取和整理的结果。数据集包含三个核心文件: 1....
-
巴西ATribuna报纸新闻文本分类数据集
巴西ATribuna报纸新闻文本分类数据集 数据来源:互联网公开数据 标签:新闻文本,分类,巴西,报纸,文本挖掘,机器学习,自然语言处理 数据概述: 本数据集源自巴西报纸“A...
-
Pinterest应用用户评价情感分析数据集-GooglePlay商店评论-2015-2024
Pinterest应用用户评价情感分析数据集-GooglePlay商店评论-2015-2024 数据来源:互联网公开数据 标签:Pinterest,社交媒体,用户评价,情感分析,Google Play,评论数据,应用分析,用户反馈,文本挖掘 数据概述: 本数据集收录了来自Google...
-
印度新冠疫情推文数据集
印度新冠疫情推文数据集 数据来源:互联网公开数据 标签:推文数据,新冠疫情,印度,社交媒体分析,文本挖掘,自然语言处理,情感分析 数据概述: 本数据集包含2021年1月至3月期间从Twitter抓取的与“COVID...
-
-
细分类食品评论与嵌入数据集
细分类食品评论与嵌入数据集 数据来源:互联网公开数据 标签:评论,嵌入,亚马逊,食品,情感分析,NLP,语义理解,文本挖掘,文本分析,机器学习 数据概述: 本数据集基于亚马逊细分类食品商品的10,000条客户评论数据构建,每条评论均经过处理并生成相应的文本嵌入。嵌入通过Azure OpenAI的text-embedding-...
-
新闻情感分析数据集2008-2024
新闻情感分析数据集2008-2024 数据来源:互联网公开数据 标签:新闻,情感分析,股票市场预测,自然语言处理,NLTK VADER,NLTK RoBERTa,Hugging Face DistilBERT,时间序列,金融分析,文本挖掘 数据概述: 本数据集涵盖2008年6月8日至2024年8月3日期间来自三大新闻来源的新闻文章,包括Reddit...
-
亚马逊商品评论用户反馈数据集
亚马逊商品评论用户反馈数据集 数据来源:互联网公开数据 标签:亚马逊,商品评论,用户反馈,情感分析,文本挖掘,消费者行为,产品评价 数据概述: 本数据集包含超过56.8万条关于亚马逊不同商品的消费者评论。数据来源于亚马逊网站,以CSV格式存储,共包含10个字段,记录了用户对商品的评价信息。 字段包括: Id: 评论的唯一标识符 ProductId:...
-
自然语言处理数据集-缩略语与表情符号
自然语言处理数据集-缩略语与表情符号 数据来源:互联网公开数据 标签:自然语言处理,文本预处理,缩略语,标点符号,表情符号,情感分析,数据清洗,文本挖掘,NLP 数据概述: 本数据集为自然语言处理(NLP)和文本挖掘任务提供了丰富的资源支持,包含多个关键文件,用于文本预处理过程中的数据清洗和特征提取。数据集主要组成部分包括:...
-
文本情感分析研究数据集-社交媒体评论与新闻文本-通用
文本情感分析研究数据集-社交媒体评论与新闻文本-通用 数据来源:互联网公开数据 标签:情感分析,自然语言处理,文本挖掘,社交媒体,新闻文本,情感分类,观点挖掘,机器学习 数据概述:...
-
南非公司活动指标数据集
南非公司活动指标数据集 数据来源:互联网公开数据 标签:公司年度报告,活动指标,南非,PDF解析,数据提取,文本挖掘,数据清洗,数据标准化,自动化处理,可持续发展指标 数据概述:...
-
-
-
TED演讲元数据与演讲稿数据集2020
TED演讲元数据与演讲稿数据集2020 数据来源:互联网公开数据 标签:TED演讲,元数据,演讲稿,视频,音频,图像,数据科学,个人项目 数据概述:...
-
-
文本分析与数据挖掘课程数据集
文本分析与数据挖掘课程数据集 数据来源:互联网公开数据 标签:文本分析,数据挖掘,课程资源,教学研究,文本处理,机器学习,自然语言处理 数据概述:...
-
-
知识产权专利数据集
知识产权专利数据集 数据来源:互联网公开数据 标签:专利分析,技术提取,关系抽取,技术术语,文本挖掘,自然语言处理 数据概述: 本数据集包含以下内容: 1. HO4N专利文本,用于训练提取术语和关系的模型。 2. 解析后的专利数据CSV文件,存储了从文本文件中提取的专利信息。 3....
-
墨西哥总统安德烈斯-曼努埃尔-洛佩兹-奥布拉多演讲数据集
墨西哥总统安德烈斯-曼努埃尔-洛佩兹-奥布拉多演讲数据集 数据来源:互联网公开数据 标签:墨西哥总统,演讲文本,政府政策,政治分析,自然语言处理,文本挖掘,语言模型训练 数据概述: 本数据集包含墨西哥总统安德烈斯·曼努埃尔·洛佩兹·奥布拉多在其任期内公开演讲的语料库。数据来源于墨西哥政府官方 YouTube 频道中所有与本届总统任期相关的...
-
Habr-com网站IT技术文章发布数据集-2024
Habr-com网站IT技术文章发布数据集-2024 数据来源:互联网公开数据 标签:IT技术, 互联网, 科技, 文章, 博客, 数据分析, 商业, 计算机科学 数据概述: 本数据集包含了从 Habr.com 网站抓取的 38443 篇帖子数据。Habr.com 是一个专注于发布与信息技术、商业和互联网相关的文章、新闻和分析文章的网站。...



