-
五十位维多利亚时代小说家的作者归属数据集
五十位维多利亚时代小说家的作者归属数据集 数据来源:互联网公开数据 标签:小说,文学分析,作者归属,文本挖掘,维多利亚时代,自然语言处理,文学研究,文本分类 数据概述:... -
自然语言处理情感分析数据集
自然语言处理情感分析数据集 数据来源:互联网公开数据 标签:自然语言处理,情感分析,文本挖掘,机器学习,数据标注,社交媒体分析 数据概述: 本数据集包含来自社交媒体平台的大量文本数据,每条记录均标注了对应的情感类别,如正面、负面和中性等。数据集涵盖了不同领域的话题,为自然语言处理和情感分析的研究提供了丰富的资源。 数据用途概述:... -
阿塞拜疆Interpress新闻网站新闻文章数据集-2014年12月31日至2024年3月24日
阿塞拜疆Interpress新闻网站新闻文章数据集-2014年12月31日至2024年3月24日 数据来源:互联网公开数据 标签:新闻文章,阿塞拜疆,Interpress,新闻,媒体,内容分析,文本挖掘,自然语言处理,新闻报道 数据概述:... -
印度维基百科文章数据集
印度维基百科文章数据集 数据来源:互联网公开数据 标签:维基百科,印度,自然语言处理,文本挖掘,语言模型,文本数据,机器学习 数据概述: 本数据集包含172,000篇经过清洗的印度维基百科文章,已转换为CSV格式,便于直接作为Pandas... -
COVID-19开放研究论文与作者数据集
COVID-19开放研究论文与作者数据集 数据来源:互联网公开数据 标签:COVID-19, 论文文本, 作者信息, 开放研究, 科研协作, 数据提取, 文本挖掘 数据概述: 本数据集是对CORD-19(COVID-19开放研究数据集挑战)的论文文本和作者信息进行提取和整理的结果。数据集包含三个核心文件: 1.... -
巴西ATribuna报纸新闻文本分类数据集
巴西ATribuna报纸新闻文本分类数据集 数据来源:互联网公开数据 标签:新闻文本,分类,巴西,报纸,文本挖掘,机器学习,自然语言处理 数据概述: 本数据集源自巴西报纸“A... -
Pinterest应用用户评价情感分析数据集-GooglePlay商店评论-2015-2024
Pinterest应用用户评价情感分析数据集-GooglePlay商店评论-2015-2024 数据来源:互联网公开数据 标签:Pinterest,社交媒体,用户评价,情感分析,Google Play,评论数据,应用分析,用户反馈,文本挖掘 数据概述: 本数据集收录了来自Google... -
印度新冠疫情推文数据集
印度新冠疫情推文数据集 数据来源:互联网公开数据 标签:推文数据,新冠疫情,印度,社交媒体分析,文本挖掘,自然语言处理,情感分析 数据概述: 本数据集包含2021年1月至3月期间从Twitter抓取的与“COVID... -
细分类食品评论与嵌入数据集
细分类食品评论与嵌入数据集 数据来源:互联网公开数据 标签:评论,嵌入,亚马逊,食品,情感分析,NLP,语义理解,文本挖掘,文本分析,机器学习 数据概述: 本数据集基于亚马逊细分类食品商品的10,000条客户评论数据构建,每条评论均经过处理并生成相应的文本嵌入。嵌入通过Azure OpenAI的text-embedding-... -
新闻情感分析数据集2008-2024
新闻情感分析数据集2008-2024 数据来源:互联网公开数据 标签:新闻,情感分析,股票市场预测,自然语言处理,NLTK VADER,NLTK RoBERTa,Hugging Face DistilBERT,时间序列,金融分析,文本挖掘 数据概述: 本数据集涵盖2008年6月8日至2024年8月3日期间来自三大新闻来源的新闻文章,包括Reddit... -
亚马逊商品评论用户反馈数据集
亚马逊商品评论用户反馈数据集 数据来源:互联网公开数据 标签:亚马逊,商品评论,用户反馈,情感分析,文本挖掘,消费者行为,产品评价 数据概述: 本数据集包含超过56.8万条关于亚马逊不同商品的消费者评论。数据来源于亚马逊网站,以CSV格式存储,共包含10个字段,记录了用户对商品的评价信息。 字段包括: Id: 评论的唯一标识符 ProductId:... -
自然语言处理数据集-缩略语与表情符号
自然语言处理数据集-缩略语与表情符号 数据来源:互联网公开数据 标签:自然语言处理,文本预处理,缩略语,标点符号,表情符号,情感分析,数据清洗,文本挖掘,NLP 数据概述: 本数据集为自然语言处理(NLP)和文本挖掘任务提供了丰富的资源支持,包含多个关键文件,用于文本预处理过程中的数据清洗和特征提取。数据集主要组成部分包括:... -
文本情感分析研究数据集-社交媒体评论与新闻文本-通用
文本情感分析研究数据集-社交媒体评论与新闻文本-通用 数据来源:互联网公开数据 标签:情感分析,自然语言处理,文本挖掘,社交媒体,新闻文本,情感分类,观点挖掘,机器学习 数据概述:... -
南非公司活动指标数据集
南非公司活动指标数据集 数据来源:互联网公开数据 标签:公司年度报告,活动指标,南非,PDF解析,数据提取,文本挖掘,数据清洗,数据标准化,自动化处理,可持续发展指标 数据概述:... -
-
-
-
-
知识产权专利数据集
知识产权专利数据集 数据来源:互联网公开数据 标签:专利分析,技术提取,关系抽取,技术术语,文本挖掘,自然语言处理 数据概述: 本数据集包含以下内容: 1. HO4N专利文本,用于训练提取术语和关系的模型。 2. 解析后的专利数据CSV文件,存储了从文本文件中提取的专利信息。 3.... -
墨西哥总统安德烈斯-曼努埃尔-洛佩兹-奥布拉多演讲数据集
墨西哥总统安德烈斯-曼努埃尔-洛佩兹-奥布拉多演讲数据集 数据来源:互联网公开数据 标签:墨西哥总统,演讲文本,政府政策,政治分析,自然语言处理,文本挖掘,语言模型训练 数据概述: 本数据集包含墨西哥总统安德烈斯·曼努埃尔·洛佩兹·奥布拉多在其任期内公开演讲的语料库。数据来源于墨西哥政府官方 YouTube 频道中所有与本届总统任期相关的...