找到2,630个数据集

标签: 文本挖掘

过滤结果
  • 五十位维多利亚时代小说家的作者归属数据集

    2025年4月20日   

    五十位维多利亚时代小说家的作者归属数据集 数据来源:互联网公开数据 标签:小说,文学分析,作者归属,文本挖掘,维多利亚时代,自然语言处理,文学研究,文本分类 数据概述:...
    packageimg
  • 自然语言处理情感分析数据集

    2025年4月20日   

    自然语言处理情感分析数据集 数据来源:互联网公开数据 标签:自然语言处理,情感分析,文本挖掘,机器学习,数据标注,社交媒体分析 数据概述: 本数据集包含来自社交媒体平台的大量文本数据,每条记录均标注了对应的情感类别,如正面、负面和中性等。数据集涵盖了不同领域的话题,为自然语言处理和情感分析的研究提供了丰富的资源。 数据用途概述:...
    packageimg
  • 阿塞拜疆Interpress新闻网站新闻文章数据集-2014年12月31日至2024年3月24日

    2025年4月20日   

    阿塞拜疆Interpress新闻网站新闻文章数据集-2014年12月31日至2024年3月24日 数据来源:互联网公开数据 标签:新闻文章,阿塞拜疆,Interpress,新闻,媒体,内容分析,文本挖掘,自然语言处理,新闻报道 数据概述:...
    packageimg
  • 印度维基百科文章数据集

    2025年4月20日   

    印度维基百科文章数据集 数据来源:互联网公开数据 标签:维基百科,印度,自然语言处理,文本挖掘,语言模型,文本数据,机器学习 数据概述: 本数据集包含172,000篇经过清洗的印度维基百科文章,已转换为CSV格式,便于直接作为Pandas...
    packageimg
  • COVID-19开放研究论文与作者数据集

    2025年4月20日   

    COVID-19开放研究论文与作者数据集 数据来源:互联网公开数据 标签:COVID-19, 论文文本, 作者信息, 开放研究, 科研协作, 数据提取, 文本挖掘 数据概述: 本数据集是对CORD-19(COVID-19开放研究数据集挑战)的论文文本和作者信息进行提取和整理的结果。数据集包含三个核心文件: 1....
    packageimg
  • 巴西ATribuna报纸新闻文本分类数据集

    2025年4月19日   

    巴西ATribuna报纸新闻文本分类数据集 数据来源:互联网公开数据 标签:新闻文本,分类,巴西,报纸,文本挖掘,机器学习,自然语言处理 数据概述: 本数据集源自巴西报纸“A...
    packageimg
  • Pinterest应用用户评价情感分析数据集-GooglePlay商店评论-2015-2024

    2025年4月19日   

    Pinterest应用用户评价情感分析数据集-GooglePlay商店评论-2015-2024 数据来源:互联网公开数据 标签:Pinterest,社交媒体,用户评价,情感分析,Google Play,评论数据,应用分析,用户反馈,文本挖掘 数据概述: 本数据集收录了来自Google...
    packageimg
  • 印度新冠疫情推文数据集

    2025年4月19日   

    印度新冠疫情推文数据集 数据来源:互联网公开数据 标签:推文数据,新冠疫情,印度,社交媒体分析,文本挖掘,自然语言处理,情感分析 数据概述: 本数据集包含2021年1月至3月期间从Twitter抓取的与“COVID...
    packageimg
  • 细分类食品评论与嵌入数据集

    2025年4月19日   

    细分类食品评论与嵌入数据集 数据来源:互联网公开数据 标签:评论,嵌入,亚马逊,食品,情感分析,NLP,语义理解,文本挖掘,文本分析,机器学习 数据概述: 本数据集基于亚马逊细分类食品商品的10,000条客户评论数据构建,每条评论均经过处理并生成相应的文本嵌入。嵌入通过Azure OpenAI的text-embedding-...
    packageimg
  • 新闻情感分析数据集2008-2024

    2025年4月19日   

    新闻情感分析数据集2008-2024 数据来源:互联网公开数据 标签:新闻,情感分析,股票市场预测,自然语言处理,NLTK VADER,NLTK RoBERTa,Hugging Face DistilBERT,时间序列,金融分析,文本挖掘 数据概述: 本数据集涵盖2008年6月8日至2024年8月3日期间来自三大新闻来源的新闻文章,包括Reddit...
    packageimg
  • 亚马逊商品评论用户反馈数据集

    2025年4月19日   

    亚马逊商品评论用户反馈数据集 数据来源:互联网公开数据 标签:亚马逊,商品评论,用户反馈,情感分析,文本挖掘,消费者行为,产品评价 数据概述: 本数据集包含超过56.8万条关于亚马逊不同商品的消费者评论。数据来源于亚马逊网站,以CSV格式存储,共包含10个字段,记录了用户对商品的评价信息。 字段包括: Id: 评论的唯一标识符 ProductId:...
    packageimg
  • 自然语言处理数据集-缩略语与表情符号

    2025年4月18日   

    自然语言处理数据集-缩略语与表情符号 数据来源:互联网公开数据 标签:自然语言处理,文本预处理,缩略语,标点符号,表情符号,情感分析,数据清洗,文本挖掘,NLP 数据概述: 本数据集为自然语言处理(NLP)和文本挖掘任务提供了丰富的资源支持,包含多个关键文件,用于文本预处理过程中的数据清洗和特征提取。数据集主要组成部分包括:...
    packageimg
  • 文本情感分析研究数据集-社交媒体评论与新闻文本-通用

    2025年4月19日   

    文本情感分析研究数据集-社交媒体评论与新闻文本-通用 数据来源:互联网公开数据 标签:情感分析,自然语言处理,文本挖掘,社交媒体,新闻文本,情感分类,观点挖掘,机器学习 数据概述:...
    packageimg
  • 南非公司活动指标数据集

    2025年4月19日   

    南非公司活动指标数据集 数据来源:互联网公开数据 标签:公司年度报告,活动指标,南非,PDF解析,数据提取,文本挖掘,数据清洗,数据标准化,自动化处理,可持续发展指标 数据概述:...
    packageimg
  • 白宫网站数据集

    2025年4月19日   

    白宫网站数据集 数据来源:互联网公开数据 标签:SEO,白宫,爬虫,政府信息,网站分析,文本挖掘 数据概述:...
    packageimg
  • 俄乌战争推文数据集

    2025年4月19日   

    俄乌战争推文数据集 数据来源:互联网公开数据 标签:俄乌战争,推文数据,关键事件,时间序列分析,情感分析,文本挖掘,国际关系,社会舆论 数据概述:...
    packageimg
  • 重金属歌词档案数据集

    2025年4月19日   

    重金属歌词档案数据集 数据来源:互联网公开数据 标签:重金属,歌词,音乐分析,歌词内容,文本挖掘,音乐数据,语言分析 数据概述:...
    packageimg
  • 英语演讲政治家数据集

    2025年4月19日   

    英语演讲政治家数据集 数据来源:互联网公开数据 标签:政治家,演讲,历史分析,文本挖掘,语言研究,政策分析,公共关系 数据概述:...
    packageimg
  • 知识产权专利数据集

    2025年4月19日   

    知识产权专利数据集 数据来源:互联网公开数据 标签:专利分析,技术提取,关系抽取,技术术语,文本挖掘,自然语言处理 数据概述: 本数据集包含以下内容: 1. HO4N专利文本,用于训练提取术语和关系的模型。 2. 解析后的专利数据CSV文件,存储了从文本文件中提取的专利信息。 3....
    packageimg
  • 墨西哥总统安德烈斯-曼努埃尔-洛佩兹-奥布拉多演讲数据集

    2025年4月18日   

    墨西哥总统安德烈斯-曼努埃尔-洛佩兹-奥布拉多演讲数据集 数据来源:互联网公开数据 标签:墨西哥总统,演讲文本,政府政策,政治分析,自然语言处理,文本挖掘,语言模型训练 数据概述: 本数据集包含墨西哥总统安德烈斯·曼努埃尔·洛佩兹·奥布拉多在其任期内公开演讲的语料库。数据来源于墨西哥政府官方 YouTube 频道中所有与本届总统任期相关的...
    packageimg