找到2,630个数据集

标签: 文本挖掘

过滤结果
  • 股票代码推文数据集2018-2023

    2025年4月18日   

    股票代码推文数据集2018-2023 数据来源:互联网公开数据 标签:股票代码,社交媒体分析,文本挖掘,金融分析,自然语言处理,时间序列,情感分析 数据概述:...
    packageimg
  • 乌克兰战争主题推文数据集-推特用户观点与情感分析-多月

    2025年4月18日   

    乌克兰战争主题推文数据集-推特用户观点与情感分析-多月 数据来源:互联网公开数据 标签:乌克兰战争,推特,社交媒体,情感分析,文本挖掘,时事热点,舆情分析,战争,推文 数据概述:...
    packageimg
  • 影评网站电影评论数据分析数据集-15000部电影58-2万条评论

    2025年4月18日   

    影评网站电影评论数据分析数据集-15000部电影58-2万条评论 数据来源:互联网公开数据 标签:电影,影评,评论,评分,用户评价,电影分析,情感分析,文本挖掘 数据概述:...
    packageimg
  • 社交媒体内容分析数据集

    2025年4月18日   

    社交媒体内容分析数据集 数据来源:互联网公开数据 标签:社交媒体,内容分析,用户行为,文本挖掘,趋势分析,数据可视化,传播效果,情感分析,内容营销 数据概述:...
    packageimg
  • COVID-19医学论文数据集

    2025年4月18日   

    COVID-19医学论文数据集 数据来源:互联网公开数据 标签:COVID-19,医学研究,病毒性感染,文献分析,文本挖掘,公共卫生 数据概述:...
    packageimg
  • Airbnb房源评论文本情感分析数据集-全球房源评论数据

    2025年4月18日   

    Airbnb房源评论文本情感分析数据集-全球房源评论数据 数据来源:互联网公开数据 标签:Airbnb,房源评论,文本数据,情感分析,自然语言处理,文本挖掘,用户反馈,住宿体验 数据概述:...
    packageimg
  • COVID-19实体数据集

    2025年4月18日   

    COVID-19实体数据集 数据来源:互联网公开数据 标签:COVID-19,实体识别,文本挖掘,机器学习,医学研究,数据科学,实体编码 数据概述: 本数据集基于COVID-19开放研究数据集(CORD-19),通过sciSpaCy工具对论文中的文本实体进行提取和编码,形成结构化的数据集。数据处理过程约需2小时,最终输出为Pandas...
    packageimg
  • 足球俱乐部新闻数据集

    2025年4月18日   

    足球俱乐部新闻数据集 数据来源:互联网公开数据 标签:足球,新闻,俱乐部名称,时间序列,情感分析,分类,文本挖掘,数据科学,机器学习 数据概述:...
    packageimg
  • 伊朗2022年抗议活动推文数据集

    2025年4月18日   

    伊朗2022年抗议活动推文数据集 数据来源:互联网公开数据 标签:伊朗抗议,推文数据,社交媒体分析,事件追踪,社会动态,文本挖掘,舆情分析 数据概述:...
    packageimg
  • 孟加拉语维基百科数据集

    2025年4月17日   

    孟加拉语维基百科数据集 数据来源:互联网公开数据 标签:孟加拉语,维基百科,文本数据,自然语言处理,文本挖掘,机器学习,语料库 数据概述:...
    packageimg
  • 菲律宾程序员社区Reddit论坛帖子与评论数据集-2014年9月至至今

    2025年4月17日   

    菲律宾程序员社区Reddit论坛帖子与评论数据集-2014年9月至至今 数据来源:互联网公开数据 标签:程序员,菲律宾,社交媒体,论坛,编程,技术,社区,数据分析,文本挖掘 数据概述: 本数据集收录了Reddit论坛r/PinoyProgrammer子版块的帖子和评论数据,该子版块是菲律宾程序员的聚集地,创建于2014年9月8日。...
    packageimg
  • 主题质量评估数据集

    2025年4月17日   

    主题质量评估数据集 数据来源:互联网公开数据 标签:主题模型,质量评估,文本分析,自然语言处理,机器学习,主题抽取,文本挖掘 数据概述:...
    packageimg
  • AZLyrics歌词数据集

    2025年4月16日   

    AZLyrics歌词数据集 数据来源:互联网公开数据 标签:歌词,歌曲,艺术家,文本挖掘,自然语言处理,音乐分析,内容创作 数据概述: 本数据集包含来自AZLyrics.com的歌词信息,数据按照歌曲艺术家名称的首字母进行分类整理。每个数据文件为CSV格式,包含以下字段: - ARTIST_NAME:艺术家名称 - ARTIST_URL:艺术家页面链接...
    packageimg
  • IMDbTop250电视剧用户评论与评分数据集-2024

    2025年4月16日   

    IMDbTop250电视剧用户评论与评分数据集-2024 数据来源:互联网公开数据 标签:IMDb, 电视剧, 评论, 评分, 用户评价, NLP, 自然语言处理, 情感分析, 文本挖掘 数据概述: 本数据集收录了截至2024年IMDb Top...
    packageimg
  • 乌拉圭媒体历史推文数据集

    2025年4月16日   

    乌拉圭媒体历史推文数据集 数据来源:互联网公开数据 标签:乌拉圭媒体,推文数据,社交媒体分析,新闻传播,文本挖掘,时间序列分析,内容分析 数据概述: 本数据集收录了乌拉圭六家主流媒体(包括《El País》、《Brecha》、《Búsqueda》、《El Observador》、《La República》和《La...
    packageimg
  • TED演讲数据集含演讲稿-LIWC和MFT分析

    2025年4月16日   

    TED演讲数据集含演讲稿-LIWC和MFT分析 数据来源:互联网公开数据 标签:TED演讲,公共演讲,语言分析,道德基础理论,数据可视化,文本挖掘,自然语言处理,心理语言学 数据概述:...
    packageimg
  • 日本报纸新闻数据集

    2025年4月16日   

    日本报纸新闻数据集 数据来源:互联网公开数据 标签:日本媒体,新闻文本,时间序列,多语言 corpus,新闻分析,文本挖掘,语言研究 数据概述: 本数据集收录了2005年7月至2021年10月期间日本主流报纸网站及历史报纸 dataset...
    packageimg
  • Reddit社区咖啡主题帖子情感与互动分析数据集

    2025年4月16日   

    Reddit社区咖啡主题帖子情感与互动分析数据集 数据来源:互联网公开数据 标签:Reddit,咖啡,社交媒体,情感分析,消费者行为,文本挖掘,社区互动,话题趋势 数据概述: 本数据集包含了通过Reddit PRAW...
    packageimg
  • 音乐作品歌词数据集-歌曲及歌词信息-55K-首歌曲

    2025年4月16日   

    音乐作品歌词数据集-歌曲及歌词信息-55K-首歌曲 数据来源:互联网公开数据 标签:歌词,歌曲,音乐,艺术家,文本数据,音乐分析,文本挖掘 数据概述:...
    packageimg
  • 未来影响者推文数据集

    2025年4月15日   

    未来影响者推文数据集 数据来源:互联网公开数据 标签:未来影响者,推文,社交媒体分析,文本挖掘,趋势预测,用户行为,网络影响力 数据概述: 本数据集收录了超过200位未来影响者在2021年1月至2023年4月期间发布的推文,涵盖用户行为、内容主题、互动数据等关键要素。数据集为分析未来影响者的行为模式及其潜在影响力提供了丰富的文本和社交数据支持。...
    packageimg