找到5,735个数据集

标签: 文本分析

过滤结果
  • 亚马逊图书评论数据集

    2025年4月15日   

    亚马逊图书评论数据集 数据来源:互联网公开数据 标签:亚马逊,图书评论,情感分析,文本分析,词性分析,用户反馈,市场研究 数据概述: 本数据集来源于亚马逊网站上的图书评论,包含对各种图书的正面和负面评价内容。数据集涵盖了广泛的图书类别和评论,为研究读者对图书的情感反馈提供了丰富的素材。 数据用途概述:...
    packageimg
  • AI问答FAQ搜索系统问题难度评估数据集

    2025年4月15日   

    AI问答FAQ搜索系统问题难度评估数据集 数据来源:互联网公开数据 标签:FAQ,问答系统,自然语言处理,问题难度,用户查询,机器学习,文本分析 数据概述: 本数据集由ai-...
    packageimg
  • Reddit抑郁症主题帖子及评论文本数据集

    2025年4月15日   

    Reddit抑郁症主题帖子及评论文本数据集 数据来源:互联网公开数据 标签:Reddit,抑郁症,心理健康,文本分析,情感分析,深度学习,社交媒体,帖子,评论 数据概述:...
    packageimg
  • 孟加拉语假新闻识别数据集2024

    2025年4月15日   

    孟加拉语假新闻识别数据集2024 数据来源:互联网公开数据 标签:假新闻,孟加拉语,新闻识别,文本分析,语言处理,研究数据 数据概述:...
    packageimg
  • 孟加拉语垃圾短信数据集

    2025年4月15日   

    孟加拉语垃圾短信数据集 数据来源:互联网公开数据 标签:孟加拉语,垃圾短信,短信过滤,商业消息,网络钓鱼,数据集,文本分析 数据概述:...
    packageimg
  • 土耳其新闻标题点击诱饵分类数据集

    2025年4月15日   

    土耳其新闻标题点击诱饵分类数据集 数据来源:互联网公开数据 标签:新闻标题, 点击诱饵, 数据分类, 文本分析, 媒体研究, 数据标注, 文本分类 数据概述:...
    packageimg
  • 伊斯兰教圣训文本分析与研究数据集

    2025年4月15日   

    伊斯兰教圣训文本分析与研究数据集 数据来源:互联网公开数据 标签:圣训, Sunnah, 伊斯兰教, NLP, 自然语言处理, 文本分析, 机器学习, 阿拉伯语, 印尼语, 宗教研究, 文本翻译 数据概述: 本数据集旨在促进使用自然语言处理 (NLP)...
    packageimg
  • 五大人气卡通角色谷歌搜索结果数据集-2023

    2025年4月14日   

    五大人气卡通角色谷歌搜索结果数据集-2023 数据来源:互联网公开数据 标签:谷歌搜索,卡通,数据分析,人气趋势,文本分析,自然语言处理,在线内容,娱乐研究 数据概述: 本数据集提供了5个广受欢迎的卡通角色——秦时宝(Shin-chan)、多啦A梦(Doraemon)、Ben 10、讨厌的亨利(Horrid Henry)和憨豆先生(Mr....
    packageimg
  • 英语-印地语句子数据集

    2025年4月14日   

    英语-印地语句子数据集 数据来源:互联网公开数据 标签:英语,印地语,句子翻译,语言学习,文本分析,机器翻译,双语数据集 数据概述: 本数据集包含2718条英语句子及其对应的印地语翻译,旨在为语言学习、文本分析和机器翻译研究提供高质量的双语数据。数据集中的每对句子均经过仔细校对,确保翻译的准确性和一致性。 数据用途概述:...
    packageimg
  • HuggingFace平台模型元数据与下载量分析数据集-2021年6月

    2025年4月14日   

    HuggingFace平台模型元数据与下载量分析数据集-2021年6月 数据来源:互联网公开数据 标签:Hugging Face, 模型, 机器学习, 自然语言处理, 计算机视觉, 模型库, 元数据, 下载量, 文本分析 数据概述: 本数据集包含了Hugging Face模型中心(Model...
    packageimg
  • 随机日期数据集

    2025年4月14日   

    随机日期数据集 数据来源:互联网公开数据 标签:日期识别,机器学习,自然语言处理,数据标注,文本分析,日期标注,日期提取 数据概述: 本数据集包含由Python脚本生成的随机日期数据,旨在用于机器学习模型训练,以识别文档中的日期。数据集标注了每个词或词组是否为日期,为日期标注任务提供了基础。 数据用途概述:...
    packageimg
  • 美式橄榄球联盟球队公众情感分析数据集2024年11月

    2025年4月14日   

    美式橄榄球联盟球队公众情感分析数据集2024年11月 数据来源:互联网公开数据 标签:美式橄榄球联盟,球队情感分析,公众情感,社交媒体分析,数据挖掘,文本分析 数据概述:...
    packageimg
  • 安然公司电子邮件数据集-垃圾邮件检测与分析-2000-2002

    2025年4月14日   

    安然公司电子邮件数据集-垃圾邮件检测与分析-2000-2002 数据来源:互联网公开数据 标签:电子邮件,垃圾邮件,安然公司,文本分析,自然语言处理,信息检索,邮件安全,金融,商业丑闻 数据概述:...
    packageimg
  • 马拉提语新闻标题数据集1963-2021

    2025年4月14日   

    马拉提语新闻标题数据集1963-2021 数据来源:互联网公开数据 标签:马拉提语,新闻标题,文本分析,自然语言处理,分类模型,机器学习,数据清洗 数据概述: 本数据集包含从马拉提语新闻网站收集的约12000条新闻文章标题。数据集已经经过清洗处理,并分为训练集和测试集,适用于基准测试各类马拉提语文本分类模型。 数据用途概述:...
    packageimg
  • 联合国一般性辩论文本集

    2025年4月14日   

    联合国一般性辩论文本集 数据来源:互联网公开数据 标签:联合国,一般性辩论,政治话语,文本分析,国际关系,NLP,全球治理,多边外交,历史记录,政治文本,政策分析 数据概述:...
    packageimg
  • ChatGPT医疗应用研究文献数据集

    2025年4月14日   

    ChatGPT医疗应用研究文献数据集 数据来源:互联网公开数据 标签:PubMed, 医疗, ChatGPT, 研究论文, 文本分析, 长上下文建模, 大语言模型, Gemini 数据概述: 本数据集由 Google - Gemini Long Context 竞赛产生,包含通过 PubMed 搜索获取的关于 ChatGPT...
    packageimg
  • 微软位置提及识别实践数据集

    2025年4月14日   

    微软位置提及识别实践数据集 数据来源:互联网公开数据 标签:位置提及识别,微博客,紧急情况,灾害响应,救援活动,推特,文本分析 数据概述:...
    packageimg
  • 命名实体识别文本信息标注数据集

    2025年4月14日   

    命名实体识别文本信息标注数据集 数据来源:互联网公开数据 标签:命名实体识别,自然语言处理,文本分析,机器学习,数据标注,信息抽取,文本挖掘 数据概述:...
    packageimg
  • 特朗普推文及情感分析数据集

    2025年4月14日   

    特朗普推文及情感分析数据集 数据来源:互联网公开数据 标签:推文,特朗普,社交媒体,情感分析,时间序列,文本分析,政治,公众反应 数据概述:...
    packageimg
  • 事实核查科学声明文章数据集

    2025年4月14日   

    事实核查科学声明文章数据集 数据来源:互联网公开数据 标签:事实核查,科学声明,文本分析,情感分析,机器学习,新闻元数据,数据清洗 数据概述:...
    packageimg