找到12,083个数据集

标签: TXT

过滤结果
  • 纳西斯人格量表响应数据集

    2025年4月15日   

    纳西斯人格量表响应数据集 数据来源:互联网公开数据 标签:纳西斯人格,人格测量,心理学研究,公开心理学数据,非临床人格,个人特质,社会心理学 数据概述:...
    packageimg
  • 英国电力市场交易数据分析数据集

    2025年4月15日   

    英国电力市场交易数据分析数据集 数据来源:互联网公开数据 标签:电力市场,能源交易,英国,市场分析,价格预测,交易策略,电力,能源 数据概述:...
    packageimg
  • 自然亲和性量表数据集

    2025年4月15日   

    自然亲和性量表数据集 数据来源:互联网公开数据 标签:自然亲和性,量表,心理研究,开放心理学,公众教育,问卷数据,心理测量 数据概述:...
    packageimg
  • Netflix电影用户评分与受欢迎程度分析数据集

    2025年4月15日   

    Netflix电影用户评分与受欢迎程度分析数据集 数据来源:互联网公开数据 标签:Netflix,电影,用户评分,受欢迎程度,平均评分,用户数量,电影分析,流媒体 数据概述:...
    packageimg
  • 贝林格猫文章数据集

    2025年4月15日   

    贝林格猫文章数据集 数据来源:互联网公开数据 标签:贝林格猫,公民新闻,开源调查,国际新闻,事实核查,数据训练,LLM模型 数据概述:...
    packageimg
  • 纽约市航班数据集

    2025年4月15日   

    纽约市航班数据集 数据来源:互联网公开数据 标签:航班数据,纽约市,航班延误,航班时间,航空公司,机场,飞行时间,距离,数据分析,交通研究 数据概述:...
    packageimg
  • 中国气象局西北太平洋热带气旋最佳路径数据集1949至今

    2025年4月15日   

    中国气象局西北太平洋热带气旋最佳路径数据集1949至今 数据来源:互联网公开数据 标签:热带气旋,西北太平洋,最佳路径,中国气象局,灾害监测,气象研究,时间序列 数据概述:...
    packageimg
  • 美国人口普查姓名数据集2000-2010

    2025年4月15日   

    美国人口普查姓名数据集2000-2010 数据来源:互联网公开数据 标签:美国人口普查,姓名,名字,姓氏,时间序列,数据清洗,语言资源 数据概述: 本数据集包含两个从美国人口普查获取的数据文件,以及三个从多元来源提取的.tsv文件。具体文件包括: - yob2000.txt:2000年美国人口普查中的男性和女性名字及其出现频率。 -...
    packageimg
  • 科学文献关键词分析数据集1963-2021

    2025年4月15日   

    科学文献关键词分析数据集1963-2021 数据来源:互联网公开数据 标签:科学文献,关键词,作者关键词,自动关键词,Web of Science,文本分析,自然语言处理 数据概述: 本数据集包含了从Web of Science...
    packageimg
  • 旁遮普语沙木基语料库词频统计数据集

    2025年4月15日   

    旁遮普语沙木基语料库词频统计数据集 数据来源:互联网公开数据 标签:旁遮普语,沙木基语,语言学,词频统计,文本分析,自然语言处理,语料库 数据概述: 本数据集基于从互联网收集的旁遮普语沙木基语料库构建而成,包含单字词(unigram)和双字词(bigram)的频率统计信息。 数据文件包括: unigram-p.csv:包含50,000个单字词及其词频。...
    packageimg
  • 英国广播公司BBC新闻文章文本数据集

    2025年4月15日   

    英国广播公司BBC新闻文章文本数据集 数据来源:互联网公开数据 标签:新闻文章,文本数据,BBC,媒体,内容分析,自然语言处理,文本挖掘,英国 数据概述: 本数据集包含英国广播公司(BBC)发布的新闻文章文本内容。数据以CSV格式存储,原始数据为TXT格式。数据集涵盖了BBC新闻文章的标题、正文以及可能包含的发布日期、所属类别等元数据。 数据用途概述:...
    packageimg
  • 数据集发布说明模版数据集

    2025年4月15日   

    数据集发布说明模版数据集 数据来源:互联网公开数据 数据集说明: 该数据集目前尚未包含具体内容说明,其结构为数据集描述的模版文本,旨在引导数据发布者围绕数据的背景、来源、时间范围和潜在用途进行规范化阐述。这种模版常用于数据共享平台(如 Kaggle、DataHub 等)中,以帮助数据发布者构建完整的“数据故事”,增强数据集的可理解性与复用性。...
    packageimg
  • 文学作品数字化研究书籍数据集

    2025年4月15日   

    文学作品数字化研究书籍数据集 数据来源:互联网公开数据 标签:数字图书馆,文学作品,文本分析,版权开放,文化研究,文本挖掘,语言学研究,文学史,经典文献,公共领域 数据概述: 本数据集收录了Project...
    packageimg
  • 房地产房价预测数据集

    2025年4月15日   

    房地产房价预测数据集 数据来源:互联网公开数据 标签:房地产,房价预测,数据预处理,特征工程,机器学习,监督学习 数据概述 本数据集包含经过全面预处理的房地产房价数据,适用于房价预测任务。数据集分为训练集(train)和测试集(test),涵盖了多个影响房价的关键特征。数据经过严格的清洗和处理,包括缺失值填充(null...
    packageimg
  • 火影忍者最后之气对话与字幕数据集

    2025年4月15日   

    火影忍者最后之气对话与字幕数据集 数据来源:互联网公开数据 标签:火影忍者,对话分析,字幕,文本挖掘,情节研究,角色分析 数据概述: 本数据集收录了《火影忍者最后之气》(又称《火影忍者:最后的气》)电视剧的所有对话文本,涵盖每一集。原始对话文本来源于Fandom Transcripts...
    packageimg
  • 词汇智商测试响应数据集

    2025年4月15日   

    词汇智商测试响应数据集 数据来源:互联网公开数据 标签:词汇智商,测试响应,心理学研究,数据分析,公众教育,心理评估 数据概述:...
    packageimg
  • 印尼圣经文本数据集

    2025年4月15日   

    印尼圣经文本数据集 数据来源:互联网公开数据 标签:印尼,圣经,宗教文本,文本分析,语言文化,宗教研究 数据概述: 本数据集包含从互联网公开资源爬取的印尼语圣经文本,内容涵盖圣经的多卷书,包括旧约和新约。数据集以文本形式呈现,适合用于宗教文本研究、语言分析、文化解读等多种场景。 数据用途概述:...
    packageimg
  • 社交媒体情感分析数据集-用户评论情感分类-训练与评估-公开

    2025年4月15日   

    社交媒体情感分析数据集-用户评论情感分类-训练与评估-公开 数据来源:互联网公开数据 标签:情感分析,自然语言处理,社交媒体,用户评论,文本分类,机器学习,情感分类,正负中性 数据概述: 本数据集旨在支持社交媒体情感分析任务,涵盖了用户评论的情感倾向分类。数据集包含训练集、开发集和测试集,用于模型的训练、验证和评估。...
    packageimg
  • 印度板球世界杯2023数据集

    2025年4月15日   

    印度板球世界杯2023数据集 数据来源:互联网公开数据 标签:板球世界杯,2023,印度板球,比赛数据,球-by-ball分析,球员表现,团队策略,比赛统计 数据概述: 本数据集包含了2023年印度板球世界杯的相关信息,包括48个文件夹,每个文件夹对应一场比赛。每个文件夹包含两个关键文件: 1. Match-No...
    packageimg
  • 英语到阿萨姆语平行语料库数据集

    2025年4月15日   

    英语到阿萨姆语平行语料库数据集 数据来源:互联网公开数据 标签:英语,阿萨姆语,平行语料库,自然语言处理,翻译,语言学 数据概述: 本数据集包含大量经过清理的英语到阿萨姆语平行语料库数据,适用于自然语言处理和机器翻译研究。数据集分为两部分:1_eng.txt 包含大量的英语句子,1_assamese.txt...
    packageimg