数据集 - 海数据

圣经葡萄牙文版数据集

2025年4月14日

圣经葡萄牙文版数据集数据来源：互联网公开数据标签：圣经,葡萄牙文,文本挖掘,自然语言处理,聚类分析,分类分析,情感分析,神学研究数据概述：本数据集包含《圣经》的葡萄牙文版，主要源于Almeida Corrigida e Revisada...

ZIP

快乐原因文本分类数据集

2025年4月14日

快乐原因文本分类数据集数据来源：互联网公开数据标签：文本分类,情感分析,快乐原因,数据科学,机器学习,自然语言处理数据概述：本数据集来源于一次在HackerEarth上进行的数据科学家职位挑战赛，包含了一系列文本数据，每条文本表达了个体感到快乐的原因。数据集旨在通过文本分类技术，识别并归类出个体快乐的原因，从而为情感分析和用户行为研究提供支持。...

ZIP

句子完成度预测文本分类数据集

2025年4月14日

句子完成度预测文本分类数据集数据来源：互联网公开数据标签：自然语言处理,句子完成度,文本分类,弱监督学习,新闻头条,文本数据清理数据概述：...

ZIP

数据2019-2023印度尼西亚招聘信息推文数据集

2025年4月14日

数据2019-2023印度尼西亚招聘信息推文数据集数据来源：互联网公开数据标签：招聘信息,推文,自然语言处理,市场分析,公司需求,角色需求,社交媒体数据概述：本数据集包含2019年1月1日至2023年4月10日期间与职位空缺和招聘相关的50,000条推文。推文通过关键词“Job Vacancy”、“We are Hiring”和“We're...

ZIP

电影对话语料库第二部分

2025年4月14日

电影对话语料库第二部分数据来源：互联网公开数据标签：电影对话,语料库,自然语言处理,语音识别,时间标注,电影分析数据概述：...

ZIP

孟加拉语讽刺检测数据集2022

2025年4月14日

孟加拉语讽刺检测数据集2022 数据来源：互联网公开数据标签：讽刺检测,孟加拉语,自然语言处理,文本分析,深度学习,BERT,可解释AI 数据概述：...

ZIP

仇恨言论检测模型性能评估数据集

2025年4月14日

仇恨言论检测模型性能评估数据集数据来源：互联网公开数据标签：仇恨言论检测, 自然语言处理, 模型评估, 文本分类, 机器学习, 偏见检测, 功能测试数据概述：本数据集“HateCheck”是一套用于评估仇恨言论检测模型性能的功能测试集。数据集包含3728个经过验证的测试案例，涵盖了29种功能测试。...

ZIP

普丁与卡尔森访谈公众情感数据集

2025年4月14日

普丁与卡尔森访谈公众情感数据集数据来源：互联网公开数据标签：公众情感,普丁,卡尔森,访谈,意见分析,自然语言处理,机器学习,数据可视化数据概述：...

ZIP

Telegram消息垃圾信息与正常信息分类数据集

2025年4月14日

Telegram消息垃圾信息与正常信息分类数据集数据来源：互联网公开数据标签：Telegram,消息分类,垃圾信息,自然语言处理,文本分析,机器学习,数据,Spam,Ham 数据概述：...

ZIP

性别偏见分析数据集

2025年4月14日

性别偏见分析数据集数据来源：互联网公开数据标签：性别偏见,年龄偏见,澳大利亚,工作广告,自然语言处理,机器学习,数据偏见,公平性研究数据概述：本数据集与论文《Developing a Large-Scale Language Model to Unveil and Alleviate Gender and Age Biases in...

ZIP

推特话题汇总数据集

2025年4月14日

推特话题汇总数据集数据来源：互联网公开数据标签：推特,话题汇总,自然语言处理,文本分析,社会媒体,教育,研究,自动化摘要数据概述：本数据集包含了来自不同话题标签的推文摘要，总计1950条记录。这些推文摘要通过先进的自然语言处理模型ChatGPT系统生成，为教育和研究提供了宝贵的数据资源。数据用途概述：...

ZIP

巴西葡萄牙语股票市场推文数据集

2025年4月14日

巴西葡萄牙语股票市场推文数据集数据来源：互联网公开数据标签：股票市场,推文,自然语言处理,实体识别,HAREM,巴西,情感分类数据概述：本数据集包含4,048条用巴西葡萄牙语编写的股票市场相关推文，并根据HAREM的分类法进行了实体识别标注。这些推文最初用于情感分类研究，并且已经完成了情感分类的标注。数据用途概述：...

ZIP

最近新闻推文情感分析与分类数据集

2025年4月14日

最近新闻推文情感分析与分类数据集数据来源：互联网公开数据标签：新闻推文,情感分析,分类,社交媒体分析,自然语言处理,公众情绪,舆情分析数据概述：...

ZIP

YouTube评论情感分析数据集

2025年4月14日

YouTube评论情感分析数据集数据来源：互联网公开数据标签：YouTube,评论,情感分析,自然语言处理,文本分类,情感标注,机器学习数据概述：...

ZIP

斯洛文尼亚网络文本类型识别数据集-GINCO1-0训练-测试集

2025年4月14日

斯洛文尼亚网络文本类型识别数据集-GINCO1-0训练-测试集数据来源：互联网公开数据标签：文本分类,自然语言处理,语料库,斯洛文尼亚语,网络文本,文本类型识别,机器学习,GINCO 1.0,语料数据概述：本数据集是基于斯洛文尼亚网络文本类型识别语料库GINCO 1.0构建的训练集和测试集，按照80:20的比例划分。GINCO...

ZIP

可解释AI文献数据集

2025年4月14日

可解释AI文献数据集数据来源：互联网公开数据标签：可解释AI,机器学习,人工智能,学术研究,自然语言处理,数据分析,技术趋势数据概述：本数据集来源于Cornell University发布的arXiv文献集，精选了与“可解释AI（Explainable...

ZIP

文本改写数据集PAWS

2025年4月14日

文本改写数据集PAWS 数据来源：互联网公开数据标签：文本改写,语义理解,句子对齐,自然语言处理,机器学习,模式识别数据概述：本数据集PAWS（Paraphrase Word...

ZIP

LLM20问题解决方案关键词频率数据集

2025年4月14日

LLM20问题解决方案关键词频率数据集数据来源：互联网公开数据标签：LLM,20问题解决方案,关键词频率,自然语言处理,机器学习,数据分析数据概述：本数据集包含用于解决LLM（大语言模型）20个问题的过滤后关键词列表及其出现频率。数据涵盖了与20个问题相关的常用关键词及其在解决方案中的使用频率，为研究和开发提供了宝贵的语言模型训练资源。...

ZIP

社交智能问答数据集-社会互动情境问答数据集

2025年4月14日

社交智能问答数据集-社会互动情境问答数据集数据来源：互联网公开数据标签：社交智能,问答,常识推理,自然语言处理,机器学习,社会情境,文本分析数据概述：本数据集名为“Social IQa (Social Interaction Q&A)”，是一个用于评估模型社会常识推理能力的问答基准。与以往侧重于物理或分类知识的基准不同，Social...

ZIP

推特讽刺分类数据集

2025年4月14日

推特讽刺分类数据集数据来源：互联网公开数据标签：讽刺识别,自然语言处理,NLP,社交媒体分析,文本分类,讽刺检测,推特数据数据概述：本数据集包含了大量推特帖子，并被分类为讽刺性内容，并进一步细分为不同的讽刺子类别。该数据集为自然语言处理领域的学习者提供了宝贵的资源，可用于训练和测试模型。数据用途概述：...

ZIP

找到11,745个数据集

注册成功！