-
圣经葡萄牙文版数据集
圣经葡萄牙文版数据集 数据来源:互联网公开数据 标签:圣经,葡萄牙文,文本挖掘,自然语言处理,聚类分析,分类分析,情感分析,神学研究 数据概述: 本数据集包含《圣经》的葡萄牙文版,主要源于Almeida Corrigida e Revisada... -
快乐原因文本分类数据集
快乐原因文本分类数据集 数据来源:互联网公开数据 标签:文本分类,情感分析,快乐原因,数据科学,机器学习,自然语言处理 数据概述: 本数据集来源于一次在HackerEarth上进行的数据科学家职位挑战赛,包含了一系列文本数据,每条文本表达了个体感到快乐的原因。数据集旨在通过文本分类技术,识别并归类出个体快乐的原因,从而为情感分析和用户行为研究提供支持。... -
句子完成度预测文本分类数据集
句子完成度预测文本分类数据集 数据来源:互联网公开数据 标签:自然语言处理,句子完成度,文本分类,弱监督学习,新闻头条,文本数据清理 数据概述:... -
数据2019-2023印度尼西亚招聘信息推文数据集
数据2019-2023印度尼西亚招聘信息推文数据集 数据来源:互联网公开数据 标签:招聘信息,推文,自然语言处理,市场分析,公司需求,角色需求,社交媒体 数据概述: 本数据集包含2019年1月1日至2023年4月10日期间与职位空缺和招聘相关的50,000条推文。推文通过关键词“Job Vacancy”、“We are Hiring”和“We're... -
-
孟加拉语讽刺检测数据集2022
孟加拉语讽刺检测数据集2022 数据来源:互联网公开数据 标签:讽刺检测,孟加拉语,自然语言处理,文本分析,深度学习,BERT,可解释AI 数据概述:... -
仇恨言论检测模型性能评估数据集
仇恨言论检测模型性能评估数据集 数据来源:互联网公开数据 标签:仇恨言论检测, 自然语言处理, 模型评估, 文本分类, 机器学习, 偏见检测, 功能测试 数据概述: 本数据集“HateCheck”是一套用于评估仇恨言论检测模型性能的功能测试集。 数据集包含3728个经过验证的测试案例,涵盖了29种功能测试。... -
普丁与卡尔森访谈公众情感数据集
普丁与卡尔森访谈公众情感数据集 数据来源:互联网公开数据 标签:公众情感,普丁,卡尔森,访谈,意见分析,自然语言处理,机器学习,数据可视化 数据概述:... -
Telegram消息垃圾信息与正常信息分类数据集
Telegram消息垃圾信息与正常信息分类数据集 数据来源:互联网公开数据 标签:Telegram,消息分类,垃圾信息,自然语言处理,文本分析,机器学习,数据,Spam,Ham 数据概述:... -
性别偏见分析数据集
性别偏见分析数据集 数据来源:互联网公开数据 标签:性别偏见,年龄偏见,澳大利亚,工作广告,自然语言处理,机器学习,数据偏见,公平性研究 数据概述: 本数据集与论文《Developing a Large-Scale Language Model to Unveil and Alleviate Gender and Age Biases in... -
推特话题汇总数据集
推特话题汇总数据集 数据来源:互联网公开数据 标签:推特,话题汇总,自然语言处理,文本分析,社会媒体,教育,研究,自动化摘要 数据概述: 本数据集包含了来自不同话题标签的推文摘要,总计1950条记录。这些推文摘要通过先进的自然语言处理模型ChatGPT系统生成,为教育和研究提供了宝贵的数据资源。 数据用途概述:... -
巴西葡萄牙语股票市场推文数据集
巴西葡萄牙语股票市场推文数据集 数据来源:互联网公开数据 标签:股票市场,推文,自然语言处理,实体识别,HAREM,巴西,情感分类 数据概述: 本数据集包含4,048条用巴西葡萄牙语编写的股票市场相关推文,并根据HAREM的分类法进行了实体识别标注。这些推文最初用于情感分类研究,并且已经完成了情感分类的标注。 数据用途概述:... -
最近新闻推文情感分析与分类数据集
最近新闻推文情感分析与分类数据集 数据来源:互联网公开数据 标签:新闻推文,情感分析,分类,社交媒体分析,自然语言处理,公众情绪,舆情分析 数据概述:... -
YouTube评论情感分析数据集
YouTube评论情感分析数据集 数据来源:互联网公开数据 标签:YouTube,评论,情感分析,自然语言处理,文本分类,情感标注,机器学习 数据概述:... -
斯洛文尼亚网络文本类型识别数据集-GINCO1-0训练-测试集
斯洛文尼亚网络文本类型识别数据集-GINCO1-0训练-测试集 数据来源:互联网公开数据 标签:文本分类,自然语言处理,语料库,斯洛文尼亚语,网络文本,文本类型识别,机器学习,GINCO 1.0,语料 数据概述: 本数据集是基于斯洛文尼亚网络文本类型识别语料库GINCO 1.0构建的训练集和测试集,按照80:20的比例划分。GINCO... -
可解释AI文献数据集
可解释AI文献数据集 数据来源:互联网公开数据 标签:可解释AI,机器学习,人工智能,学术研究,自然语言处理,数据分析,技术趋势 数据概述: 本数据集来源于Cornell University发布的arXiv文献集,精选了与“可解释AI(Explainable... -
文本改写数据集PAWS
文本改写数据集PAWS 数据来源:互联网公开数据 标签:文本改写,语义理解,句子对齐,自然语言处理,机器学习,模式识别 数据概述: 本数据集PAWS(Paraphrase Word... -
LLM20问题解决方案关键词频率数据集
LLM20问题解决方案关键词频率数据集 数据来源:互联网公开数据 标签:LLM,20问题解决方案,关键词频率,自然语言处理,机器学习,数据分析 数据概述: 本数据集包含用于解决LLM(大语言模型)20个问题的过滤后关键词列表及其出现频率。数据涵盖了与20个问题相关的常用关键词及其在解决方案中的使用频率,为研究和开发提供了宝贵的语言模型训练资源。... -
社交智能问答数据集-社会互动情境问答数据集
社交智能问答数据集-社会互动情境问答数据集 数据来源:互联网公开数据 标签:社交智能,问答,常识推理,自然语言处理,机器学习,社会情境,文本分析 数据概述: 本数据集名为“Social IQa (Social Interaction Q&A)”,是一个用于评估模型社会常识推理能力的问答基准。与以往侧重于物理或分类知识的基准不同,Social... -
推特讽刺分类数据集
推特讽刺分类数据集 数据来源:互联网公开数据 标签:讽刺识别,自然语言处理,NLP,社交媒体分析,文本分类,讽刺检测,推特数据 数据概述: 本数据集包含了大量推特帖子,并被分类为讽刺性内容,并进一步细分为不同的讽刺子类别。该数据集为自然语言处理领域的学习者提供了宝贵的资源,可用于训练和测试模型。 数据用途概述:...