-
AI生成与人类写作检测数据集
AI生成与人类写作检测数据集 数据来源:互联网公开数据 标签:AI生成文本,人类写作,文本分类,自然语言处理,NLP,机器学习,生成式AI,数据集 数据概述... -
SentEval句子嵌入评估工具包数据集
SentEval句子嵌入评估工具包数据集 数据来源:互联网公开数据 标签:自然语言处理, 句子嵌入, 评估, 文本相似度, 情感分析, 语义理解, 迁移学习, 语言学探针 数据概述:... -
电影推荐系统构建-IMDB与MovieLens融合预处理数据集
电影推荐系统构建-IMDB与MovieLens融合预处理数据集 数据来源:互联网公开数据 标签:电影推荐,IMDB,MovieLens,推荐系统,数据预处理,矩阵分解,自然语言处理,电影数据,评分数据 数据概述:... -
Quora问答平台问题真伪分类训练数据集-2018
Quora问答平台问题真伪分类训练数据集-2018 数据来源:互联网公开数据 标签:自然语言处理,文本分类,问答系统,Quora,机器学习,训练数据,问题真伪,情感分析 数据概述:... -
孟加拉语命名实体识别数据集B-NER2023年
孟加拉语命名实体识别数据集B-NER2023年 数据来源:互联网公开数据 标签:孟加拉语,命名实体识别,自然语言处理,数据集,基础评估,学术研究 数据概述: 本数据集B-NER收录了大量孟加拉语文本中的命名实体,涵盖了人名、地名、组织名等类别,是目前最大的孟加拉语命名实体数据集。数据集经过精心标注,为孟加拉语自然语言处理研究提供了坚实的基础。... -
IMDB电影评论数据集50K评论
IMDB电影评论数据集50K评论 数据来源:互联网公开数据 标签:电影评论,情感分析,评分预测,自然语言处理,文本数据,观众反馈,电影推荐 数据概述:... -
墨西哥总统安德烈斯-曼努埃尔-洛佩兹-奥布拉多演讲数据集
墨西哥总统安德烈斯-曼努埃尔-洛佩兹-奥布拉多演讲数据集 数据来源:互联网公开数据 标签:墨西哥总统,演讲文本,政府政策,政治分析,自然语言处理,文本挖掘,语言模型训练 数据概述: 本数据集包含墨西哥总统安德烈斯·曼努埃尔·洛佩兹·奥布拉多在其任期内公开演讲的语料库。数据来源于墨西哥政府官方 YouTube 频道中所有与本届总统任期相关的... -
QASPERNLP问题与证据数据集
QASPERNLP问题与证据数据集 数据来源:互联网公开数据 标签:NLP, 问题与答案, 证据, 专家解析, 自然语言处理, 文献研究, 数据验证 数据概述... -
-
媒体偏见识别基准数据集
媒体偏见识别基准数据集 数据来源:互联网公开数据 标签:媒体偏见,基准数据集,自然语言处理,机器学习,文本分析,信息检索,偏见检测,多任务学习 数据概述: 本数据集是全球首个用于媒体偏见识别的统一基准数据集集合(MBIB - Media Bias Identification... -
Hostelworld酒店与住宿评论数据集-全球住宿评论-用户-数据
Hostelworld酒店与住宿评论数据集-全球住宿评论-用户-数据 数据来源:互联网公开数据 标签:酒店评论,住宿,Hostelworld,用户评价,情感分析,自然语言处理,旅游,住宿体验,酒店,旅馆 数据概述:... -
Redditr-AskScience科学讨论社区帖子标签数据集-2016-2022
Redditr-AskScience科学讨论社区帖子标签数据集-2016-2022 数据来源:互联网公开数据 标签:Reddit, AskScience, 科学讨论, 帖子, 标签, 文本分析, 自然语言处理, 社区互动, 内容分类 数据概述:... -
语义相似性数据集
语义相似性数据集 数据来源:互联网公开数据 标签:语义相似性,自然语言处理,SNLI语料库,句子对分析,文本理解,机器学习 数据概述 本数据集基于SNLI(Stanford Natural Language... -
自然问答数据集
自然问答数据集 数据来源:互联网公开数据 标签:自然问答,问答系统,自然语言处理,机器学习,数据预处理,问答生成,信息检索 数据概述: 本数据集由Google AI... -
土耳其自然语言推理数据集
土耳其自然语言推理数据集 数据来源:互联网公开数据 标签:自然语言推理,土耳其语,NLI,机器学习,自然语言处理,文本分类,跨语言推理 数据概述: 本数据集包含两个子集(SNLI-TR和MNLI-... -
股票代码推文数据集2018-2023
股票代码推文数据集2018-2023 数据来源:互联网公开数据 标签:股票代码,社交媒体分析,文本挖掘,金融分析,自然语言处理,时间序列,情感分析 数据概述:... -
提示重写三元组数据集
提示重写三元组数据集 数据来源:互联网公开数据 标签:提示重写, LLM训练, 自然语言处理, 数据清洗, 字段映射, 机器学习, 人工智能 数据概述: 本数据集为用于大型语言模型(LLM)提示恢复竞赛的三元组数据集。原始数据集包含四个字段:prompt、original_text、input 和... -
KaggleLLM科学考试数据集验证集拆分数据集
KaggleLLM科学考试数据集验证集拆分数据集 数据来源:互联网公开数据 标签:LLM,科学考试,STEM,验证集,数据集拆分,机器学习,自然语言处理 数据概述: 本数据集是对Kaggle LLM科学考试数据集的拆分版本,原始数据集可在Kaggle竞赛页面(https://www.kaggle.com/competitions/kaggle-llm-... -
-
秘鲁美食评论数据集
秘鲁美食评论数据集 数据来源:互联网公开数据 标签:秘鲁美食,餐厅评论,情感分析,文本分类,用户评价,地理分布,餐厅运营,消费者行为,自然语言处理 数据概述:...