-
英语-法语翻译数据集
英语-法语翻译数据集 数据来源:互联网公开数据 标签:机器翻译,自然语言处理,英语,法语,文本数据,语言对,翻译模型 数据概述: 本数据集包含138,000对英语-法语翻译的句子对。每对数据由一个英语句子及其对应的法语翻译构成。数据集提供了丰富的翻译实例,涵盖了多种主题和语言风格。 数据用途概述:... -
推特用户MBTI人格类型数据集
推特用户MBTI人格类型数据集 数据来源:互联网公开数据 标签:推特用户,MBTI人格类型,文本分析,自然语言处理,机器学习,社交网络分析,行为特征,语言特征,网络特征 数据概述: 本数据集包含了8,328名推特用户的详细信息,这些用户在其个人资料中公开了他们的MBTI人格类型。数据集记录了每名用户的身份特征、行为特征、语言特征和网络特征。 -... -
-
印尼新闻网站DetikNews每日头条数据集-2015年1月至2020年10月
印尼新闻网站DetikNews每日头条数据集-2015年1月至2020年10月 数据来源:互联网公开数据 标签:印尼新闻,头条,DetikNews,新闻分析,自然语言处理,媒体研究,时间序列,印尼语 数据概述:... -
-
矛盾侦探瓦森翻译数据集
矛盾侦探瓦森翻译数据集 数据来源:互联网公开数据 标签:自然语言处理,数据增强,翻译,机器学习,文本分析,竞赛数据 数据概述: 本数据集为“Contradictory, My Dear... -
-
英语时态分类数据集
英语时态分类数据集 数据来源:互联网公开数据 标签:英语时态,自然语言处理,机器学习,句子分类,语法分析 数据概述: 本数据集包含标注了相应时态类别的英文句子,适用于自然语言处理(NLP)和机器学习项目中的时态分类任务。每个条目包括一个句子及其对应的时态数值标签,覆盖了多种时态类型,为研究和开发提供了丰富的数据资源。 数据用途概述:... -
LLM科学考试数据集-多样化数据源整合-竞赛专用
LLM科学考试数据集-多样化数据源整合-竞赛专用 数据来源:互联网公开数据 标签:LLM, 科学考试, 数据集, 机器学习, 自然语言处理, 文本生成, 考试, 训练数据, MMLU, ChatGPT, Wikipedia 数据概述: 本数据集是为 LLM (大型语言模型, Large Language Model) 科学考试竞赛准备的, 包含了 6... -
WordNet反义词数据集-2006
WordNet反义词数据集-2006 数据来源:互联网公开数据 标签:反义词,WordNet,语言学,数据,词典,文本分析,自然语言处理 数据概述: 本数据集包含了从WordNet数据库版本3.0中提取的反义词数据。每个反义词组由至少一个反义词构成,不同反义词组之间用 "|" 分隔,同一组内的反义词用 ";"... -
谷歌应用商店评论情感分析数据集-情感分类-多类别-二分类
谷歌应用商店评论情感分析数据集-情感分类-多类别-二分类 数据来源:互联网公开数据 标签:情感分析,文本挖掘,自然语言处理,机器学习,评论数据,谷歌应用商店,二分类,多分类 数据概述: 本数据集包含两个文件:gpreviews_2.csv 和... -
Gustavosta自然语言处理研究提示数据集-2023
Gustavosta自然语言处理研究提示数据集-2023 数据来源:互联网公开数据 标签:NLP,提示,自然语言处理,研究资源,Huggingface,机器学习,数据集 数据概述: 本数据集由Huggingface Hub提供,包含从Stable... -
-
问题-答案-代码解决方案-带编号数据集适用于AIMO
问题-答案-代码解决方案-带编号数据集适用于AIMO 数据来源:互联网公开数据 标签:问题答案,代码解决方案,AIMO,数学问题,教育数据,编程教育,自然语言处理 数据概述:... -
西班牙语-英语翻译语料库数据集
西班牙语-英语翻译语料库数据集 数据来源:互联网公开数据 标签:西班牙语,英语,翻译,机器翻译,语言模型,自然语言处理,跨语言文本 数据概述:... -
-
孟加拉语-英语-印地语混合语言侮辱性语言识别数据集
孟加拉语-英语-印地语混合语言侮辱性语言识别数据集 数据来源:互联网公开数据 标签:侮辱性语言,代码混合,孟加拉语,英语,印地语,自然语言处理,文本分类,情感分析 数据概述:... -
印度情绪分析社交媒体数据集2023
印度情绪分析社交媒体数据集2023 数据来源:互联网公开数据 标签:情绪分析,社交媒体,推特,英语,情感分类,数据标注,自然语言处理 数据概述: 本数据集包含通过Twitter... -
巴西葡萄牙语冒犯性语言识别数据集
巴西葡萄牙语冒犯性语言识别数据集 数据来源:互联网公开数据 标签:冒犯性语言,巴西葡萄牙语,多任务注释,社交媒体,自然语言处理,文本分析,内容安全 数据概述:... -