数据集 - 海数据

波斯语拼写纠错数据集-FASpell数据集

2025年4月15日

波斯语拼写纠错数据集-FASpell数据集数据来源：互联网公开数据标签：波斯语,Farsi,拼写纠错,自然语言处理,NLP,语言学,文本校对,教育,机器学习数据概述：...
- ZIP
薄伽梵歌数据集

2025年4月15日

薄伽梵歌数据集数据来源：互联网公开数据标签：薄伽梵歌,梵文,印度史诗,吠陀文献,哲学,神学,自然语言处理,数据科学数据概述：...
- ZIP
Steam游戏平台用户评论文本情感分析数据集-2020年

2025年4月15日

Steam游戏平台用户评论文本情感分析数据集-2020年数据来源：互联网公开数据标签：Steam,游戏评论,文本情感分析,自然语言处理,NLP,用户评价,数据清洗,机器学习数据概述：本数据集包含了Steam游戏平台的用户评论数据，旨在用于文本情感分析任务。数据集中包含用户针对游戏发表的各种评论，这些评论构成了数据集的核心内容。数据用途概述：...
- ZIP
伊斯兰教圣训文本分析与研究数据集

2025年4月15日

伊斯兰教圣训文本分析与研究数据集数据来源：互联网公开数据标签：圣训, Sunnah, 伊斯兰教, NLP, 自然语言处理, 文本分析, 机器学习, 阿拉伯语, 印尼语, 宗教研究, 文本翻译数据概述：本数据集旨在促进使用自然语言处理 (NLP)...
- ZIP
计算语言学与自然语言处理会议论文数据集2016-2021

2025年4月14日

计算语言学与自然语言处理会议论文数据集2016-2021 数据来源：互联网公开数据标签：计算语言学,自然语言处理,会议论文,学术研究,ACL,EMNLP,时间序列,论文分析数据概述：...
- ZIP
皮埃罗格数据集-英语短文本主题相关性评估数据集

2025年4月14日

皮埃罗格数据集-英语短文本主题相关性评估数据集数据来源：互联网公开数据标签：文本,主题,相关性,评测,机器学习,教育,英语,自然语言处理,ChatGPT,GPT-4 数据概述：皮埃罗格数据集是一个小型、开放许可的、机器生成的数据集，包含十五篇短篇英语文本，涵盖五个主题，并附带相关性判断（qrels），专为教育目的设计。...
- ZIP
五大人气卡通角色谷歌搜索结果数据集-2023

2025年4月14日

五大人气卡通角色谷歌搜索结果数据集-2023 数据来源：互联网公开数据标签：谷歌搜索,卡通,数据分析,人气趋势,文本分析,自然语言处理,在线内容,娱乐研究数据概述：本数据集提供了5个广受欢迎的卡通角色——秦时宝（Shin-chan）、多啦A梦（Doraemon）、Ben 10、讨厌的亨利（Horrid Henry）和憨豆先生（Mr....
- ZIP
Twitter金融话题文本数据印度Nifty502017-2022

2025年4月14日

Twitter金融话题文本数据印度Nifty502017-2022 数据来源：互联网公开数据数据来源：本数据集收集自社交媒体平台，包含带有话题标签 nifty50 的推文，时间范围从 2017年9月至 2022年9月，适用于金融情绪分析、股市舆情研究和自然语言处理模型训练。数据内容：该数据集记录了五年内包含 nifty50...
- ZIP
孟加拉语拼写检查数据集

2025年4月14日

孟加拉语拼写检查数据集数据来源：互联网公开数据标签：孟加拉语,拼写检查,词表,语言处理,数据词典,研究工具,自然语言处理数据概述：...
- ZIP
HuggingFace平台模型元数据与下载量分析数据集-2021年6月

2025年4月14日

HuggingFace平台模型元数据与下载量分析数据集-2021年6月数据来源：互联网公开数据标签：Hugging Face, 模型, 机器学习, 自然语言处理, 计算机视觉, 模型库, 元数据, 下载量, 文本分析数据概述：本数据集包含了Hugging Face模型中心（Model...
- ZIP
英语学习者语言熟练度评估多标签分类竞赛数据集

2025年4月14日

英语学习者语言熟练度评估多标签分类竞赛数据集数据来源：互联网公开数据标签：多标签分类,英语学习者,语言熟练度评估,教育技术,自然语言处理,机器学习,学业分析数据概述：...
- ZIP
Databricks人工智能对话交互数据集-Dolly项目-开放域对话-15000-样本

2025年4月14日

Databricks人工智能对话交互数据集-Dolly项目-开放域对话-15000-样本数据来源：互联网公开数据标签：自然语言处理,对话系统,机器学习,人工智能,文本数据,对话生成,交互,Prompt,响应,Dolly,Databricks,Hugging Face 数据概述：...
- ZIP
斯坦福问答数据集SQuAD泰米尔语翻译数据集-CHAIi竞赛

2025年4月14日

斯坦福问答数据集SQuAD泰米尔语翻译数据集-CHAIi竞赛数据来源：互联网公开数据标签：问答,泰米尔语,翻译,自然语言处理,机器阅读理解,CHAIi,文本数据,数据集数据概述：本数据集是通过将斯坦福问答数据集（SQuAD，Stanford Question Answering...
- ZIP
代码生成模型DeclamaC代码还原性能评估数据集

2025年4月14日

代码生成模型DeclamaC代码还原性能评估数据集数据来源：互联网公开数据标签：代码生成, C代码, 反编译, 机器学习, 模型评估, 深度学习, CodeLlama, 自然语言处理数据概述：本数据集用于评估Declama模型在C代码还原任务中的性能。Declama模型是基于CodeLlama-7b-hf模型进行微调，专门用于解决从Hex-...
- ZIP
数据80行手写乌尔都语OCR数据集

2025年4月14日

数据80行手写乌尔都语OCR数据集数据来源：互联网公开数据标签：手写识别,乌尔都语,OCR,光学字符识别,自然语言处理,文档数字化,历史文献数据概述：...
- ZIP
德国仇恨言论语料库

2025年4月14日

德国仇恨言论语料库数据来源：互联网公开数据标签：仇恨言论,德语,社交网络,文本标注,自然语言处理,内容识别,社会媒体分析数据概述：...
- ZIP
随机日期数据集

2025年4月14日

随机日期数据集数据来源：互联网公开数据标签：日期识别,机器学习,自然语言处理,数据标注,文本分析,日期标注,日期提取数据概述：本数据集包含由Python脚本生成的随机日期数据，旨在用于机器学习模型训练，以识别文档中的日期。数据集标注了每个词或词组是否为日期，为日期标注任务提供了基础。数据用途概述：...
- ZIP
亚马逊评论情感分析数据集

2025年4月14日

亚马逊评论情感分析数据集数据来源：互联网公开数据标签：亚马逊,评论分析,情感分析,自然语言处理,电商评测,消费者行为,产品评价数据概述：...
- ZIP
情感分析文本情感分类数据集

2025年4月14日

情感分析文本情感分类数据集数据来源：互联网公开数据标签：情感分析,文本分类,自然语言处理,机器学习,情感识别,文本数据数据概述：本数据集是一个用于情感分析的文本情感分类数据集。数据集包含文本内容及其对应的情感标签，用于训练和评估情感分析模型。...
- ZIP
金融欺诈与非欺诈相关的新闻分类数据集

2025年4月14日

金融欺诈与非欺诈相关的新闻分类数据集数据来源：互联网公开数据标签：金融欺诈,非欺诈,新闻分类,自然语言处理,金融科技,数据标注数据概述本数据集旨在帮助用户对新闻文章进行分类，区分金融欺诈相关和非欺诈相关的内容。由于现有公开数据集中缺乏满足该需求的资源，本数据集由研究团队从头构建，旨在为类似研究提供支持。数据集包含以下两个CSV文件： 1....
- ZIP

«
1
...
563
564
565
566
567
...
588
»