-
TIMIT语音识别和发音学研究语料库数据集
TIMIT语音识别和发音学研究语料库数据集 数据来源:互联网公开数据 标签:语料库,语音识别,发音标注,语音处理,自然语言处理,美国英语,发音学研究 数据概述:... -
越南语图表问答数据集-ChartQA与Viet-ShareGPT-4o-Text-VQA-nhanvi
越南语图表问答数据集-ChartQA与Viet-ShareGPT-4o-Text-VQA-nhanvi 数据来源:互联网公开数据 标签:图表问答,越南语,图像理解,自然语言处理,机器翻译,数据集,多模态,人工智能,ChartQA,Viet-ShareGPT-4o-Text-VQA 数据概述:... -
Sciphi中小学至研究生教材样本数据集-thedevastator
Sciphi中小学至研究生教材样本数据集-thedevastator 数据来源:互联网公开数据 标签:教材样本,教育研究,机器学习,数据集,开放源代码,文本分类,自然语言处理 数据概述:... -
马来语大规模文本数据集
马来语大规模文本数据集 数据来源:互联网公开数据 标签:马来语,自然语言处理,语言模型训练,文本数据,机器学习,深度学习,文本清洗 数据概述: 本数据集包含超过600万行独特的马来语文本,数据来源于多个公开数据集并经过清洗处理,确保数据的高质量和可用性。该数据集为研究人员和开发者提供了一个丰富且多样化的文本资源,适用于多种自然语言处理任务。... -
文本情感分析训练与测试数据集
文本情感分析训练与测试数据集 数据来源:互联网公开数据 标签:情感分析,文本数据,机器学习,自然语言处理,情感分类,训练集,测试集 数据概述: 本数据集包含了经过清洗和预处理的文本数据,用于构建情感分析模型。数据集被划分为训练集和测试集,分别包含特征和标签。用户可以直接使用这些数据进行情感分析模型的训练和评估,无需进行额外的数据清洗和预处理工作。... -
社交媒体仇恨言论检测多模态数据集-图文内容-测试与验证
社交媒体仇恨言论检测多模态数据集-图文内容-测试与验证 数据来源:互联网公开数据 标签:仇恨言论,社交媒体,图像识别,文本分析,多模态学习,深度学习,图像分类,文本分类,自然语言处理,机器学习,人工智能,内容审核 数据概述:... -
Kaggle论坛话题标题语义向量数据集
Kaggle论坛话题标题语义向量数据集 数据来源:互联网公开数据 标签:Kaggle,论坛,话题,标题,语义,向量,自然语言处理,文本分析,机器学习 数据概述: 本数据集包含了从Kaggle平台上抓取的论坛话题标题,并使用all-... -
Jigsaw竞赛英语翻译文本数据集
Jigsaw竞赛英语翻译文本数据集 数据来源:互联网公开数据 标签:Jigsaw, 翻译, 文本, 英语, 自然语言处理, 文本分析, 机器学习, 竞赛, 负面评论, 错误标识 数据概述:... -
乌尔都语音频片段及其转录数据集
乌尔都语音频片段及其转录数据集 数据来源:互联网公开数据 标签:乌尔都语,音频,语音识别,自然语言处理,语音转文本,语音分析 数据概述: 本数据集包含乌尔都语的音频片段及其对应的转录文本。音频片段平均时长为10秒,数据集记录了部分片段的转录内容,其中部分片段的转录结果为“无法理解音频”,可能表明音频文件存在问题或仅包含音乐。 数据用途概述:... -
纽约时报烹饪食谱评论互动数据集-2021年5月至6月-michaelruddy
纽约时报烹饪食谱评论互动数据集-2021年5月至6月-michaelruddy 数据来源:互联网公开数据 标签:食谱评论,纽约时报,烹饪,用户互动,评论分析,NLP,自然语言处理,食谱,社交媒体,情感分析 数据概述: 本数据集收录了2021年5月至6月期间,纽约时报烹饪(NYT... -
-
-
SFU观点与评论语料库
SFU观点与评论语料库 数据来源:互联网公开数据 标签:观点分析,在线评论,建设性评论,毒性评论,自然语言处理,意见挖掘,语料库,社交媒体分析 数据概述:... -
arXiv学术论文多标签分类数据集-计算机科学-人工智能等领域-v2-kelixirr
arXiv学术论文多标签分类数据集-计算机科学-人工智能等领域-v2-kelixirr 数据来源:互联网公开数据 标签:学术论文,arXiv,多标签分类,文本分类,机器学习,计算机科学,人工智能,自然语言处理,数据集 数据概述:... -
-
YouTube游戏和应用中虚拟形象视频转录文本数据集
YouTube游戏和应用中虚拟形象视频转录文本数据集 数据来源:互联网公开数据 标签:YouTube,视频转录,虚拟形象,游戏,应用,自然语言处理,文本分析,情感分析 数据概述: 本数据集包含从YouTube视频中提取的音频转录文本。视频地址通过youtube-data-... -
算术与计数技能数据集
算术与计数技能数据集 数据来源:互联网公开数据 标签:算术,计数,文本实体,训练样本,数据集构建,自然语言处理,基础技能训练,问题生成,模型优化 数据概述:... -
-
文本生成数据集-学生在家学习与四天工作制文本分析TextGenerationDataset-StudentHomeLearningandFour-DayW...
文本生成数据集-学生在家学习与四天工作制文本分析TextGenerationDataset-StudentHomeLearningandFour-DayWorkWeekTextAnalysis-ethanzhang9371 数据来源:互联网公开数据 标签:文本生成, 自然语言处理, 学生学习, 四天工作制, 情感分析, 观点提取, 数据标注, 机器学习... -