-
中文新闻文本分类数据集_Chinese_News_Text_Classification
中文新闻文本分类数据集_Chinese_News_Text_Classification 数据来源:互联网公开数据 标签:文本分类, 新闻语料, 自然语言处理, 机器学习, 体育, 财经, 科技, 语料库 数据概述: 该数据集包含来自中文新闻的数据,记录了不同类别的新闻文本内容,主要用于文本分类任务。主要特征如下:... -
社交媒体仇恨言论检测推文数据集_Social_Media_Hate_Speech_Detection_Tweets
社交媒体仇恨言论检测推文数据集_Social_Media_Hate_Speech_Detection_Tweets 数据来源:互联网公开数据 标签:仇恨言论, 社交媒体, 文本分类, 自然语言处理, 机器学习, 情感分析, 文本标注, 推文分析 数据概述: 该数据集包含来自Twitter平台的推文数据,旨在用于仇恨言论的检测与分析。主要特征如下:... -
医学影像问答数据集_Medical_Image_Question_Answering_Dataset
医学影像问答数据集_Medical_Image_Question_Answering_Dataset 数据来源:互联网公开数据 标签:医学影像, 问答, 图像识别, 自然语言处理, 深度学习, 医疗诊断, 数据集, 图像标注 数据概述: 该数据集包含来自CLEF (Cross Language Evaluation Forum) 2020 VQA-... -
社交媒体评论情感评分预测数据集_Social_Media_Comment_Sentiment_Score_Prediction
社交媒体评论情感评分预测数据集_Social_Media_Comment_Sentiment_Score_Prediction 数据来源:互联网公开数据 标签:情感分析, 社交媒体, 评论数据, 评分预测, 机器学习, 自然语言处理, 数据建模, 文本分析 数据概述:... -
机器翻译模型生成文本对比数据集_Machine_Translation_Model_Generated_Text_Comparison
机器翻译模型生成文本对比数据集_Machine_Translation_Model_Generated_Text_Comparison 数据来源:互联网公开数据 标签:机器翻译, 文本生成, 语言模型, 文本对比, 模型评估, 自然语言处理, 文本校对, 对比分析 数据概述:... -
新闻文本情感分析数据集_News_Text_Sentiment_Analysis
新闻文本情感分析数据集_News_Text_Sentiment_Analysis 数据来源:互联网公开数据 标签:情感分析, 文本分类, 新闻文本, 自然语言处理, 情感极性, 数据标注, 机器学习, 语料库 数据概述: 该数据集包含来自新闻媒体的文本数据,记录了新闻文章的文本内容以及对应的情感极性标签。主要特征如下:... -
越南语情感分析文本数据集_Vietnamese_Sentiment_Analysis_Text_Dataset
越南语情感分析文本数据集_Vietnamese_Sentiment_Analysis_Text_Dataset 数据来源:互联网公开数据 标签:情感分析, 文本分类, 越南语, 自然语言处理, 机器学习, 情感极性, 语料库, 深度学习 数据概述: 该数据集包含来自越南社交媒体平台的用户评论文本,用于进行情感分析。主要特征如下:... -
越南语语音转录数据集_Vietnamese_Speech_Transcription_Dataset
越南语语音转录数据集_Vietnamese_Speech_Transcription_Dataset 数据来源:互联网公开数据 标签:语音识别, 语音转录, 越南语, 语音数据集, 文本标注, 自然语言处理, 声学模型, 深度学习 数据概述:... -
希腊议会会议记录文本分析数据集_Greek_Parliament_Proceedings_Text_Analysis_Dataset
希腊议会会议记录文本分析数据集_Greek_Parliament_Proceedings_Text_Analysis_Dataset 数据来源:互联网公开数据 标签:议会记录, 文本分析, 希腊, 政治, 文本挖掘, 自然语言处理, 情感分析, 政策研究 数据概述:... -
文本评论性别薪酬差异分析数据集_Text_Comments_Gender_Pay_Gap_Analysis
文本评论性别薪酬差异分析数据集_Text_Comments_Gender_Pay_Gap_Analysis 数据来源:互联网公开数据 标签:性别歧视, 薪酬差距, 文本分析, 评论数据, 自然语言处理, 情感分析, 数据挖掘, 机器学习 数据概述:... -
企业邮件垃圾分类样本数据集
数据来源: 该数据集由美国能源公司 Enron 的内部通信记录构成,原始数据整理自 Enron Email Dataset,后经分类标注为“垃圾邮件”与“正常邮件”(Spam/Ham)两类,用于自然语言处理任务中的文本分类研究。 字段定义: Message ID:邮件编号,唯一标识每封邮件 Subject:邮件主题 Message:邮件正文内容... -
arXiv论文多标记语言数据集-2023年1月至2023年10月
arXiv论文多标记语言数据集-2023年1月至2023年10月 数据来源:互联网公开数据 标签:arXiv,论文,多标记语言,科学研究,机器学习,自然语言处理,文本处理,学术资源 数据概述:... -
COVID-19新闻数据集
COVID-19新闻数据集 数据来源:互联网公开数据 标签:新闻数据,COVID-19,文本分类,自然语言处理,机器学习,疫情分析,信息抽取 数据概述:... -
斯里兰卡手语字母数据集
斯里兰卡手语字母数据集 数据来源:互联网公开数据 标签:手语识别,斯里兰卡手语,计算机视觉,图像分类,视频分析,手势识别,自然语言处理 数据概述: 本数据集包含斯里兰卡手语字母的图像和视频,涵盖了斯里兰卡手语字母表的全部符号。数据集由9位参与者提供,每位参与者单独存放在一个文件夹中。每个文件夹包含以下内容: -... -
亚马逊商品长度预测机器学习竞赛数据集-2023
亚马逊商品长度预测机器学习竞赛数据集-2023 数据来源:互联网公开数据 标签:机器学习,商品长度,预测,产品尺寸,亚马逊,电商,产品目录,自然语言处理 数据概述:... -
击键日志写作过程数据集
击键日志写作过程数据集 数据来源:互联网公开数据 标签:击键日志,写作过程,教育研究,人工智能,自然语言处理,写作质量,学习分析 数据概述: 本数据集记录了学习者在写作过程中产生的击键日志数据,包含关键的写作过程特征,如停顿、删除、文字爆发、过程变化等。数据集由Vanderbilt University、The Learning Agency... -
俄罗斯StackExchange数据集
俄罗斯StackExchange数据集 数据来源:互联网公开数据 标签:用户贡献的帖子,问答社区,自然语言处理,信息检索,文本分析,数据挖掘,网络数据 数据概述: 本数据集是匿名化的俄罗斯Stack Exchange用户贡献帖子集合,包含了该平台所有用户生成的内容,涵盖问答、讨论、问题解答等多方面信息。 数据用途概述:... -
-
基于希伯来语字幕预测IMDb评分的电视剧集数据集-lielbinyamin1997
基于希伯来语字幕预测IMDb评分的电视剧集数据集-lielbinyamin1997 数据来源:互联网公开数据 标签:IMDb, 希伯来语字幕, 电视剧集, 评分预测, 自然语言处理, 机器学习, 情感分析, 推荐系统 数据概述:... -
语音识别技术在呼叫中心的应用评估数据集-ASRCalls2Val-saspav
语音识别技术在呼叫中心的应用评估数据集-ASRCalls2Val-saspav 数据来源:互联网公开数据 标签:语音识别,呼叫中心,语音数据,ASR,性能评估,自然语言处理,声学模型,语言模型 数据概述: 本数据集“ASR Calls 2 Val”包含了从呼叫中心收集的语音数据,主要用于评估语音识别(ASR, Automatic Speech...