-
电影标题-评分-摘要与情节数据集-arnavsharmaas
电影标题-评分-摘要与情节数据集-arnavsharmaas 数据来源:互联网公开数据 标签:电影,评分,摘要,情节,文本分析,情感分析,电影评论,自然语言处理 数据概述: 该数据集包含电影的标题,评分,摘要和情节概要信息。主要特征如下: 时间跨度:数据记录的时间范围覆盖了不同年代的电影。...
-
拉脱维亚语问答数据集LatvianQuestion-AnswerDataset-valdispterisotais
拉脱维亚语问答数据集LatvianQuestion-AnswerDataset-valdispterisotais 数据来源:互联网公开数据 标签:自然语言处理,问答系统,数据集,拉脱维亚语,文本分析,机器学习,语言学,信息检索 数据概述: 该数据集包含了拉脱维亚语的问答对,旨在促进拉脱维亚语自然语言处理领域的研究和应用。主要特征如下: 时间跨度:...
-
GPT-2印尼语数据集GPT-2JavaneseDataset-lutfiandri
GPT-2印尼语数据集GPT-2JavaneseDataset-lutfiandri 数据来源:互联网公开数据 标签:自然语言处理,数据集,印尼语,GPT-2,文本生成,语言模型,机器翻译,文本分析 数据概述: 该数据集包含了印尼语文本数据,旨在用于训练和评估GPT-2模型,从而提升印尼语文本生成,翻译等相关任务的性能。主要特征如下:...
-
BERT-base未分大小写预训练模型第1轮数据集BERT-baseuncasedPretrainedEpoch1Dataset-blackitten13
BERT-base未分大小写预训练模型第1轮数据集BERT-baseuncasedPretrainedEpoch1Dataset-blackitten13 数据来源:互联网公开数据 标签:自然语言处理,预训练模型,BERT,机器学习,深度学习,文本分析,语言模型,人工智能 数据概述: 该数据集包含了BERT-...
-
ICD-10文本挖掘数据集ICD-10TextMiningDataset-racimrighi
ICD-10文本挖掘数据集ICD-10TextMiningDataset-racimrighi 数据来源:互联网公开数据 标签:医疗健康,ICD-10,文本挖掘,自然语言处理,疾病诊断,医疗数据分析,机器学习,临床研究 数据概述:...
-
CS5228课程辅助训练数据集-likeqi
CS5228课程辅助训练数据集-likeqi 数据来源:互联网公开数据 标签:机器学习,数据集,图像识别,计算机视觉,深度学习,学术资源,图像分类,数据集增强 数据概述: 该数据集是新加坡国立大学(NUS)CS5228 课程的辅助训练数据集,用于支持学生进行图像识别相关的机器学习项目。主要特征如下:...
-
DACON语言翻译输出数据集-geying
DACON语言翻译输出数据集-geying 数据来源:互联网公开数据 标签:机器翻译,自然语言处理,数据集,语言模型,深度学习,翻译质量评估,文本分析,人工智能 数据概述: 该数据集包含来自DACON竞赛的语言翻译输出数据,主要记录了机器翻译模型对输入文本的翻译结果。主要特征如下: 时间跨度:数据记录的时间范围为比赛期间。...
-
HuggingFace文档数据集HuggingFaceDocumentationDataset-sanjay74
HuggingFace文档数据集HuggingFaceDocumentationDataset-sanjay74 数据来源:互联网公开数据 标签:自然语言处理,数据集,文档分析,机器学习,文本处理,人工智能,语言模型,文本分类 数据概述:该数据集包含来自 Hugging Face...
-
虚拟文件数据集DummyFilesDataset-zubairahmadmir
虚拟文件数据集DummyFilesDataset-zubairahmadmir 数据来源:互联网公开数据 标签:虚拟数据,数据集,模拟文件,测试数据,数据验证,数据模拟,数据分析,数据管理 数据概述: 该数据集包含一系列虚拟文件数据,用于模拟真实场景中的数据文件,适用于测试,验证和分析等任务。主要特征如下:...
-
互联网电影数据库IMDb电影评论数据集-endofnight17j03
互联网电影数据库IMDb电影评论数据集-endofnight17j03 数据来源:互联网公开数据 标签:电影评论,情感分析,自然语言处理,文本挖掘,机器学习,数据集,影评,电影 数据概述:该数据集包含来自互联网电影数据库(IMDb)的电影评论数据,记录了用户对电影的评价和评论内容。主要特征如下:...
-
推特情感分析抓取推文数据集ScrapedTweetsforSentimentAnalysisDataset-sarthak7gupta
推特情感分析抓取推文数据集ScrapedTweetsforSentimentAnalysisDataset-sarthak7gupta 数据来源:互联网公开数据 标签:推特,社交媒体,情感分析,自然语言处理,数据集,文本分析,机器学习,舆情分析 数据概述: 该数据集包含了从推特(Twitter)上抓取的推文数据,用于情感分析研究。主要特征如下:...
-
简历数据分析数据集ResumeDataAnalysisDataset-someetsingh
简历数据分析数据集ResumeDataAnalysisDataset-someetsingh 数据来源:互联网公开数据 标签:简历,NLP,文本分析,数据集,自然语言处理,信息提取,机器学习,招聘 数据概述: 该数据集包含来自互联网的简历数据,记录了求职者的个人信息,教育背景,工作经历,技能等。主要特征如下:...
-
预处理输入数据数据集-isabbaggin
预处理输入数据数据集-isabbaggin 数据来源:互联网公开数据 标签:数据预处理,自然语言处理,数据集,文本分析,机器学习,数据清洗,文本挖掘,数据科学 数据概述:该数据集包含了用于数据预处理的各种输入数据样本,旨在帮助用户理解和实践数据清洗,转换和准备工作。主要特征如下: 时间跨度:数据记录的时间范围不固定,取决于输入数据的类型和来源。...
-
旅行商问题城市列表数据集TSPCityListDataset-vikawenzel
旅行商问题城市列表数据集TSPCityListDataset-vikawenzel 数据来源:互联网公开数据 标签:旅行商问题,TSP,数据集,城市列表,优化算法,运筹学,算法竞赛,地理信息 数据概述: 该数据集包含了用于解决旅行商问题(TSP)的城市坐标数据。主要特征如下: 时间跨度:数据记录的时间范围不定,主要用于静态的城市地理位置描述。...
-
集体意见垃圾邮件检测数据集-samygithub
集体意见垃圾邮件检测数据集-samygithub 数据来源:互联网公开数据 标签:垃圾邮件检测,集体意见,文本分析,自然语言处理,机器学习,情感分析,社交媒体,数据挖掘 数据概述: 该数据集包含来自互联网的集体意见数据,主要用于垃圾邮件检测任务。主要特征如下: 时间跨度: 数据记录的时间范围不明确,取决于数据来源。 地理范围:...
-
路透社CAC40指数三年新闻文章数据集ReutersCAC403-YearArticlesDataset-wissemch
路透社CAC40指数三年新闻文章数据集ReutersCAC403-YearArticlesDataset-wissemch 数据来源:互联网公开数据 标签:新闻文章,CAC40指数,金融市场,文本分析,自然语言处理,时间序列,情感分析,市场研究 数据概述:...
-
广岛和长崎和平宣言演讲数据集HiroshimaandNagasakiPeaceDeclarationSpeechDataset-kenyaguchi
广岛和长崎和平宣言演讲数据集HiroshimaandNagasakiPeaceDeclarationSpeechDataset-kenyaguchi 数据来源:互联网公开数据 标签:历史文献,和平宣言,核武器,数据集,演讲分析,国际关系,社会研究,公共演讲...
-
高棉语文本图像标签数据集KhmerTextImageLabelDataset-raychannudam
高棉语文本图像标签数据集KhmerTextImageLabelDataset-raychannudam 数据来源:互联网公开数据 标签:文本识别,图像处理,数据集,自然语言处理,机器学习,计算机视觉,语言技术,多模态学习 数据概述: 该数据集包含高棉语文本与图像的标签数据,记录了高棉语文本在图像中的位置和内容。主要特征如下:...
-
西安交通大学SY数据集XJTU-SYDataset-zhenxinchen
西安交通大学SY数据集XJTU-SYDataset-zhenxinchen 数据来源:互联网公开数据 标签:轴承故障,数据集,机械故障诊断,振动信号,机器学习,工业大数据,信号处理,故障诊断 数据概述:...
-
脱口秀表演脚本数据集Stand-upComedyScriptsDataset-aryagm1
脱口秀表演脚本数据集Stand-upComedyScriptsDataset-aryagm1 数据来源:互联网公开数据 标签:脱口秀,喜剧,文本分析,自然语言处理,数据集,语言学,娱乐,表演艺术 数据概述: 该数据集包含了大量的脱口秀表演脚本,记录了不同喜剧演员的表演内容。主要特征如下: 时间跨度:数据记录的时间范围不定,涵盖了不同年代的脱口秀表演。...



