-
布尔问答数据集BoolQDataset-parthplc
布尔问答数据集BoolQDataset-parthplc 数据来源:互联网公开数据 标签:布尔问答,自然语言处理,数据集,机器学习,文本分类,逻辑推理,人工智能,计算机科学 数据概述: 该数据集由斯坦福大学提供,主要记录了布尔问答的文本数据,适用于自然语言处理和逻辑推理研究。主要特征如下: 时间跨度:数据记录的时间范围从2019年到2020年。... -
TED演讲内容数据集TEDTalksMainCSVDataset-nafisaalianika
TED演讲内容数据集TEDTalksMainCSVDataset-nafisaalianika 数据来源:互联网公开数据 标签:TED演讲,数据集,文本分析,语言学习,机器学习,自然语言处理,教育,心理学 数据概述: 该数据集包含来自TED官网的主要演讲内容数据,记录了 TED 演讲的详细信息和文本内容。主要特征如下:... -
新闻文本分类数据集-oussemahedri
新闻文本分类数据集-oussemahedri 数据来源:互联网公开数据 标签:新闻,文本分类,自然语言处理,机器学习,文本分析,数据集,新闻报道,中文 数据概述:该数据集包含来自互联网新闻网站的新闻文本数据,记录了不同类别新闻的详细信息。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2023年。... -
语音识别与自适应技术数据集AISHELLAdaptationDataset-hohohacn
语音识别与自适应技术数据集AISHELLAdaptationDataset-hohohacn 数据来源:互联网公开数据 标签:语音识别,自适应技术,数据集,自然语言处理,人工智能,机器学习,语音信号处理,教育技术 数据概述: 该数据集由AISHELL项目提供,专注于语音识别和自适应技术的应用。主要特征如下:... -
语音识别-中文语音情感识别数据集Voice-CS-ChineseSpeechEmotionRecognitionDataset-saivamsiganta
语音识别-中文语音情感识别数据集Voice-CS-ChineseSpeechEmotionRecognitionDataset-saivamsiganta 数据来源:互联网公开数据 标签:语音识别,情感识别,数据集,中文,深度学习,自然语言处理,音频分析,机器学习 数据概述:... -
气胸MIMIC报告数据集PneumothoraxMIMICReportsDataset-wasifnafee
气胸MIMIC报告数据集PneumothoraxMIMICReportsDataset-wasifnafee 数据来源:互联网公开数据 标签:医疗影像,气胸,MIMIC数据库,数据集,医学报告,深度学习,自然语言处理,临床研究 数据概述:... -
粤语YouTube评论数据集YouTubeCommentsinCantoneseDataset-bitit1994
粤语YouTube评论数据集YouTubeCommentsinCantoneseDataset-bitit1994 数据来源:互联网公开数据 标签:社交媒体,评论分析,自然语言处理,数据集,粤语,情感分析,机器学习,文本挖掘 数据概述: 该数据集包含来自YouTube平台的粤语评论数据,记录了用户对视频内容的评论信息。主要特征如下:... -
楚瓦什语维基百科平行语料库数据集Chuvash-WikiParallelCorpusDataset-kvzhirnov
楚瓦什语维基百科平行语料库数据集Chuvash-WikiParallelCorpusDataset-kvzhirnov 数据来源:互联网公开数据 标签:语言资源,平行语料库,自然语言处理,机器翻译,楚瓦什语,维基百科,多语言数据,文本分析 数据概述:... -
语言模型与人工智能生成数据集LLMAI-GeneratedDataset-jeremiahobeng
语言模型与人工智能生成数据集LLMAI-GeneratedDataset-jeremiahobeng 数据来源:互联网公开数据 标签:人工智能,语言模型,数据生成,自然语言处理,机器学习,数据集,文本分析,智能生成 数据概述: 该数据集包含由语言模型和人工智能技术生成的文本数据,记录了通过先进AI模型生成的各种类型文本内容。主要特征如下:... -
IMDb电影评论预处理数据集IMDbMovieReviewsPreprocessedDataset-ayanwap7
IMDb电影评论预处理数据集IMDbMovieReviewsPreprocessedDataset-ayanwap7 数据来源:互联网公开数据 标签:电影评论,数据集,自然语言处理,文本分析,机器学习,情感分析,文本分类,人工智能 数据概述:该数据集包含来自IMDb网站的电影评论数据,已经进行了预处理,适用于情感分析,文本分类等任务。主要特征如下:... -
股票指数预测BERT模型新闻数据集DSEXNewsDatasetforForecastingDSEusingBERT-nilabrahman
股票指数预测BERT模型新闻数据集DSEXNewsDatasetforForecastingDSEusingBERT-nilabrahman 数据来源:互联网公开数据 标签:股票市场,指数预测,数据集,自然语言处理,BERT模型,金融分析,机器学习,新闻分析 数据概述:... -
BBC新闻多语言数据集BBCNews8LanguagesDataset-irenemarban
BBC新闻多语言数据集BBCNews8LanguagesDataset-irenemarban 数据来源:互联网公开数据 标签:新闻,多语言,数据集,文本分析,自然语言处理,机器学习,翻译,信息提取 数据概述: 该数据集包含来自BBC新闻网站的多语言新闻文本数据,记录了不同语言版本的新闻文章内容。主要特征如下:... -
BBC新闻训练集BBCNewsTrainingSet-subhashisb
BBC新闻训练集BBCNewsTrainingSet-subhashisb 数据来源:互联网公开数据 标签:新闻数据,数据集,文本分类,自然语言处理,机器学习,深度学习,文本分析,学术资源 数据概述:该数据集包含来自BBC新闻的训练数据,记录了不同类别的新闻文章。主要特征如下: 时间跨度:数据记录的时间范围从2004年到2005年。... -
电影剧情标签数据集TaggedPlotMovieLensDataset-jquinteiro
电影剧情标签数据集TaggedPlotMovieLensDataset-jquinteiro 数据来源:互联网公开数据 标签:电影,剧情分析,数据集,标签分类,机器学习,自然语言处理,电影推荐,文本挖掘 数据概述: 该数据集包含来自MovieLens平台的电影剧情数据,记录了电影的剧情描述及其对应的标签。主要特征如下:... -
保险理赔分解格式化数据集ClaimDecompFormattedDataset-swethabalram2410
保险理赔分解格式化数据集ClaimDecompFormattedDataset-swethabalram2410 数据来源:互联网公开数据 标签:保险业,理赔分析,数据集,金融科技,机器学习,数据分析,风险管理,自然语言处理 数据概述: 该数据集包含来自保险行业的理赔数据,记录了理赔申请的详细信息及其分解后的格式化内容。主要特征如下: 时间跨度:... -
雅虎新闻文章情感分析数据集YahooNewsArticleSentimentAnalysisDataset-rupeshsahoo123
雅虎新闻文章情感分析数据集YahooNewsArticleSentimentAnalysisDataset-rupeshsahoo123 数据来源:互联网公开数据 标签:新闻,情感分析,数据集,自然语言处理,机器学习,文本挖掘,情感分类,舆情分析 数据概述: 该数据集包含来自雅虎新闻的文章和对应的情感标签,用于情感分析任务。主要特征如下:... -
标注数据集AnnotatedDataDataset-krishaborana
标注数据集AnnotatedDataDataset-krishaborana 数据来源:互联网公开数据 标签:数据标注,数据集,机器学习,人工智能,数据科学,自然语言处理,图像识别,数据增强 数据概述: 该数据集包含经过人工或自动方式标注的数据,记录了各类数据样本及其对应的标签或注释信息。主要特征如下:... -
文章元数据数据集ArticleMeta-dataDataset-gautamsandeep
文章元数据数据集ArticleMeta-dataDataset-gautamsandeep 数据来源:互联网公开数据 标签:元数据,数据集,信息检索,文本分析,自然语言处理,学术研究,知识发现,数据挖掘 数据概述:该数据集包含来自学术文章的元数据,记录了文章的各种信息,如标题,摘要,作者,关键词,出版日期,期刊信息等。主要特征如下:... -
文本转国际音标训练集TexttoIPAMappingTrainset-jakir57
文本转国际音标训练集TexttoIPAMappingTrainset-jakir57 数据来源:互联网公开数据 标签:文本转音标,数据集,语音识别,自然语言处理,机器学习,语言学,音标转换,人工智能 数据概述:... -
法官判决命中数据集JudgeHitData-jidbro1
法官判决命中数据集JudgeHitData-jidbro1 数据来源:互联网公开数据 标签:司法,判决,数据集,机器学习,法律,文本分析,自然语言处理,刑事案件 数据概述: 该数据集包含法官判决相关数据,旨在用于研究判决结果预测,法律文本分析等任务。主要特征如下: 时间跨度: 数据记录的时间范围从[起始年份]到[结束年份],例如2010年至2020年。...