-
命名实体识别模型训练评估数据集NamedEntityRecognitionModelTrainingandEvaluationDataset-antonmaster007
命名实体识别模型训练评估数据集NamedEntityRecognitionModelTrainingandEvaluationDataset-antonmaster007 数据来源:互联网公开数据 标签:命名实体识别, 自然语言处理, 模型训练, 评估, 深度学习, 文本分析, 机器学习, 训练日志 数据概述:... -
恩桑尼摘要数据集EnsaniAbstractsDataset-amirpourmand
恩桑尼摘要数据集EnsaniAbstractsDataset-amirpourmand 数据来源:互联网公开数据 标签:摘要,数据集,学术研究,文本分析,自然语言处理,机器学习,信息检索,科学文献 数据概述:该数据集包含来自恩桑尼(ENSANI)项目的学术摘要数据,记录了多个学科领域的研究论文摘要。主要特征如下:... -
金融指令数据集SujetoFinanceInstructDataset-tnglmng
金融指令数据集SujetoFinanceInstructDataset-tnglmng 数据来源:互联网公开数据 标签:金融,自然语言处理,指令数据,机器学习,数据集,文本分析,深度学习,语言模型 数据概述: 该数据集包含来自金融领域的指令数据,记录了金融场景中的各种指令和任务描述。主要特征如下:... -
俄语音素标注数据集RussianPhonemeDataset-nikipshg
俄语音素标注数据集RussianPhonemeDataset-nikipshg 数据来源:互联网公开数据 标签:语音识别,音素标注,数据集,自然语言处理,机器学习,语音学,俄语,人工智能 数据概述: 该数据集包含俄语语音的音素标注数据,记录了俄语语音的音素分割和标注信息。主要特征如下: 时间跨度:数据记录的时间范围不明确,主要为静态数据集。... -
科勒里奇倡议科研论文文本与标签数据集ColeridgeInitiativeUnitedTextsandLabelsDataset-anaidashaginian
科勒里奇倡议科研论文文本与标签数据集ColeridgeInitiativeUnitedTextsandLabelsDataset-anaidashaginian 数据来源:互联网公开数据 标签:科研论文,文本数据,自然语言处理,数据标注,学术研究,机器学习,文本分析,信息提取... -
纽约时报新闻文章数据集NewYorkTimesNewsArticles-enkrish259
纽约时报新闻文章数据集NewYorkTimesNewsArticles-enkrish259 数据来源:互联网公开数据 标签:新闻文章, 文本分析, 自然语言处理, 政治新闻, 舆情分析, 媒体报道, 数据挖掘, 历史事件 数据概述:... -
多语言歌词数据集-音乐风格分类MultilingualLyricsforGenreClassificationDataset-anhclu
多语言歌词数据集-音乐风格分类MultilingualLyricsforGenreClassificationDataset-anhclu 数据来源:互联网公开数据 标签:音乐风格,歌词分析,数据集,机器学习,文本分类,多语言,自然语言处理,数据挖掘 数据概述: 该数据集包含来自多种语言的歌曲歌词,主要用于音乐风格分类任务。主要特征如下:... -
新闻头条全球热点事件数据集GlobalHeadlineHotEventDataset-praveencule
新闻头条全球热点事件数据集GlobalHeadlineHotEventDataset-praveencule 数据来源:互联网公开数据 标签:新闻头条, 文本分析, 事件检测, 情感分析, 自然语言处理, 舆情分析, 全球事件, 数据挖掘 数据概述: 该数据集包含来自全球新闻媒体的新闻头条数据,记录了世界范围内发生的各类热点事件。主要特征如下:... -
情感识别数据集EmotionsRecognitionDataset-muhammadmoinfaisal
情感识别数据集EmotionsRecognitionDataset-muhammadmoinfaisal 数据来源:互联网公开数据 标签:情感识别,数据集,机器学习,自然语言处理,心理学,情绪分析,文本分析,情感计算 数据概述: 该数据集包含来自多个来源的情感识别数据,记录了不同文本样本的情感标注信息。主要特征如下:... -
Python编程问题与答案测试数据集PythonQATestingDataset-brucepayton
Python编程问题与答案测试数据集PythonQATestingDataset-brucepayton 数据来源:互联网公开数据 标签:编程,Python,数据集,QA测试,机器学习,自然语言处理,教育技术,软件测试 数据概述: 该数据集包含来自Python编程领域的问答测试数据,记录了常见的编程问题及其解答。主要特征如下:... -
应用商店应用信息数据集ApplicationsData-CSV-taekeunkim
应用商店应用信息数据集ApplicationsData-CSV-taekeunkim 数据来源:互联网公开数据 标签:应用商店,应用分析,移动应用,市场研究,数据挖掘,自然语言处理,用户行为,APP 数据概述: 该数据集包含来自应用商店的应用信息,记录了各种移动应用程序的详细信息。主要特征如下: 时间跨度:... -
俄罗斯新闻文本情感分析数据集LentaTrainingDataDataset-andreykondakov
俄罗斯新闻文本情感分析数据集LentaTrainingDataDataset-andreykondakov 数据来源:互联网公开数据 标签:文本分析,情感分析,数据集,自然语言处理,机器学习,新闻,俄语,NLP 数据概述: 该数据集包含来自俄罗斯新闻网站Lenta.ru的文本数据,用于情感分析任务。主要特征如下:... -
新冠疫情推特数据2020年3月29日至30日数据集-a1079602570
新冠疫情推特数据2020年3月29日至30日数据集-a1079602570 数据来源:互联网公开数据 标签:新冠疫情,推特数据,社交媒体,文本分析,自然语言处理,疫情传播,舆情分析,数据挖掘 数据概述: 该数据集包含来自推特(Twitter)的公开数据,记录了2020年3月29日至30日期间与新冠疫情相关的推文信息。主要特征如下:... -
通用语料库数据集CorpusDataset-cthitrn
通用语料库数据集CorpusDataset-cthitrn 数据来源:互联网公开数据 标签:语料库,自然语言处理,数据集,文本分析,机器学习,数据挖掘,语言模型,文本分类 数据概述: 该数据集包含来自多种来源的文本数据,记录了不同领域的语言表达。主要特征如下: 时间跨度:数据记录的时间范围从20世纪到现代。... -
用户产品评论情感分析数据集UserProductReviewSentimentAnalysisDataset-hoangducchung
用户产品评论情感分析数据集UserProductReviewSentimentAnalysisDataset-hoangducchung 数据来源:互联网公开数据 标签:情感分析, 产品评论, 文本分类, 情感极性, 机器学习, 自然语言处理, 用户反馈, 数据集 数据概述:... -
演示文稿内容识别数据集PresentifyDataset-yugratnahumagain
演示文稿内容识别数据集PresentifyDataset-yugratnahumagain 数据来源:互联网公开数据 标签:演示文稿,内容识别,数据集,计算机视觉,图像处理,自然语言处理,人工智能,教育技术 数据概述: 该数据集包含来自多个领域的演示文稿(如PPT、Keynote等)数据,记录了演示文稿的文本内容、图像元素和结构信息。主要特征如下:... -
孟加拉虚假新闻数据集-sajidatajreenkabir
孟加拉虚假新闻数据集-sajidatajreenkabir 数据来源:互联网公开数据 标签:虚假新闻,孟加拉语,自然语言处理,文本分析,数据集,机器学习,新闻分类,情感分析 数据概述: 该数据集包含来自孟加拉语新闻文章的虚假新闻数据,旨在用于虚假新闻检测和分析。主要特征如下: 时间跨度:数据记录的时间范围未明确,但涵盖了孟加拉地区近期的新闻内容。... -
改良版虚假新闻评论识别数据集ModifiedFNC-1FakeNewsCommentIdentificationDataset-yovita
改良版虚假新闻评论识别数据集ModifiedFNC-1FakeNewsCommentIdentificationDataset-yovita 数据来源:互联网公开数据 标签:虚假新闻,新闻评论,数据集,自然语言处理,机器学习,文本分类,信息传播,新闻媒体 数据概述: 该数据集为改良版虚假新闻评论识别数据集(Modified... -
深度学习特征提取数据集-huzaifahaider
深度学习特征提取数据集-huzaifahaider 数据来源:互联网公开数据 标签:深度学习,特征提取,图像识别,自然语言处理,数据集,机器学习,计算机视觉,文本分析 数据概述: 该数据集包含了用于深度学习特征提取的多种类型数据,涵盖图像和文本两大类。主要特征如下: 时间跨度:数据记录的时间范围取决于具体子数据集,通常为近几年。... -
Kaggle毒性评论分类数据集ToxicCommentClassificationChallenge训练集ToxicCommentClassificati...
Kaggle毒性评论分类数据集ToxicCommentClassificationChallenge训练集ToxicCommentClassificationChallengeTrainDataset-shahules 数据来源:互联网公开数据 标签:文本分类,自然语言处理,机器学习,毒性检测,评论分析,社交媒体,深度学习,NLP 数据概述:...