-
印度斯坦时报新闻文章数据集HindustanTimesNewsArticlesDataset-abdunnoor11
印度斯坦时报新闻文章数据集HindustanTimesNewsArticlesDataset-abdunnoor11 数据来源:互联网公开数据 标签:新闻,印度,文本分析,自然语言处理,文本挖掘,新闻文章,数据集,时事 数据概述: 该数据集包含来自印度斯坦时报(Hindustan... -
文本分类2022数据集DF-Classify2022-huynhtruc109
文本分类2022数据集DF-Classify2022-huynhtruc109 数据来源:互联网公开数据 标签:文本分类,数据集,机器学习,自然语言处理,深度学习,文本分析,人工智能,数据科学 数据概述: 该数据集包含来自2022年的文本分类数据,记录了不同类别文本的详细信息。主要特征如下: 时间跨度:数据记录的时间范围为2022年。... -
有毒聊天记录数据集ToxicChatParquetDataset-alimistro123
有毒聊天记录数据集ToxicChatParquetDataset-alimistro123 数据来源:互联网公开数据 标签:聊天记录,数据集,文本分析,自然语言处理,机器学习,社交媒体,数据清理,情感分析 数据概述:该数据集包含多个来源的有毒聊天记录,记录了互联网上不同平台上的聊天内容。主要特征如下:... -
仇恨言论检测数据集CleanedHateSpeechDataset-mustafahabeeb90
仇恨言论检测数据集CleanedHateSpeechDataset-mustafahabeeb90 数据来源:互联网公开数据 标签:仇恨言论,数据集,自然语言处理,文本分析,机器学习,社会研究,情感分析,网络安全 数据概述: 该数据集包含经过清洗的仇恨言论数据,记录了社交媒体或其他公开平台上的文本内容及其标签。主要特征如下:... -
自然语言处理文本数据集NaturalLanguageProcessNLPDataset-bulentsiyah
自然语言处理文本数据集NaturalLanguageProcessNLPDataset-bulentsiyah 数据来源:互联网公开数据 标签:自然语言处理,文本数据,数据集,机器学习,语义分析,文本挖掘,语言学,人工智能 数据概述:该数据集包含来自多个来源的文本数据,涵盖了各种类型的文本,适用于自然语言处理和机器学习等任务。主要特征如下:... -
文本摘要生成训练数据集Summaries-TrainTextSummarizationDataset-samruddhimore
文本摘要生成训练数据集Summaries-TrainTextSummarizationDataset-samruddhimore 数据来源:互联网公开数据 标签:自然语言处理,文本摘要,数据集,机器学习,文本生成,深度学习,信息提取,人工智能 数据概述: 该数据集包含了用于训练文本摘要生成模型的文本数据,主要记录了原始文本及其对应的摘要。主要特征如下:... -
词性标注英文语料库数据集TaggedWordsDataset-ramakrushnamohapatra
词性标注英文语料库数据集TaggedWordsDataset-ramakrushnamohapatra 数据来源:互联网公开数据 标签:词性标注,数据集,自然语言处理,机器学习,语言学,文本分析,学术研究,信息检索 数据概述:该数据集包含来自Penn Treebank的词性标注数据,记录了英文文本中每个单词的词性和上下文信息。主要特征如下:... -
土耳其语翻译版H4NO机器人数据集TurkishTranslationofH4NORobotsDataset-unofficialmerve
土耳其语翻译版H4NO机器人数据集TurkishTranslationofH4NORobotsDataset-unofficialmerve 数据来源:互联网公开数据 标签:机器人数据,土耳其语,翻译数据,数据集,自然语言处理,机器翻译,人工智能,多语言研究 数据概述:... -
Slack求助消息数据集Slack求助消息数据集-teddyerror
Slack求助消息数据集Slack求助消息数据集-teddyerror 数据来源:互联网公开数据 标签:Slack, 求助消息, 数据集, 通信分析, 自然语言处理, 客服支持, 用户行为, 文本分析 数据概述: 该数据集包含来自Slack平台的求助消息记录,适用于通信分析,客服支持以及自然语言处理等领域。主要特征如下: 时间跨度:... -
评估数据集-聊天机器人表现评估数据集ChatbotPerformanceEvaluationDataset-kit2k3
评估数据集-聊天机器人表现评估数据集ChatbotPerformanceEvaluationDataset-kit2k3 数据来源:互联网公开数据 标签:聊天机器人,数据集,自然语言处理,性能评估,用户体验,对话系统,机器学习,人工智能... -
虚假新闻分类数据集基于StopFake来源FakeNewsClassificationDatasetUsingStopFakeSource-lethaldiran
虚假新闻分类数据集基于StopFake来源FakeNewsClassificationDatasetUsingStopFakeSource-lethaldiran 数据来源:互联网公开数据 标签:虚假新闻,新闻分类,数据集,自然语言处理,机器学习,文本分析,信息传播,媒体研究 数据概述:... -
豪萨语语料库数据集HausaCorporaDataset-isadutse
豪萨语语料库数据集HausaCorporaDataset-isadutse 数据来源:互联网公开数据 标签:豪萨语,语料库,语言学,自然语言处理,机器翻译,数据集,学术研究,文化研究 数据概述:该数据集包含来自多种来源的豪萨语语料,记录了豪萨语的文本数据,适用于语言学研究,自然语言处理和机器翻译等任务。主要特征如下:... -
金融市场新闻情感分析数据集FinancialMarketNewsSentimentAnalysisDataset-sushantbmujagule
金融市场新闻情感分析数据集FinancialMarketNewsSentimentAnalysisDataset-sushantbmujagule 数据来源:互联网公开数据 标签:金融市场,新闻分析,情感分析,数据集,自然语言处理,机器学习,经济学,数据挖掘 数据概述:... -
旅行博客内容分析数据集TravelBloggingContentAnalysisDataset-sushanthegde
旅行博客内容分析数据集TravelBloggingContentAnalysisDataset-sushanthegde 数据来源:互联网公开数据 标签:旅行,博客,内容分析,自然语言处理,情感分析,文本挖掘,社交媒体,旅游业 数据概述: 该数据集包含来自多个旅行博客平台的数据,记录了旅行博客文章的内容和相关信息。主要特征如下:... -
文本摘要生成数据集Summary-Seq2SeqDataset-ajax0564
文本摘要生成数据集Summary-Seq2SeqDataset-ajax0564 数据来源:互联网公开数据 标签:自然语言处理,文本摘要,数据集,序列到序列模型,机器学习,文本生成,深度学习,信息提取 数据概述: 该数据集专注于文本摘要生成任务,记录了大量的文本及其对应的摘要。主要特征如下: 时间跨度:数据记录的时间范围从过去几年到近期。... -
波斯语与英语翻译测试数据集-nouriehmadanian
波斯语与英语翻译测试数据集-nouriehmadanian 数据来源:互联网公开数据 标签:机器翻译,波斯语,英语,数据集,自然语言处理,语言模型,翻译质量评估,文本分析 数据概述: 该数据集包含波斯语到英语的翻译对,用于评估和训练机器翻译模型。主要特征如下: 时间跨度:数据记录的时间范围不限,涵盖了不同时间段的文本。... -
歌曲歌词数据集SongLyricsData-hiesenberg
歌曲歌词数据集SongLyricsData-hiesenberg 数据来源:互联网公开数据 标签:歌词,音乐,数据集,自然语言处理,文本分析,情感分析,机器学习,音乐文化 数据概述: 该数据集包含了大量的歌曲歌词数据,涵盖了不同国家,不同语言,不同风格的歌曲。主要特征如下: 时间跨度:数据记录的时间范围跨度较大,从早期音乐到现代流行音乐均有收录。... -
美国人工智能劳工市场分析数据集AIBLaborMarketAnalysisDataset-dmitrykonovalov
美国人工智能劳工市场分析数据集AIBLaborMarketAnalysisDataset-dmitrykonovalov 数据来源:互联网公开数据 标签:人工智能,劳工市场,数据集,就业分析,技能需求,自然语言处理,机器学习,就业趋势 数据概述:... -
金融市场问答数据集FinanceMoreDataQADataset-chandan2706
金融市场问答数据集FinanceMoreDataQADataset-chandan2706 数据来源:互联网公开数据 标签:金融市场,问答数据,数据集,自然语言处理,问答系统,金融分析,投资策略,商业智能 数据概述: 该数据集包含来自金融市场领域的问答数据,记录了投资者,分析师及专业人士在金融论坛和问答平台上的互动和提问。主要特征如下:... -
Spotify歌曲歌词数据集SpotifySongsLyricsDataset-joannecrean
Spotify歌曲歌词数据集SpotifySongsLyricsDataset-joannecrean 数据来源:互联网公开数据 标签:音乐,歌词,数据集,自然语言处理,情感分析,音乐推荐,机器学习,文本挖掘 数据概述: 该数据集包含来自Spotify平台的歌曲歌词数据,记录了多首歌曲的歌词及其相关信息。主要特征如下:...