-
音乐资源数据集艺术家歌曲与文本信息汇总
标题:音乐资源数据集艺术家、歌曲与文本信息汇总 数据内容: 该数据集包含音乐相关信息,具体包括以下字段: 1. 艺术家(artist):记录了643种不同的艺术家信息,涵盖了不同风格和流派的音乐人。 2. 歌曲(song):记录了44,824种不同的歌曲信息,展示了丰富的音乐作品。 3.... -
-
命名实体识别语料库NamedEntityRecognitionCorpus-endofnight17j03
命名实体识别语料库NamedEntityRecognitionCorpus-endofnight17j03 数据来源:互联网公开数据 标签:命名实体识别,自然语言处理,数据集,文本分析,机器学习,信息提取,人工智能,语料库 数据概述:... -
人群偏见检测与消除数据集CrowsPairsDNRTrain-TestDataset-danushkhanna
人群偏见检测与消除数据集CrowsPairsDNRTrain-TestDataset-danushkhanna 数据来源:互联网公开数据 标签:社会偏见,数据集,文本分析,自然语言处理,机器学习,社会研究,伦理研究,偏见检测 数据概述: 该数据集来自Crows... -
-
新闻深度处理数据集NewsDeepProcessedDataset-mario123475
新闻深度处理数据集NewsDeepProcessedDataset-mario123475 数据来源:互联网公开数据 标签:新闻处理,深度学习,自然语言处理,文本分析,机器学习,数据集,信息提取,学术资源 数据概述: 该数据集包含来自互联网公开资源的新闻文章,经过深度处理,适用于自然语言处理任务,如文本分类,情感分析等。主要特征如下:... -
网络语言脏话数据集SwearTotalData-parkgarden
网络语言脏话数据集SwearTotalData-parkgarden 数据来源:互联网公开数据 标签:网络语言,脏话,文本分析,自然语言处理,数据集,社交媒体,文本挖掘,语言研究 数据概述:该数据集包含来自网络平台和社交媒体的脏话数据,记录了不同用户在各种网络场景下的脏话使用情况。主要特征如下: 时间跨度:数据记录的时间范围从2018年到2022年。... -
情感分析社交媒体数据集SentimentOutData20220929-darioceni
情感分析社交媒体数据集SentimentOutData20220929-darioceni 数据来源:互联网公开数据 标签:情感分析,社交媒体,数据集,文本分析,自然语言处理,机器学习,社会研究,市场分析 数据概述:... -
俄罗斯新闻文章分类数据集ArticlesClassificationinRussianDataset-anastasiyanoskina
俄罗斯新闻文章分类数据集ArticlesClassificationinRussianDataset-anastasiyanoskina 数据来源:互联网公开数据 标签:新闻分类,数据集,文本分析,机器学习,自然语言处理,信息检索,语言技术,俄语处理 数据概述:... -
仇恨言论训练数据集HateTrain1Dataset-miguelbanda
仇恨言论训练数据集HateTrain1Dataset-miguelbanda 数据来源:互联网公开数据 标签:仇恨言论,数据集,文本分析,自然语言处理,机器学习,社交媒体,社会研究,伦理研究 数据概述:该数据集来自互联网公开的社交媒体平台,记录了用户的评论和帖子内容,主要用于识别和分析仇恨言论。主要特征如下:... -
推特关键词提取数据集TweetRAKEKeywordExtractionDataset-akashsuper2000
推特关键词提取数据集TweetRAKEKeywordExtractionDataset-akashsuper2000 数据来源:互联网公开数据 标签:文本分析,关键词提取,数据集,自然语言处理,情感分析,机器学习,社交媒体,数据挖掘 数据概述: 该数据集包含来自推特平台的文本数据,记录了推文内容的特征及其关键词提取结果。主要特征如下:... -
自然语言处理与机器学习工具包Transformers4-6-0数据集-khyeh0719
自然语言处理与机器学习工具包Transformers4-6-0数据集-khyeh0719 数据来源:互联网公开数据 标签:自然语言处理,机器学习,数据集,深度学习,文本分析,算法工具,人工智能,计算机科学 数据概述: 该数据集包含来自Transformers 4.6.0版本的数据,记录了自然语言处理和机器学习领域的工具包及模型信息。主要特征如下:... -
英语聊天机器人对话数据集EnglishChatbotDialogueDataset-nezahatkk
英语聊天机器人对话数据集EnglishChatbotDialogueDataset-nezahatkk 数据来源:互联网公开数据 标签:聊天机器人,对话数据,自然语言处理,数据集,文本分析,机器学习,语言模型,人工智能 数据概述: 该数据集包含了英语聊天机器人生成的对话数据,记录了用户与聊天机器人之间的交互内容。主要特征如下:... -
自然语言处理多分类任务BERT多语言数据集NLP多分类任务BERT多语言数据集-aeryss
自然语言处理多分类任务BERT多语言数据集NLP多分类任务BERT多语言数据集-aeryss 数据来源:互联网公开数据 标签:自然语言处理,多分类,BERT,数据集,多语言,文本分析,机器学习,深度学习 数据概述:该数据集包含来自多个语言来源的文本数据,适用于自然语言处理中的多分类任务。主要特征如下:... -
个人身份信息检测训练数据集PIIDetectionTrainDataset-kuohsintu
个人身份信息检测训练数据集PIIDetectionTrainDataset-kuohsintu 数据来源:互联网公开数据 标签:个人身份信息,数据集,隐私保护,自然语言处理,文本分析,机器学习,信息安全,数据保护 数据概述:该数据集包含用于训练个人身份信息(PII)检测模型的数据,记录了多种类型的文本数据及其标注的个人身份信息。主要特征如下:... -
阿拉伯语新闻数据集ArabicNewsDatasetfromSabqWebsite-abdulrahmanals
阿拉伯语新闻数据集ArabicNewsDatasetfromSabqWebsite-abdulrahmanals 数据来源:互联网公开数据 标签:阿拉伯语,新闻数据,数据集,自然语言处理,文本分析,机器学习,新闻分类,语言资源 数据概述: 该数据集包含来自沙特阿拉伯Sabq新闻网站的文章数据,记录了网站发布的阿拉伯语新闻报道。主要特征如下:... -
Agoda酒店评论数据集-atulmittal199174
Agoda酒店评论数据集-atulmittal199174 数据来源:互联网公开数据 标签:酒店,评论,数据集,文本分析,情感分析,旅游,自然语言处理,机器学习 数据概述: 该数据集包含来自Agoda网站的酒店评论数据,记录了用户对酒店的评价和相关信息。主要特征如下: 时间跨度:数据记录的时间范围未知,具体时间跨度依赖于原始数据。... -
阿拉伯民间故事数据集RaidArabicStoriesDataset-raidouahioune
阿拉伯民间故事数据集RaidArabicStoriesDataset-raidouahioune 数据来源:互联网公开数据 标签:阿拉伯文化,民间故事,文本分析,自然语言处理,情感分析,语言学,文化研究,叙事学 数据概述:该数据集包含来自Raid项目收集的阿拉伯民间故事,记录了阿拉伯地区的各种民间故事和传说。主要特征如下:... -
IBM辩论证据句子数据集IBMDebaterEvidenceSentencesDataset-kaggleqrdl
IBM辩论证据句子数据集IBMDebaterEvidenceSentencesDataset-kaggleqrdl 数据来源:互联网公开数据 标签:自然语言处理,辩论,数据集,文本分析,语义理解,证据检索,信息抽取,人工智能 数据概述: 该数据集由IBM Debater项目提供,包含从大规模文本语料库中提取的辩论相关的证据句子。主要特征如下:... -
印度新闻摘要数据集InshortsHindiDataTest-shivamsourav2002
印度新闻摘要数据集InshortsHindiDataTest-shivamsourav2002 数据来源:互联网公开数据 标签:新闻摘要,自然语言处理,文本分析,印度新闻,数据集,机器翻译,文本分类,信息检索 数据概述: 该数据集包含来自Inshorts平台的印度新闻摘要数据,用于文本摘要,自然语言处理等任务。主要特征如下:...