-
乌尔都语语言文本数据集Urdu-LanguageDataset-tabarkarajab
乌尔都语语言文本数据集Urdu-LanguageDataset-tabarkarajab 数据来源:互联网公开数据 标签:语言处理,文本分析,自然语言处理,乌尔都语,机器学习,数据集,文本分类,多语言 数据概述: 该数据集包含来自互联网公开资源的乌尔都语文本数据,记录了乌尔都语的自然语言文本内容。主要特征如下:... -
自然语言处理入门数据集IntroductiontoNLPDataset-iheb404notfound
自然语言处理入门数据集IntroductiontoNLPDataset-iheb404notfound 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本分析,机器学习,人工智能,语言模型,文本分类,情感分析 数据概述: 该数据集用于自然语言处理的入门学习和研究,记录了多种文本数据及相应的标注信息。主要特征如下:... -
数据2015至2023年卫报新闻链接数据集TheGuardianNewsLinksfrom2015to2023Dataset-kiet21042003
2015至2023年卫报新闻链接数据集TheGuardianNewsLinksfrom2015to2023Dataset-kiet21042003 数据来源:互联网公开数据 标签:新闻媒体,数据集,时间序列,文本分析,机器学习,新闻研究,数据挖掘,信息检索 数据概述:... -
越南维基百科抄袭检测数据集VietnameseWikipediaPlagiarismDetectionDataset-dungg1810
越南维基百科抄袭检测数据集VietnameseWikipediaPlagiarismDetectionDataset-dungg1810 数据来源:互联网公开数据 标签:数据集,抄袭检测,文本分析,自然语言处理,机器学习,学术诚信,信息检索,越南语 数据概述: 该数据集包含来自越南维基百科的文本数据,记录了用于抄袭检测的文本样本。主要特征如下:... -
ChatGPT用户评论数据集ChatGPTUserReviewDataset-aswanikrishnav
ChatGPT用户评论数据集ChatGPTUserReviewDataset-aswanikrishnav 数据来源:互联网公开数据 标签:自然语言处理,用户评论,数据集,文本分析,情感分析,机器学习,人工智能,产品反馈 数据概述: 该数据集包含来自ChatGPT用户的评论数据,记录了用户对ChatGPT产品的使用体验和反馈。主要特征如下:... -
药品标签信息数据集DrugLabelInformationDataset-aminemharzi
药品标签信息数据集DrugLabelInformationDataset-aminemharzi 数据来源:互联网公开数据 标签:医药健康,药品标签,数据集,文本分析,自然语言处理,医疗信息,数据挖掘,机器学习 数据概述: 该数据集包含来自药品标签的信息,记录了各类药品的标签数据。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2020年。... -
简历命名实体识别数据集ResumeNERDataset-raj26000
简历命名实体识别数据集ResumeNERDataset-raj26000 数据来源:互联网公开数据 标签:简历处理,命名实体识别,数据集,自然语言处理,文本分析,机器学习,人力资源,人才招聘 数据概述:该数据集包含来自多个来源的简历数据,主要用于命名实体识别任务,记录了简历中的关键信息。主要特征如下:... -
Sibert情感分析数据集-thnhanvng
Sibert情感分析数据集-thnhanvng 数据来源:互联网公开数据 标签:情感分析,数据集,文本分析,自然语言处理,NLP,情感分类,情绪识别,机器学习,社交媒体 数据概述: 该数据集包含了Sibert提供的用于情感分析的文本数据,记录了各种文本片段的情感倾向。主要特征如下: 时间跨度:数据记录的时间跨度不明确,主要关注文本内容的情感表达。... -
网络欺凌数据集Tanglish网络欺凌数据集唐语版本-mrchamp
网络欺凌数据集Tanglish网络欺凌数据集唐语版本-mrchamp 数据来源:互联网公开数据 标签:网络欺凌,数据集,社交媒体,文本分析,自然语言处理,机器学习,社会学,心理学 数据概述:该数据集由Tanglish项目提供,主要记录了社交媒体平台上的文本数据,用于研究和识别网络欺凌行为。主要特征如下:... -
自然语言处理新闻标题数据集ANLPHeadlinesDataset-divyessh01
自然语言处理新闻标题数据集ANLPHeadlinesDataset-divyessh01 数据来源:互联网公开数据 标签:自然语言处理,新闻标题,文本分析,机器学习,情感分析,文本摘要,数据集,语言模型 数据概述: 该数据集包含来自多个新闻来源的新闻标题数据,主要用于自然语言处理(NLP)相关的研究和应用。主要特征如下:... -
YouTube印度最佳旅游目的地评论数据集-anjalichawda
YouTube印度最佳旅游目的地评论数据集-anjalichawda 数据来源:互联网公开数据 标签:YouTube,评论数据,旅游,印度,文本分析,情感分析,自然语言处理,社交媒体 数据概述: 该数据集包含来自YouTube平台上关于印度最佳旅游目的地的评论数据,记录了用户对不同旅游目的地的评论内容。主要特征如下:... -
前1000条法律判决书转录文本数据集LJDataFirst1000Transcriptions-manishprajapati24
前1000条法律判决书转录文本数据集LJDataFirst1000Transcriptions-manishprajapati24 数据来源:互联网公开数据 标签:法律,判决书,转录文本,自然语言处理,文本分析,数据集,机器学习,司法 数据概述: 该数据集包含前1000条法律判决书的转录文本数据,主要记录了司法判决的详细内容。主要特征如下:... -
童话故事文本分析数据集Fairy-taleDataset-hrishabhtiwari
童话故事文本分析数据集Fairy-taleDataset-hrishabhtiwari 数据来源:互联网公开数据 标签:童话故事,文本分析,数据集,自然语言处理,文学研究,机器学习,故事分析,叙事学 数据概述: 该数据集包含来自多个来源的童话故事文本数据,记录了各类经典童话故事的完整内容和相关元数据。主要特征如下:... -
阿拉伯语讽刺文本数据集-farisalahmdi
阿拉伯语讽刺文本数据集-farisalahmdi 数据来源:互联网公开数据 标签:阿拉伯语,讽刺,文本分析,自然语言处理,情感分析,语言学,机器学习,社交媒体 数据概述:该数据集包含了阿拉伯语的讽刺文本数据,主要来源于社交媒体平台,新闻网站等。主要特征如下: 时间跨度:数据记录的时间范围跨度不固定,取决于数据来源。... -
Reddit社区图书讨论数据集Book-from-RedditDataset-vaishnavibv
Reddit社区图书讨论数据集Book-from-RedditDataset-vaishnavibv 数据来源:互联网公开数据 标签:图书,社区讨论,数据集,社交网络,文本分析,用户行为,自然语言处理,情感分析 数据概述: 该数据集包含来自Reddit平台的图书相关讨论数据,记录了用户在图书主题社区中的互动内容。主要特征如下:... -
多类别心理健康检测数据集-sidramalikawan
多类别心理健康检测数据集-sidramalikawan 数据来源:互联网公开数据 标签:心理健康,情感识别,文本分析,自然语言处理,机器学习,情感分类,健康管理,精神疾病 数据概述: 该数据集包含用于多类别心理健康检测的文本数据,记录了不同个体在社交媒体上的帖子,文章等文本信息,旨在识别和分类用户的心理健康状态。主要特征如下:... -
网页内容与词法特征提取数据集2022年-vanshhagrawal
网页内容与词法特征提取数据集2022年-vanshhagrawal 数据来源:互联网公开数据 标签:网页内容,词法特征,数据集,自然语言处理,文本分析,机器学习,信息提取,文本挖掘 数据概述: 该数据集包含了从互联网上提取的网页内容及其词法特征,适用于自然语言处理,文本分析和机器学习等领域的研究。主要特征如下: 时间跨度:... -
谷歌图书搜索结果数据集GoogleBooksDataResponseDataset-navyachallagulla
谷歌图书搜索结果数据集GoogleBooksDataResponseDataset-navyachallagulla 数据来源:互联网公开数据 标签:图书,搜索,数据集,自然语言处理,文本分析,信息检索,机器学习,学术研究 数据概述: 该数据集包含来自谷歌图书搜索的响应数据,记录了用户在谷歌图书上进行搜索后得到的图书信息。主要特征如下:... -
Letterboxd电影标题和评论数据集-ecelker
Letterboxd电影标题和评论数据集-ecelker 数据来源:互联网公开数据 标签:电影,评论,数据集,文本分析,情感分析,自然语言处理,电影推荐,用户行为 数据概述: 该数据集包含来自Letterboxd网站的电影标题和用户评论数据,记录了用户对电影的评价和观影体验。主要特征如下:... -
谷歌搜索信息数据集GoogleSearchInformationDataset-mugentk
谷歌搜索信息数据集GoogleSearchInformationDataset-mugentk 数据来源:互联网公开数据 标签:搜索引擎,搜索行为,数据集,自然语言处理,用户行为分析,数据挖掘,信息检索,文本分析 数据概述: 该数据集包含来自谷歌搜索的公开信息,记录了用户的搜索查询,搜索结果,以及相关的用户交互行为。主要特征如下:...