-
数据2023电影评论数据集2023MoviesReviewsDataset-muhammadzeshanhaider
2023电影评论数据集2023MoviesReviewsDataset-muhammadzeshanhaider 数据来源:互联网公开数据 标签:电影评论,数据集,文本分析,自然语言处理,电影研究,情感分析,社交媒体,用户评价 数据概述:该数据集包含来自互联网公开渠道的2023年电影评论数据,记录了多部电影的观众评论及评分。主要特征如下:... -
毒性评论属性分析数据集ToxicityCommentAttributeAnalysisDataset-shuestis
毒性评论属性分析数据集ToxicityCommentAttributeAnalysisDataset-shuestis 数据来源:互联网公开数据 标签:毒性评论,数据集,自然语言处理,机器学习,文本分析,社会研究,伦理学,人工智能 数据概述:该数据集包含了来自Jigsaw平台的评论数据,记录了评论的毒性及其相关属性。主要特征如下:... -
英语古兰经EnglishQuranDataset-esraaaabdelrazek
英语古兰经EnglishQuranDataset-esraaaabdelrazek 数据来源:互联网公开数据 标签:古兰经,数据集,宗教,伊斯兰教,翻译,文本分析,语言学,学术研究 数据概述: 该数据集包含英语翻译的《古兰经》,记录了古兰经的文本内容及其相关注释。主要特征如下: 时间跨度:数据记录的时间范围从现代翻译版本开始。... -
Reddit社区仇恨言论检测数据集-devanshivipul
Reddit社区仇恨言论检测数据集-devanshivipul 数据来源:互联网公开数据 标签:社交媒体,仇恨言论,文本分析,自然语言处理,机器学习,情感分析,言论审查,数据集 数据概述: 该数据集包含来自Reddit社区的评论数据,用于仇恨言论的检测和分析。主要特征如下: 时间跨度:数据记录的时间跨度不详,但覆盖了Reddit社区的长期活跃时期。... -
自然语言处理与信息检索INLP作业3数据集INLPAssignment3Dataset-shubhamkathiriya
自然语言处理与信息检索INLP作业3数据集INLPAssignment3Dataset-shubhamkathiriya 数据来源:互联网公开数据 标签:自然语言处理,信息检索,数据集,文本分类,机器学习,深度学习,文本分析,数据挖掘 数据概述:... -
Airbnb房源词频统计数据集KBSAirbnbWordcountDataset-kimbaekseyeong
Airbnb房源词频统计数据集KBSAirbnbWordcountDataset-kimbaekseyeong 数据来源:互联网公开数据 标签:Airbnb, 数据集, 词频统计, 自然语言处理, 旅游, 房源描述, 机器学习, 文本分析 数据概述:该数据集包含来自Airbnb的房源描述文本数据,记录了房源描述的词频统计信息。主要特征如下:... -
英文文本序列长度验证数据集SequenceLength128-bamps53
英文文本序列长度验证数据集SequenceLength128-bamps53 数据来源:互联网公开数据 标签:自然语言处理,文本处理,序列建模,数据集,机器学习,文本验证,文本分析,深度学习 数据概述: 该数据集包含经过处理的英文文本数据,主要用于验证和测试自然语言处理模型,特别是针对序列长度为128的文本序列。主要特征如下:... -
维基百科文章上下文语境数据集WikipediaArticleContextDataset-yalickj
维基百科文章上下文语境数据集WikipediaArticleContextDataset-yalickj 数据来源:互联网公开数据 标签:自然语言处理,文本分析,维基百科,数据集,语境理解,机器学习,文本挖掘,知识图谱 数据概述:该数据集包含来自维基百科的文章数据,旨在研究文章的上下文语境信息。主要特征如下:... -
元数据古腾堡数据集MetadataGutenbergDataset-mosesmoncy
元数据古腾堡数据集MetadataGutenbergDataset-mosesmoncy 数据来源:互联网公开数据 标签:文学,数据集,元数据,图书信息,数字图书馆,文本分析,学术研究,机器学习 数据概述: 该数据集包含来自古腾堡计划(Gutenberg Project)的图书元数据,记录了该计划收录的各类图书的详细信息。主要特征如下:... -
医疗问答数据集QA-MED-nguynvtng
医疗问答数据集QA-MED-nguynvtng 数据来源:互联网公开数据 标签:医疗,问答,数据集,自然语言处理,医学,机器学习,文本分析,知识图谱 数据概述: 该数据集包含医疗领域的问答对,旨在促进医疗领域的自然语言处理研究。主要特征如下: 时间跨度: 数据记录的时间范围不限,涵盖了不同时期的医疗知识。 地理范围:... -
安卓应用分析与用户评论数据集-kakamana
安卓应用分析与用户评论数据集-kakamana 数据来源:互联网公开数据 标签:安卓应用,用户评论,情感分析,自然语言处理,移动应用,应用商店,数据挖掘,文本分析 数据概述: 该数据集包含安卓应用相关信息以及用户评论数据,用于分析用户对应用的评价和使用情况。主要特征如下: 时间跨度:数据记录的时间范围为应用发布至今。... -
命名实体识别数据集NamedEntityRecognitionDataset-nileshmalode1
命名实体识别数据集NamedEntityRecognitionDataset-nileshmalode1 数据来源:互联网公开数据 标签:自然语言处理,命名实体识别,数据集,文本分析,机器学习,信息抽取,深度学习,人工智能 数据概述: 该数据集包含标注好的文本数据,用于训练和评估命名实体识别(NER)模型。主要特征如下:... -
简历数据库CVDatabase数据分析数据集-anissamylaamri
简历数据库CVDatabase数据分析数据集-anissamylaamri 数据来源:互联网公开数据 标签:简历,数据库,人才,招聘,文本分析,自然语言处理,机器学习,数据挖掘 数据概述: 该数据集包含来自简历数据库的数据,记录了求职者的个人信息,教育背景,工作经历,技能特长等。主要特征如下:... -
坏兔子BadBunny歌曲歌词数据集2022年1月30日-lvlvlv210
坏兔子BadBunny歌曲歌词数据集2022年1月30日-lvlvlv210 数据来源:互联网公开数据 标签:音乐,歌词,坏兔子,西班牙语,数据集,文本分析,自然语言处理,文化研究 数据概述: 该数据集包含了坏兔子(Bad Bunny)的歌曲歌词数据,记录了他在2022年1月30日之前的歌曲的歌词信息。主要特征如下:... -
焦虑情绪Reddit讨论数据集2020-2023RedditAnxietyDiscussionDataset-countmein
焦虑情绪Reddit讨论数据集2020-2023RedditAnxietyDiscussionDataset-countmein 数据来源:互联网公开数据 标签:焦虑情绪,社交媒体,数据集,自然语言处理,心理健康,情感分析,机器学习,文本分析... -
印尼传统诗歌Pantun数据集-husnifadhilah
印尼传统诗歌Pantun数据集-husnifadhilah 数据来源:互联网公开数据 标签:诗歌,文学,数据集,印尼文化,自然语言处理,文本分析,情感分析,文化研究 数据概述: 该数据集包含了印度尼西亚的传统诗歌(Pantun)文本数据,记录了大量的Pantun诗句,是研究印尼传统文化和文学的重要资源。主要特征如下: 时间跨度:... -
越南新闻摘要数据集VietnameseSummaryDataset-trinhnguyenthmai
越南新闻摘要数据集VietnameseSummaryDataset-trinhnguyenthmai 数据来源:互联网公开数据 标签:越南语,文本摘要,数据集,自然语言处理,NLP,机器翻译,信息检索,文本分析 数据概述: 该数据集包含来自越南新闻网站的文章及其对应的摘要。主要特征如下:... -
高等教育领域命名实体识别数据集ThaiHocNERDataset-playerthai
高等教育领域命名实体识别数据集ThaiHocNERDataset-playerthai 数据来源:互联网公开数据 标签:命名实体识别,教育领域,数据集,自然语言处理,机器学习,文本分析,学术研究,信息提取 数据概述: 该数据集专注于高等教育领域的文本数据,记录了包含命名实体的文本样本,适用于命名实体识别(NER)任务的训练和评估。主要特征如下:... -
新闻头条数据集NewsHeadlineDataset-satyamneelmani
新闻头条数据集NewsHeadlineDataset-satyamneelmani 数据来源:互联网公开数据 标签:新闻,头条,数据集,文本分析,自然语言处理,机器学习,信息检索,舆情分析 数据概述:该数据集包含来自各大新闻媒体的头条新闻数据,记录了新闻的标题,发布时间,来源媒体,新闻类别等信息。主要特征如下:... -
大型情绪数据集LargeEmotionDataset-ubbarapusiri
大型情绪数据集LargeEmotionDataset-ubbarapusiri 数据来源:互联网公开数据 标签:情绪识别,数据集,自然语言处理,情感分析,机器学习,心理学,文本分析,人工智能 数据概述: 该数据集包含了来自多个来源的情绪标注文本数据,适用于情绪识别和情感分析任务。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2020年。...