-
会议论文标题与会议信息数据集
会议论文标题与会议信息数据集 数据来源:互联网公开数据 标签:会议论文,标题,会议信息,自然语言处理,文本分类,主题建模,出版趋势,计算机科学,工程学 数据概述: 本数据集包含各类会议论文的标题及其发表的会议信息,涵盖了计算机科学和工程学等多个领域的领先会议。数据集提供了每个论文的标题和发表会议的名称,有助于研究这些会议的研究重点、模式和话题多样性。... -
客户服务电子邮件情感分析与问题诊断数据集
客户服务电子邮件情感分析与问题诊断数据集 数据来源:互联网公开数据 标签:客户服务,电子邮件,情感分析,自然语言处理,问题诊断,文本数据,合成数据 数据概述: 本数据集包含由Gemini... -
古吉拉特语推文数据集
古吉拉特语推文数据集 数据来源:互联网公开数据 标签:推文,古吉拉特语,情感分析,翻译,社交媒体,文本分析,自然语言处理 数据概述: 本数据集包含超过25000条英文推文及其对应的古吉拉特语翻译,并附带每条推文的情感评分。数据集内容丰富,涵盖了多种主题和情感类型,为研究社交媒体文本及其情感特征提供了宝贵的数据资源。 数据用途概述:... -
大型语言模型论文数据集
大型语言模型论文数据集 数据来源:互联网公开数据 标签:大型语言模型,论文生成,GPT-3.5-turbo,GPT-4,提示ID,文本分析,机器学习,自然语言处理 数据概述:... -
-
仇恨言论数据集-01
仇恨言论数据集-01 数据来源:互联网公开数据 标签:仇恨言论,社交媒体,推特,文本分析,机器学习,自然语言处理 数据概述: 本数据集包含用于识别仇恨言论的推特训练集和测试集,涵盖了2010年至2021年间推特平台上发布的大量文本数据。数据集经过标注,区分了包含仇恨言论和非仇恨言论的推文,适用于仇恨言论检测任务的研究和开发。 数据用途概述:... -
泰卢固语问答系统数据集
泰卢固语问答系统数据集 数据来源:互联网公开数据 标签:泰卢固语,问答系统,自然语言处理,机器学习,文本分析 数据概述: 本数据集专为构建泰卢固语问答系统而设计,包含了大量的泰卢固语问题及其对应的答案。数据集涵盖了多个领域的问题,包括但不限于科学、技术、文化、历史等,为开发和优化泰卢固语的问答系统提供了丰富的语言和知识基础。 数据用途概述:... -
BBC新闻数据集用于提取摘要
BBC新闻数据集用于提取摘要 数据来源:互联网公开数据 标签:BBC新闻,新闻摘要,自然语言处理,文本分析,机器学习,数据挖掘 数据概述: 本数据集来源于Kaggle平台,收录了BBC新闻的文章及其对应的摘要。数据集涵盖了五个不同的新闻类别:商业、科技、娱乐、体育和政治。每篇文章都配有一个简短的摘要,便于进行文本摘要技术的研究和应用。 数据用途概述:... -
Reddit用户自杀意念文本数据集
Reddit用户自杀意念文本数据集 数据来源:互联网公开数据 标签:Reddit,自杀意念,文本数据,情感分析,自然语言处理,心理健康,社交媒体,情感识别 数据概述: 本数据集包含了Reddit平台上的用户帖子,这些帖子基于其内容被人工标注为“有自杀意念”或“无自杀意念”两类。标注过程严格遵循以下规则: 有自杀意念文本:... -
IMDB电影评论情感分类数据集1963-2021
IMDB电影评论情感分类数据集1963-2021 数据来源:互联网公开数据 标签:电影评论,情感分类,自然语言处理,机器学习,文本分析,训练数据,测试数据 数据概述:... -
金融领域术语可读性评估数据集-FinRAD-2022
金融领域术语可读性评估数据集-FinRAD-2022 数据来源:互联网公开数据 标签:金融,可读性,自然语言处理,文本分析,术语,数据集,金融科技,语言学 数据概述: 本数据集,即FinRAD(Financial Readability Assessment... -
-
电影评论NLTK数据集
电影评论NLTK数据集 数据来源:互联网公开数据 标签:电影评论,自然语言处理,情感分析,词性标注,观众影响,故事描述,电影电视系列 数据概述: 本数据集包含了电影评论的相关信息,数据来源于之前的movie.csv数据集。数据集涵盖了电影名称、句子、词性标注、单个单词以及评论对观众的影响等内容,为电影评论的情感分析和自然语言处理提供了基础。... -
西班牙诗歌数据集
西班牙诗歌数据集 数据来源:互联网公开数据 标签:西班牙诗歌,NLP,文学分析,自然语言处理,诗歌爬虫,文学结构,文本挖掘 数据概述: 本数据集收录了从1960年代至今的大量西班牙诗歌作品,数据来源于2020年7月从诗歌网站www.poemas-del-... -
基于语言工具的AI生成文本错误分析数据集
基于语言工具的AI生成文本错误分析数据集 数据来源:互联网公开数据 标签:AI检测,文本分析,语言工具,错误分析,生成文本,写作风格,自然语言处理,教育,评估 数据概述:... -
在线赌博检测数据集
在线赌博检测数据集 数据来源:互联网公开数据 标签:在线赌博,社交媒体,内容检测,自然语言处理,公共事件,实时分析 数据概述: 本数据集包含来自“Yogyakarta夜 carnival 9”实时直播的评论数据,该活动是为了庆祝Yogyakarta市成立268周年。数据集收集了直播期间的用户评论,用于分析和检测在线赌博的推广行为。数据集包含以下字段:... -
电影评论与评分数据集
电影评论与评分数据集 数据来源:互联网公开数据 标签:电影评论,电影评分,自然语言处理,观众评价,电影分析,预测模型 数据概述: 本数据集来源于Rotten Tomatoes网站上观众(非专业评论家)的评论和评分。数据集包含了网站上各种电影的少量评论,旨在为自然语言处理分析提供基础,并构建一个能够根据观众评论预测评分的模型。所有数据的信用归Rotten... -
DatabricksDolly-15k指令数据集
DatabricksDolly-15k指令数据集 数据来源:互联网公开数据 标签:大型语言模型,指令微调,自然语言处理,数据集,开源,问答,文本生成,数据增强,Databricks 数据概述: Databricks Dolly-15k... -
复旦大学电影评论情感分析比赛数据集-电影评论-情感分析-文本数据
复旦大学电影评论情感分析比赛数据集-电影评论-情感分析-文本数据 数据来源:互联网公开数据 标签:情感分析,电影评论,文本数据,自然语言处理,复旦大学,机器学习,情感分类,Kaggle 数据概述: 本数据集是复旦大学自然语言处理实验室(FDU-... -