-
-
大型语言模型训练问答数据集1963-2021
大型语言模型训练问答数据集1963-2021 数据来源:互联网公开数据 标签:大型语言模型,问答系统,多语言,文本生成,机器学习,训练数据,自然语言处理 数据概述:... -
自然语言处理研究论文数据集
自然语言处理研究论文数据集 数据来源:互联网公开数据 标签:自然语言处理,研究论文,文本摘要,文档分类,结构分析,文本总结,学术研究 数据概述:... -
-
技能与职位描述语料库数据集
技能与职位描述语料库数据集 数据来源:互联网公开数据 标签:技能,职位描述,自然语言处理,技能提取,机器学习,语料库,技能分析 数据概述: 本数据集基于大量职位描述数据构建,经过多轮数据清洗、格式标准化和预处理,最终形成了一套结构化、高质量的技能语料库。数据集包含了与技能相关的文本信息,适用于技能提取、技能分类、技能推荐等场景。 数据用途概述:... -
LLM科学考试竞赛数据集-SciQ数据集
LLM科学考试竞赛数据集-SciQ数据集 数据来源:互联网公开数据 标签:科学,考试,LLM,自然语言处理,人工智能,竞赛,问答,教育,机器学习 数据概述: 本数据集是Allen... -
推特情绪强度分析数据集1963-2021
推特情绪强度分析数据集1963-2021 数据来源:互联网公开数据 标签:情绪分析,推特,情感强度,情绪分类,自然语言处理,文本分析,社交媒体分析 数据概述:... -
美国酒店评论数据分析数据集2023
美国酒店评论数据分析数据集2023 数据来源:互联网公开数据 标签:酒店,评论,数据分析,美国,州级比较,情感分析,自然语言处理 数据概述:... -
文档评论意图分类数据集
文档评论意图分类数据集 数据来源:互联网公开数据 标签:文档评论,意图分类,CommonCrawl,文本分析,自然语言处理,商务文档,交互分析 数据概述:... -
土耳其学术期刊机器学习与人工智能论文摘要数据集-DergiPark网站-v2
土耳其学术期刊机器学习与人工智能论文摘要数据集-DergiPark网站-v2 数据来源:互联网公开数据 标签:机器学习,深度学习,迁移学习,人工智能,论文摘要,土耳其,学术期刊,自然语言处理,文本分析 数据概述:... -
数据99K数据集带上下文版本2
数据99K数据集带上下文版本2 数据来源:互联网公开数据 标签:文本数据,上下文,自然语言处理,机器学习,数据标注 数据概述: 本数据集包含99,000条带上下文的文本数据,旨在为自然语言处理和机器学习任务提供丰富的训练素材。数据集中的每一条记录都包含一个句子及其上下文信息,有助于模型更好地理解和生成连贯的文本。 数据用途概述:... -
奥斯卡颁奖典礼获奖感言文本数据集-1940至今
奥斯卡颁奖典礼获奖感言文本数据集-1940至今 数据来源:互联网公开数据 标签:奥斯卡,颁奖典礼,获奖感言,电影,文本分析,情感分析,自然语言处理,文化研究 数据概述:... -
巴佳电气员工评价数据集
巴佳电气员工评价数据集 数据来源:互联网公开数据 标签:巴佳电气,员工评价,工作环境,员工体验,职场文化,情感分析,自然语言处理,数据分析 数据概述: 本数据集汇集了巴佳电气员工在Ambition Box平台上分享的宝贵见解和评价,Ambition... -
印度尼西亚论文错误检测数据集2023
印度尼西亚论文错误检测数据集2023 数据来源:互联网公开数据 标签:论文错误检测,印度尼西亚,文本处理,自然语言处理,机器学习,数据增强,学术研究 数据概述: 本数据集来源于PERSUADE 2.0数据集,并经过Claude... -
社交媒体仇恨言论识别数据集-文本内容-2017
社交媒体仇恨言论识别数据集-文本内容-2017 数据来源:互联网公开数据 标签:仇恨言论,社交媒体,文本分析,情感分析,自然语言处理,语言学,数据标注,分类,攻击性语言 数据概述: 本数据集包含近1.5万条短文本,每条文本均由多位贡献者进行标注,以识别其是否包含仇恨言论。标注结果分为三类:a) 包含仇恨言论;b) 具有攻击性,但不属于仇恨言论;c)... -
奥罗莫语句子标注数据集
奥罗莫语句子标注数据集 数据来源:互联网公开数据 标签:奥罗莫语,句子标注,自然语言处理,文本分析,语言识别 数据概述: 本数据集包含78,000条经过清理的奥罗莫语句子,所有句子均无特殊字符和标点符号。数据集由两列组成,其中一列包含句子文本,另一列包含对应的语言标签。该数据集为研究和处理奥罗莫语提供了丰富的语言素材。 数据用途概述:... -
手机产品评论主题分析数据集
手机产品评论主题分析数据集 数据来源:互联网公开数据 标签:用户反馈,亚马逊评论,情感分析,主题建模,词性标注,产品优化,市场调研,自然语言处理 数据概述... -
推特情感分析数据集-推文情感分类数据集
推特情感分析数据集-推文情感分类数据集 数据来源:互联网公开数据 标签:推特,情感分析,自然语言处理,文本挖掘,情感分类,社交媒体,机器学习,数据,推文 数据概述: 本数据集包含101160条推特(Twitter)推文,通过Twitter API收集。每条推文都已进行情感标注,标注结果为0(负面)或4(正面),可用于情感分析任务。 数据字段包括:... -
恐龙星期六情感分析与文本生成研究数据集-2021
恐龙星期六情感分析与文本生成研究数据集-2021 数据来源:互联网公开数据 标签:恐龙星期六,Facebook,情感分析,文本生成,自然语言处理,泰国,社交媒体,文本数据 数据概述:... -
贝叶斯方法与机器学习书籍主题建模数据集
贝叶斯方法与机器学习书籍主题建模数据集 数据来源:互联网公开数据 标签:机器学习,贝叶斯方法,主题建模,文本分析,自然语言处理,书籍,数据挖掘,Bishop 数据概述: 本数据集包含了《模式识别与机器学习》(Pattern Recognition and Machine Learning)一书(作者:Christopher...