-
推特用户性别预测数据集
推特用户性别预测数据集 数据来源:互联网公开数据 标签:推特,性别预测,自然语言处理,机器学习,文本分析,社会语言学,性别识别 数据概述: 本数据集包含2019年5月21日至2019年6月1日期间通过Twitter...
-
星际之门-SG-1剧本语料库
星际之门-SG-1剧本语料库 数据来源:互联网公开数据 标签:星际之门,SG-1,剧本,对话,电视剧,文本分析,文化研究,语言研究 数据概述: 本数据集包含了星际之门:SG-1从第一季到第六季(直到丹尼尔升天且不再为主要角色)的所有对话和指令内容。数据集覆盖了超过5年的电视剧集,为研究电视剧中的对话模式、角色互动及文化背景提供了丰富的文本材料。...
-
-
印地语等多种语言Quora问答对数据集
印地语等多种语言Quora问答对数据集 数据来源:互联网公开数据 标签:问答对, Quora, 多语言, 印地语, 奥里亚语, 孟加拉语, 古吉拉特语, 马拉地语, 泰米尔语, 旁遮普语, 自然语言处理, 文本分析 数据概述: 本数据集包含3300对来自原始Quora问答对数据集的问答对。...
-
阿拉伯语仇恨言论检测数据集-42k
阿拉伯语仇恨言论检测数据集-42k 数据来源:互联网公开数据 标签:阿拉伯语,仇恨言论,社交媒体,文本分析,自然语言处理,情感分析,语言学,机器学习 数据概述: 本数据集包含超过42,000条阿拉伯语文本数据,主要来源于社交媒体平台。 数据集旨在为研究和开发阿拉伯语仇恨言论检测模型提供支持。...
-
-
德语词汇列表数据集
德语词汇列表数据集 数据来源:互联网公开数据 标签:德语词汇,语言学,语料库,书籍,文本分析,教育,研究 数据概述: 本数据集收录了11本德语书籍的文本内容,总计超过3000页。数据集中只包含一个字段,为德语词汇列表。这些书籍来源于互联网资源,包括DOABooks和USP E-Disciplinas平台上的相关文档。 数据用途概述:...
-
加州餐厅评论数据集2023
加州餐厅评论数据集2023 数据来源:互联网公开数据 标签:餐厅评论,加州, sentiment analysis,星级评分,文本分析,消费者反馈,餐厅评价 数据概述:...
-
美国Yelp平台必胜客用户评价文本情感分析数据集
美国Yelp平台必胜客用户评价文本情感分析数据集 数据来源:互联网公开数据 标签:用户评价,文本分析,情感分析,主题建模,关键词提取,必胜客,Yelp,美国,消费者洞察 数据概述:...
-
叔本华哲学研究著作文本数据集1774-1860
叔本华哲学研究著作文本数据集1774-1860 数据来源:互联网公开数据 标签:叔本华,哲学,文本分析,NLP,语料库,德国古典哲学,时间序列 数据概述:...
-
高评分电影词干与词形还原分析数据集
高评分电影词干与词形还原分析数据集 数据来源:互联网公开数据 标签:电影,高评分,词干提取,词形还原,自然语言处理,文本分析,影视研究 数据概述: 本数据集收录了若干高评分电影的基本信息及其概述内容的词干和词形还原处理结果。数据集包含以下字段: - 电影标题:电影的名称 - 电影概述:对电影剧情的简要描述 - 类型列表:电影所属的类型或标签 -...
-
美国2024年夏季数据科学家职位招聘数据集
美国2024年夏季数据科学家职位招聘数据集 数据来源:互联网公开数据 标签:数据科学,招聘,职位,美国,远程,数据分析,数据可视化,文本分析,自然语言处理,机器学习 数据概述: 本数据集抓取自Indeed招聘网站,时间为2024年夏季,关键词为“数据科学家”。数据覆盖了美国所有州的职位招聘信息,包括远程职位,全面反映了该时期的数据科学就业市场状况。...
-
印度最高法院判决文件与分析数据集1963-2021
印度最高法院判决文件与分析数据集1963-2021 数据来源:互联网公开数据 标签:最高法院,印度,法律判决,文本分析,命名实体识别,TF-IDF,词向量,情感分析,RNN 数据概述: 本数据集包含从印度最高法院网站抓取的判决文件及其分析结果。数据集包括两个主要文件:data_files.csv 和...
-
贝叶斯网络自然语言解释文本数据集
贝叶斯网络自然语言解释文本数据集 数据来源:互联网公开数据 标签:贝叶斯网络,自然语言解释,可解释AI,文本分析,机器学习,语料库,语言学,解释生成 数据概述: 本数据集,即ExBAN语料库(Explanations for BAyesian...
-
数据16K长度文本指令数据集
数据16K长度文本指令数据集 数据来源:互联网公开数据 标签:文本指令,自然语言处理,机器学习模型,数据分析,文本分析,情感分析,指令比较 数据概述:...
-
耐克产品描述数据集
耐克产品描述数据集 数据来源:互联网公开数据 标签:耐克,产品描述,自然语言处理,语言模型,训练数据,电子商务,文本分析 数据概述: 本数据集包含从耐克官方网站抓取的400个耐克产品的详细描述信息,包括产品标题、副标题和产品描述三个字段。数据采用CSV格式存储,每一行代表一个产品的相关信息。 数据用途概述:...
-
IMDB电影评论情感分析数据集-电影评论文本-电影评论文本-电影评论文本
IMDB电影评论情感分析数据集-电影评论文本-电影评论文本-电影评论文本 数据来源:互联网公开数据 标签:电影评论,情感分析,自然语言处理,文本分析,机器学习,深度学习,分类,IMDB,电影,评论 数据概述:...
-
英国航空客户服务质量评价数据集
英国航空客户服务质量评价数据集 数据来源:互联网公开数据 标签:英国航空,客户评价,服务质量,情绪分析,行业研究,客户满意度,文本分析 数据概述:...
-
土耳其土耳其语推特字符数据集
土耳其土耳其语推特字符数据集 数据来源:互联网公开数据 标签:土耳其,推特,社交媒体,文本分析,自然语言处理,情感分析,字符数据 数据概述: 本数据集包含从Twitter API及其他多种来源收集的土耳其语推文,并经过伦理标注处理。数据集中的400个类别已被简化为30个类别,旨在为文本分析和自然语言处理任务提供丰富的数据基础。 数据用途概述:...
-
英国航空乘客服务评价数据集-2016至2023年
英国航空乘客服务评价数据集-2016至2023年 数据来源:互联网公开数据 标签:英国航空,乘客评价,客户反馈,服务质量,航空业,旅行体验,Skytrax,时间序列,文本分析 数据概述: 本数据集收录了2016年至2023年期间,英国航空(British...



