-
矿业_酷刑_缩写_科学文献_数据集_2024年10月28日
2026年1月29日 30 1 0
数据集概述 本数据集聚焦科学文献中的“扭曲缩写”挖掘,包含150篇开放获取的工程类文章,旨在识别学术文本中不规范的缩写现象,为检测可疑出版物提供支持。数据集含7个文件,涵盖数据档案、代码脚本、说明文档等多种类型。 文件详解...
-
Marian_Keyes_Based小说专有名词提取分析数据集2020
2026年1月23日 30 158 64
数据集概述 本数据集为爱尔兰研究委员会资助的博士论文相关研究成果,分析了Marian Keyes1995-2020年出版的14部小说中的专有名词,包含角色名称等内容。虽结果无统计显著性未纳入最终论文,但可为其他研究者提供角色名称停用词表,支持远读方法分析。 文件详解 文件名称:An analysis of proper nouns in Marian...
-
简历技能预测数据集-基于NLTK处理的技能及相关信息提取-dhruval97
2025年5月31日 30 99 78
简历技能预测数据集-基于NLTK处理的技能及相关信息提取-dhruval97 数据来源:互联网公开数据 标签:简历,技能,预测,NLTK,自然语言处理,文本分析,机器学习,教育,就业 数据概述:...
-
Quora问题真实性预测文本数据集-2017年-minakshikarwa
2025年5月5日 30 169 112
Quora问题真实性预测文本数据集-2017年-minakshikarwa 数据来源:互联网公开数据 标签:自然语言处理,文本分类,问题,Quora,真实性,机器学习,NLTK,TfidfVectorizer,朴素贝叶斯 数据概述:...
-
Twitter健康相关推文情感分析数据集-2021年-nikhilpotnis
2025年4月22日 30 202 184
Twitter健康相关推文情感分析数据集-2021年-nikhilpotnis 数据来源:互联网公开数据 标签:Twitter,推文,疾病,情感分析,自然语言处理,NLTK,健康监测,公众情绪,COVID-19,兹卡,疟疾 数据概述:...
-
新闻情感分析数据集2008-2024
2025年4月19日 30 7 5
新闻情感分析数据集2008-2024 数据来源:互联网公开数据 标签:新闻,情感分析,股票市场预测,自然语言处理,NLTK VADER,NLTK RoBERTa,Hugging Face DistilBERT,时间序列,金融分析,文本挖掘 数据概述: 本数据集涵盖2008年6月8日至2024年8月3日期间来自三大新闻来源的新闻文章,包括Reddit...
-
行为推特数据集
2025年4月15日 30 95 25
行为推特数据集 数据来源:互联网公开数据 标签:社交媒体,心理健康,压力,孤独,焦虑,数据清理,NLTK,情感分析 数据概述: 本数据集通过Tweepy...



