-
瑞士国家科学基金会_SNSF_资助申请中正面词汇的频率分析数据
2026年2月9日 30 56 46
数据集概述 本数据集记录瑞士国家科学基金会不同资助项目申请文本中积极词汇的出现频率,包含三类资助项目(职业资助、Spark资助、项目资助)的申请数据。数据涵盖积极词汇计数、申请人特征、申请结果等信息,用于复现Lerchenmueller et al. (2019)的研究方法与发现,支持科研资助申请文本的NLP分析。 文件详解...
-
Twitter_Based_文化遗产场景下社交媒体传播效果预测数据集
2026年1月27日 30 81 1
数据集概述 本数据集为论文《A Predictive Method to Improve the Effectiveness of Twitter Communication in a Cultural Heritage...
-
西班牙语小说语料库2021_04
2025年12月7日 30 155 58
数据集概述 该数据集是2021年4月发布的西班牙语小说语料库(ELTeC-spa),包含八十三个按一级标准编码的小说。数据集由元数据文件、说明文档和压缩包组成,为欧洲文学文本研究提供结构化的西班牙语小说资源。 文件详解 metadata.csv(CSV格式):包含西班牙语小说的元数据信息,字段包括id(语料库编号)、author-...
-
心理健康文章摘要分析数据集MentalHealthArticleSummaryAnalysis-terrychanorg
2025年5月29日 30 8 0
心理健康文章摘要分析数据集MentalHealthArticleSummaryAnalysis-terrychanorg 数据来源:互联网公开数据 标签:心理健康, 摘要, 文本分析, 自然语言处理, 摘要生成, 情感分析, 文本长度, 语料库 数据概述: 该数据集包含来自互联网的文章,记录了文章标题、摘要、正文内容及其对应的URL。主要特征如下:...
-
文本生成内容质量评估数据集TextGenerationContentQualityEvaluationDataset-sirojiddinboboqulov
2025年5月13日 30 147 34
文本生成内容质量评估数据集TextGenerationContentQualityEvaluationDataset-sirojiddinboboqulov 数据来源:互联网公开数据 标签:文本生成, 内容质量, 情感分析, 文本长度, 语法错误, 语义多样性, 机器学习, 自然语言处理 数据概述:...
-
美国和加州立法提案摘要数据集-undersc0re
2025年4月24日 30 52 15
美国和加州立法提案摘要数据集-undersc0re 数据来源:互联网公开数据 标签:立法,提案,摘要,文本分析,自然语言处理,美国,加州,法律,文本长度 数据概述: 本数据集包含了美国联邦立法提案和加州立法提案的摘要信息,总计超过23000条记录。数据分为训练集(train)、加州测试集(ca_test)和测试集(test)三个部分。...
-
新作文训练数据集
2025年4月14日 30 146 6
新作文训练数据集 数据来源:互联网公开数据 标签:作文检测,人工智能,LLM竞赛,生成文本,非生成文本,文本长度,数据均衡 数据概述: 本数据集为作文检测AI...



