-
henryrzepa_wordpress_Based_2006_2015年7月18日博客文章及评论完整导出数据
2025年12月28日 30 148 86
数据集概述 本数据集为Wordpress博客导出的XML文件,包含Henry Rzepa在2006年至2015年7月18日期间发布的四百四十篇博客文章及相关评论,是研究该时间段内特定主题博客内容的原始文本数据。 文件详解 文件名称:henryrzepa.wordpress.2015-07-19.xml 文件格式:XML...
-
跨主题作者归属大型语料库FICSIT
2025年12月23日 30 31 26
数据集概述 该数据集是精准控制跨主题样本的作者归属语料库,基于StackExchange平台数据构建,包含1237位作者的188077条文本样本,覆盖308个主题,未进行额外预处理,为跨主题作者归属研究提供基础数据。 文件详解 文件名称: FICSIT.zip:压缩包格式,包含跨主题作者归属的文本样本数据,具体字段需解压后查看 文件名称:...
-
科学文献中扭曲短语现象补充材料数据集
2025年12月20日 30 119 110
数据集概述 本数据集是预印本论文《Tortured phrases: A dubious writing style emerging in science. Evidence of critical issues affecting established...
-
SemEval_2022多语言新闻文章相似度数据集
2025年12月20日 30 57 28
数据集概述 该数据集包含2020年上半年的多语言新闻文章对,标注了地理焦点、命名实体、时间、叙事框架、整体内容、写作风格及语气共七个维度的相似度,为新闻文本相似度研究提供标注数据支持。 文件详解 数据文件(CSV格式): final_eval_data.csv:评估数据集,包含文章对语言、URL、互联网档案馆链接及GEO、ENT等七个相似度标注字段...
-
多语言新闻文章相似度数据集
2025年12月9日 30 59 19
数据集概述 该数据集是作者早期工作的扩展版本,包含2020年上半年的新闻文章对及其相似度标注。标注涵盖地理焦点、命名实体、时间相关性、叙事模式、整体内容、写作风格、语气及框架观点共八个维度,为多语言新闻文本的相似度分析提供结构化标注数据。 文件详解 文档文件: Codebook for text similarity annotations -...
-
PAN23多作者写作风格分析数据集
2025年12月7日 30 12 10
数据集概述 该数据集是PAN@CLEF2023多作者写作风格分析共享任务的专用数据,包含三个难度级别的文档集,用于训练和测试段落级风格变化检测算法,文档均为英文且风格变化仅发生在段落间。 文件详解 文件名称: pan23-multi-author-analysis.zip 文件格式: ZIP压缩包 包含内容:...
-
选择正确写作风格的重要性
2025年12月6日 30 4 3
数据集概述 本数据集围绕选择正确写作风格的重要性展开,包含一份相关主题的PDF文档,为了解写作风格选择的意义提供基础资料。 文件详解 文件名称: Sаttorovа Shаhlo Shаvkаtovnа.pdf 文件格式: PDF (.pdf) 内容说明: 该文档为关于选择正确写作风格重要性的主题资料,具体内容需通过阅读PDF文档获取。 适用场景...
-
文本生成与人工作品对比数据集
2025年11月10日 30 55 23
文本生成与人工作品对比数据集_Text_Generation_vs_Human_Written_Content 数据来源:互联网公开数据 标签:文本生成, 自然语言处理, 情感分析, 写作风格, 文本分类, 机器学习, 对比分析, 数据标注 数据概述:...
-
写作风格评估日志数据集WritingStyleAssessmentLogs-jianma4
2025年5月30日 30 85 33
写作风格评估日志数据集WritingStyleAssessmentLogs-jianma4 数据来源:互联网公开数据 标签:写作评估, 文本分析, 行为日志, 机器学习, 自然语言处理, 写作技巧, 学习行为, 数据建模 数据概述: 该数据集包含来自写作练习的详细日志数据,记录了用户在写作过程中的各种行为,以及对应的写作质量评分。主要特征如下:...
-
学生写作评估与生成文本数据集StudentEssayAssessmentandGeneratedTextDataset-conjuring92
2025年5月30日 30 152 128
学生写作评估与生成文本数据集StudentEssayAssessmentandGeneratedTextDataset-conjuring92 数据来源:互联网公开数据 标签:文本生成, 写作评估, 机器学习, 自然语言处理, 文本分析, 情感分析, 教育, 写作风格 数据概述:...
-
写作风格评估数据集WritingStyleAssessmentDataset-yus002
2025年5月29日 30 121 23
写作风格评估数据集WritingStyleAssessmentDataset-yus002 数据来源:互联网公开数据 标签:写作风格, 文本分析, 机器学习, 文本特征, 风格迁移, 自然语言处理, 语料库, 评估指标 数据概述: 该数据集包含多个CSV文件,记录了用于评估写作风格的数据。主要特征如下: 时间跨度:数据未明确标明时间,可视为静态语料库。...
-
写作风格与生成文本检测数据集WritingStyle-GeneratedTextDetectionDataset-shijirbatbaatar
2025年5月28日 30 55 30
写作风格与生成文本检测数据集WritingStyle-GeneratedTextDetectionDataset-shijirbatbaatar 数据来源:互联网公开数据 标签:文本分析, 写作风格, 机器生成文本, 文本分类, 自然语言处理, 论文写作, 语言模型, 数据集 数据概述:...
-
写作风格检测与论文生成数据集WritingStyleDetectionandEssayGenerationDataset-xuanboksnb
2025年5月21日 30 137 79
写作风格检测与论文生成数据集WritingStyleDetectionandEssayGenerationDataset-xuanboksnb 数据来源:互联网公开数据 标签:文本分析, 写作风格, 论文生成, 机器学习, 自然语言处理, 文本分类, 数据标注, 写作辅助 数据概述:...
-
科技写作文本真伪判别数据集TechnologyWritingTextAuthenticityDetection-laurensprast
2025年5月17日 30 205 97
科技写作文本真伪判别数据集TechnologyWritingTextAuthenticityDetection-laurensprast 数据来源:互联网公开数据 标签:文本分析, 写作评估, 虚假信息检测, 机器学习, 自然语言处理, 文本分类, 写作风格, 数据标注 数据概述:...
-
文学作品作者识别文本数据集LiteraryAuthorIdentificationTextDataset-shruti0406
2025年5月14日 30 35 4
文学作品作者识别文本数据集LiteraryAuthorIdentificationTextDataset-shruti0406 数据来源:互联网公开数据 标签:文本分析, 作者识别, 自然语言处理, 文本分类, 机器学习, 语料库, 风格分析, 写作风格 数据概述: 该数据集包含来自文学作品的文本片段,用于训练和评估作者识别模型。主要特征如下:...
-
文本生成模型与人类写作对比数据集TextGenerationModelvs-HumanWritingComparison-rjraac2018
2025年5月14日 30 126 61
文本生成模型与人类写作对比数据集TextGenerationModelvs-HumanWritingComparison-rjraac2018 数据来源:互联网公开数据 标签:文本生成, 自然语言处理, 写作风格, 机器学习, 文本分类, 真实性判别, 语料分析, 人工智能 数据概述:...
-
文学作品作者识别文本数据集LiteraryAuthorIdentificationTextDataset-fcojavierdavila
2025年5月9日 30 70 35
文学作品作者识别文本数据集LiteraryAuthorIdentificationTextDataset-fcojavierdavila 数据来源:互联网公开数据 标签:文本分类, 作者识别, 文学分析, 文本语料, 机器学习, 自然语言处理, 语料库, 写作风格 数据概述: 该数据集包含来自文学作品的文本片段,旨在用于识别作者。主要特征如下:...
-
文本生成模型识别数据集TextGenerationModelIdentificationDataset-zhouarsenal
2025年5月7日 30 11 3
文本生成模型识别数据集TextGenerationModelIdentificationDataset-zhouarsenal 数据来源:互联网公开数据 标签:文本生成, 机器写作, 自然语言处理, 文本分类, 伪原创检测, 深度学习, 语料分析, 写作风格 数据概述:...
-
LLM提示恢复竞赛文本改写数据集-70k条-winddude
2025年5月7日 30 84 78
LLM提示恢复竞赛文本改写数据集-70k条-winddude 数据来源:互联网公开数据 标签:LLM,提示恢复,文本改写,模板,Skylion007,openwebtext,Gemma7b,艺术风格,写作风格,数据集 数据概述:...
-
文本连贯性与风格预测数据集TextCohesionandStylePredictionDataset-kunihikofurugori
2025年4月30日 30 51 3
文本连贯性与风格预测数据集TextCohesionandStylePredictionDataset-kunihikofurugori 数据来源:互联网公开数据 标签:文本分析, 写作风格, 连贯性, 语言模型, 机器学习, 自然语言处理, 文本特征, 预测模型 数据概述:...



