找到31个数据集

标签: 写作风格

过滤结果
  • PAN25_Based_多作者写作风格变化检测数据集

    2026年1月31日 30 100 91

    数据集概述 本数据集为PAN@CLEF2025共享任务“多作者写作风格分析”专用数据,核心任务是检测多作者文档中句子级的写作风格变化位置。数据集包含易、中、难三个难度等级,分别对应不同主题多样性的文档,各等级均划分训练、验证、测试集。 文件详解 文件名称:pan25-multi-author-analysis.zip 文件格式:ZIP...
    packageimg
  • Stamatatos06_Based_作者识别C10文本数据集_2015

    2026年1月22日 30 107 23

    数据集概述 本数据集包含来自十位不同作者(C10)的五百篇文本,用于作者识别研究。数据以压缩包形式提供,内部包含一个JSON文件记录真实标签(ground truth),无训练/测试、数据/标签或原始/处理数据的划分。 文件详解 文件名称:stamatatos06-authorship-attribution-...
    packageimg
  • henryrzepa_wordpress_Based_2006_2015年7月18日博客文章及评论完整导出数据

    2025年12月28日 30 111 13

    数据集概述 本数据集为Wordpress博客导出的XML文件,包含Henry Rzepa在2006年至2015年7月18日期间发布的四百四十篇博客文章及相关评论,是研究该时间段内特定主题博客内容的原始文本数据。 文件详解 文件名称:henryrzepa.wordpress.2015-07-19.xml 文件格式:XML...
    packageimg
  • 跨主题作者归属大型语料库FICSIT

    2025年12月23日 30 33 4

    数据集概述 该数据集是精准控制跨主题样本的作者归属语料库,基于StackExchange平台数据构建,包含1237位作者的188077条文本样本,覆盖308个主题,未进行额外预处理,为跨主题作者归属研究提供基础数据。 文件详解 文件名称: FICSIT.zip:压缩包格式,包含跨主题作者归属的文本样本数据,具体字段需解压后查看 文件名称:...
    packageimg
  • 科学文献中扭曲短语现象补充材料数据集

    2025年12月20日 30 21 13

    数据集概述 本数据集是预印本论文《Tortured phrases: A dubious writing style emerging in science. Evidence of critical issues affecting established...
    packageimg
  • SemEval_2022多语言新闻文章相似度数据集

    2025年12月20日 30 144 49

    数据集概述 该数据集包含2020年上半年的多语言新闻文章对,标注了地理焦点、命名实体、时间、叙事框架、整体内容、写作风格及语气共七个维度的相似度,为新闻文本相似度研究提供标注数据支持。 文件详解 数据文件(CSV格式): final_eval_data.csv:评估数据集,包含文章对语言、URL、互联网档案馆链接及GEO、ENT等七个相似度标注字段...
    packageimg
  • 多语言新闻文章相似度数据集

    2025年12月9日 30 73 40

    数据集概述 该数据集是作者早期工作的扩展版本,包含2020年上半年的新闻文章对及其相似度标注。标注涵盖地理焦点、命名实体、时间相关性、叙事模式、整体内容、写作风格、语气及框架观点共八个维度,为多语言新闻文本的相似度分析提供结构化标注数据。 文件详解 文档文件: Codebook for text similarity annotations -...
    packageimg
  • PAN23多作者写作风格分析数据集

    2025年12月7日 30 78 60

    数据集概述 该数据集是PAN@CLEF2023多作者写作风格分析共享任务的专用数据,包含三个难度级别的文档集,用于训练和测试段落级风格变化检测算法,文档均为英文且风格变化仅发生在段落间。 文件详解 文件名称: pan23-multi-author-analysis.zip 文件格式: ZIP压缩包 包含内容:...
    packageimg
  • 选择正确写作风格的重要性

    2025年12月6日 30 26 20

    数据集概述 本数据集围绕选择正确写作风格的重要性展开,包含一份相关主题的PDF文档,为了解写作风格选择的意义提供基础资料。 文件详解 文件名称: Sаttorovа Shаhlo Shаvkаtovnа.pdf 文件格式: PDF (.pdf) 内容说明: 该文档为关于选择正确写作风格重要性的主题资料,具体内容需通过阅读PDF文档获取。 适用场景...
    packageimg
  • 文本生成与人工作品对比数据集

    2025年11月10日 30 174 149

    文本生成与人工作品对比数据集_Text_Generation_vs_Human_Written_Content 数据来源:互联网公开数据 标签:文本生成, 自然语言处理, 情感分析, 写作风格, 文本分类, 机器学习, 对比分析, 数据标注 数据概述:...
    packageimg
  • 写作风格评估日志数据集WritingStyleAssessmentLogs-jianma4

    2025年5月30日 30 88 18

    写作风格评估日志数据集WritingStyleAssessmentLogs-jianma4 数据来源:互联网公开数据 标签:写作评估, 文本分析, 行为日志, 机器学习, 自然语言处理, 写作技巧, 学习行为, 数据建模 数据概述: 该数据集包含来自写作练习的详细日志数据,记录了用户在写作过程中的各种行为,以及对应的写作质量评分。主要特征如下:...
    packageimg
  • 学生写作评估与生成文本数据集StudentEssayAssessmentandGeneratedTextDataset-conjuring92

    2025年5月30日 30 19 16

    学生写作评估与生成文本数据集StudentEssayAssessmentandGeneratedTextDataset-conjuring92 数据来源:互联网公开数据 标签:文本生成, 写作评估, 机器学习, 自然语言处理, 文本分析, 情感分析, 教育, 写作风格 数据概述:...
    packageimg
  • 写作风格评估数据集WritingStyleAssessmentDataset-yus002

    2025年5月29日 30 13 2

    写作风格评估数据集WritingStyleAssessmentDataset-yus002 数据来源:互联网公开数据 标签:写作风格, 文本分析, 机器学习, 文本特征, 风格迁移, 自然语言处理, 语料库, 评估指标 数据概述: 该数据集包含多个CSV文件,记录了用于评估写作风格的数据。主要特征如下: 时间跨度:数据未明确标明时间,可视为静态语料库。...
    packageimg
  • 写作风格与生成文本检测数据集WritingStyle-GeneratedTextDetectionDataset-shijirbatbaatar

    2025年5月28日 30 103 67

    写作风格与生成文本检测数据集WritingStyle-GeneratedTextDetectionDataset-shijirbatbaatar 数据来源:互联网公开数据 标签:文本分析, 写作风格, 机器生成文本, 文本分类, 自然语言处理, 论文写作, 语言模型, 数据集 数据概述:...
    packageimg
  • 写作风格检测与论文生成数据集WritingStyleDetectionandEssayGenerationDataset-xuanboksnb

    2025年5月21日 30 14 2

    写作风格检测与论文生成数据集WritingStyleDetectionandEssayGenerationDataset-xuanboksnb 数据来源:互联网公开数据 标签:文本分析, 写作风格, 论文生成, 机器学习, 自然语言处理, 文本分类, 数据标注, 写作辅助 数据概述:...
    packageimg
  • 科技写作文本真伪判别数据集TechnologyWritingTextAuthenticityDetection-laurensprast

    2025年5月17日 30 26 0

    科技写作文本真伪判别数据集TechnologyWritingTextAuthenticityDetection-laurensprast 数据来源:互联网公开数据 标签:文本分析, 写作评估, 虚假信息检测, 机器学习, 自然语言处理, 文本分类, 写作风格, 数据标注 数据概述:...
    packageimg
  • 文学作品作者识别文本数据集LiteraryAuthorIdentificationTextDataset-shruti0406

    2025年5月14日 30 171 125

    文学作品作者识别文本数据集LiteraryAuthorIdentificationTextDataset-shruti0406 数据来源:互联网公开数据 标签:文本分析, 作者识别, 自然语言处理, 文本分类, 机器学习, 语料库, 风格分析, 写作风格 数据概述: 该数据集包含来自文学作品的文本片段,用于训练和评估作者识别模型。主要特征如下:...
    packageimg
  • 文本生成模型与人类写作对比数据集TextGenerationModelvs-HumanWritingComparison-rjraac2018

    2025年5月14日 30 113 12

    文本生成模型与人类写作对比数据集TextGenerationModelvs-HumanWritingComparison-rjraac2018 数据来源:互联网公开数据 标签:文本生成, 自然语言处理, 写作风格, 机器学习, 文本分类, 真实性判别, 语料分析, 人工智能 数据概述:...
    packageimg
  • 文学作品作者识别文本数据集LiteraryAuthorIdentificationTextDataset-fcojavierdavila

    2025年5月9日 30 90 16

    文学作品作者识别文本数据集LiteraryAuthorIdentificationTextDataset-fcojavierdavila 数据来源:互联网公开数据 标签:文本分类, 作者识别, 文学分析, 文本语料, 机器学习, 自然语言处理, 语料库, 写作风格 数据概述: 该数据集包含来自文学作品的文本片段,旨在用于识别作者。主要特征如下:...
    packageimg
  • 文本生成模型识别数据集TextGenerationModelIdentificationDataset-zhouarsenal

    2025年5月7日 30 197 105

    文本生成模型识别数据集TextGenerationModelIdentificationDataset-zhouarsenal 数据来源:互联网公开数据 标签:文本生成, 机器写作, 自然语言处理, 文本分类, 伪原创检测, 深度学习, 语料分析, 写作风格 数据概述:...
    packageimg