Kenneth_Udut_1989_2016年线上写作语料库

数据集概述

该数据集收录了Kenneth Udut在1989至2016年间的线上写作内容,共34977条记录,涵盖邮件、博客、论坛评论等多种形式,每条记录单独成行,移除了回车换行符,为研究个人线上写作轨迹提供数据支持。

文件详解

  • 文件名称:ken_brain_line-by-line.xls
  • 文件格式:XLS(Excel表格)
  • 内容说明:包含1989-2016年Kenneth Udut的线上写作内容,每条记录单独成行,移除了回车换行符;未明确标注训练/测试、数据/标签、原始/处理数据的拆分

适用场景

  • 个人写作轨迹研究:分析特定个体27年间线上写作内容的主题演变与风格变化
  • 网络文本类型分析:探究邮件、博客、论坛评论等不同线上文本形式的语言特征差异
  • 长期文本语料库应用:作为长周期个人写作语料,支持自然语言处理(NLP)相关的文本挖掘实验
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 3.39 MiB
最后更新 2025年11月28日
创建于 2025年11月28日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。