找到5,805个数据集

标签: 文本分析

过滤结果
  • 英文文本主张与证据数据集TrainEnglishClaimSpanDataset-ariondas

    2025年5月29日   

    英文文本主张与证据数据集TrainEnglishClaimSpanDataset-ariondas 数据来源:互联网公开数据 标签:自然语言处理,文本分析,证据提取,主张识别,数据集,机器学习,文本分类,信息抽取 数据概述: 该数据集包含英文文本数据,用于训练和评估文本中主张(claims)及其证据(evidence)的识别模型。主要特征如下:...
    packageimg
  • 写作风格评估数据集WritingStyleAssessmentDataset-yus002

    2025年5月29日   

    写作风格评估数据集WritingStyleAssessmentDataset-yus002 数据来源:互联网公开数据 标签:写作风格, 文本分析, 机器学习, 文本特征, 风格迁移, 自然语言处理, 语料库, 评估指标 数据概述: 该数据集包含多个CSV文件,记录了用于评估写作风格的数据。主要特征如下: 时间跨度:数据未明确标明时间,可视为静态语料库。...
    packageimg
  • Zalo推荐系统用户行为数据集ZaloRecommendationSystemUserBehaviorData-thoquang12345

    2025年5月29日   

    Zalo推荐系统用户行为数据集ZaloRecommendationSystemUserBehaviorData-thoquang12345 数据来源:互联网公开数据 标签:推荐系统, 用户行为, 自然语言处理, 文本分析, 机器学习, 数据挖掘, 社交媒体, 语料库 数据概述:...
    packageimg
  • 社交媒体自杀风险检测数据集-mustofaahmed41

    2025年5月29日   

    社交媒体自杀风险检测数据集-mustofaahmed41 数据来源:互联网公开数据 标签:自杀风险,社交媒体,文本分析,自然语言处理,情感分析,数据集,机器学习,心理健康 数据概述: 该数据集包含来自社交媒体平台的数据,旨在用于自杀风险检测。主要特征如下: 时间跨度:数据记录的时间范围不详,具体时间跨度取决于数据收集的范围。...
    packageimg
  • 学生作文文本实体识别与分类数据集StudentEssayTextEntityRecognitionandClassification-blattdrama

    2025年5月29日   

    学生作文文本实体识别与分类数据集StudentEssayTextEntityRecognitionandClassification-blattdrama 数据来源:互联网公开数据 标签:文本分析, 命名实体识别, 自然语言处理, 写作质量评估, 学生作文, 文本分类, 机器学习, 教育 数据概述:...
    packageimg
  • 学术论文文本数据集PaperTextDataset-divanshu22

    2025年5月29日   

    学术论文文本数据集PaperTextDataset-divanshu22 数据来源:互联网公开数据 标签:学术论文,文本分析,数据集,自然语言处理,机器学习,文本挖掘,信息检索,教育研究 数据概述: 该数据集包含来自学术期刊和会议的论文文本数据,记录了多篇学术论文的全文内容。主要特征如下: 时间跨度:数据记录的时间范围从2000年到2023年。...
    packageimg
  • 新闻分类数据集NewsClassificationsDataset-seyb1t

    2025年5月29日   

    新闻分类数据集NewsClassificationsDataset-seyb1t 数据来源:互联网公开数据 标签:新闻分类,数据集,文本分析,机器学习,自然语言处理,信息提取,分类算法,数据挖掘 数据概述: 该数据集包含来自互联网的新闻文章数据,记录了不同类别新闻的内容和分类标签。主要特征如下:...
    packageimg
  • 古腾堡项目书籍名称及封面图像数据集ProjectGutenbergBookNamesandCoverImages-mizanurrahmanrafi

    2025年5月29日   

    古腾堡项目书籍名称及封面图像数据集ProjectGutenbergBookNamesandCoverImages-mizanurrahmanrafi 数据来源:互联网公开数据 标签:古腾堡项目, 图书信息, 封面图像, 文本分析, 图像识别, 数据挖掘, 文学作品, 资源共享 数据概述: 该数据集包含来自古腾堡项目(Project...
    packageimg
  • 文本特征提取与词向量融合数据集TF-IDFandW2VCombinedDataset-tohidul16182

    2025年5月29日   

    文本特征提取与词向量融合数据集TF-IDFandW2VCombinedDataset-tohidul16182 数据来源:互联网公开数据 标签:文本分析,特征提取,词向量,机器学习,自然语言处理,数据挖掘,信息检索,深度学习 数据概述: 该数据集包含文本特征提取和词向量融合的数据,记录了通过TF-IDF(词频-...
    packageimg
  • 社交媒体推文文本分析数据集SocialMediaTweetTextAnalysis-yaasmine

    2025年5月29日   

    社交媒体推文文本分析数据集SocialMediaTweetTextAnalysis-yaasmine 数据来源:互联网公开数据 标签:社交媒体, 文本分析, 推文, 自然语言处理, 用户行为分析, 情感分析, 数据挖掘, 机器学习 数据概述: 该数据集包含来自社交媒体平台推文的文本数据,记录了推文内容及其相关元数据。主要特征如下:...
    packageimg
  • 学术论文写作结构分析数据集AcademicEssayStructureAnalysis-evanhuu

    2025年5月29日   

    学术论文写作结构分析数据集AcademicEssayStructureAnalysis-evanhuu 数据来源:互联网公开数据 标签:论文写作, 文本分析, 自然语言处理, 语篇结构, 论证结构, 文本标注, 机器学习, 教育 数据概述: 该数据集包含用于分析学术论文写作结构的数据,记录了论文中不同论述单元的文本内容及其类型。主要特征如下:...
    packageimg
  • 新闻文本分类数据集-kk0105

    2025年5月29日   

    新闻文本分类数据集-kk0105 数据来源:互联网公开数据 标签:新闻,文本分类,自然语言处理,机器学习,数据集,情感分析,主题识别,文本分析 数据概述: 该数据集包含了来自不同来源的新闻文本,用于新闻文本分类任务。主要特征如下: 时间跨度:数据记录的时间范围不固定,取决于新闻来源,但涵盖了近期的新闻信息。...
    packageimg
  • 奥利维亚搜索数据集OliviaFinderRepoFinalDataset-danielalonsob

    2025年5月29日   

    奥利维亚搜索数据集OliviaFinderRepoFinalDataset-danielalonsob 数据来源:互联网公开数据 标签:社交媒体,用户画像,文本分析,情感分析,数据集,数据挖掘,自然语言处理,信息检索 数据概述: 该数据集来源于奥利维亚搜索项目,主要记录了社交媒体平台上用户发布的内容,旨在构建用户画像和进行情感分析。主要特征如下:...
    packageimg
  • 英语相似度评估数据集EnglishSimilarityAssessmentDataset-terrychanorg

    2025年5月29日   

    英语相似度评估数据集EnglishSimilarityAssessmentDataset-terrychanorg 数据来源:互联网公开数据 标签:自然语言处理,相似度评估,数据集,文本分析,机器学习,语义理解,人工智能,语言模型 数据概述: 该数据集包含用于评估英语文本相似度的数据,记录了不同文本对之间的相似度评分。主要特征如下:...
    packageimg
  • 阿拉伯语故事文本数据集FinalArabicStoriesDataset-raidouahioune

    2025年5月29日   

    阿拉伯语故事文本数据集FinalArabicStoriesDataset-raidouahioune 数据来源:互联网公开数据 标签:阿拉伯语,文本数据,故事集,自然语言处理,机器学习,语言研究,文化遗产,文本分析 数据概述: 该数据集包含来自阿拉伯语故事文本的集合,记录了阿拉伯语故事的内容和结构。主要特征如下:...
    packageimg
  • 泰卢固语罗马化文本数据集TeluguRomanizedTextDataset-teachingmachine

    2025年5月29日   

    泰卢固语罗马化文本数据集TeluguRomanizedTextDataset-teachingmachine 数据来源:互联网公开数据 标签:泰卢固语,罗马化,文本数据,自然语言处理,数据集,语言学,机器翻译,文本分析 数据概述: 该数据集包含泰卢固语文本的罗马化转写数据,记录了泰卢固语文本与其对应的罗马字母转写版本。主要特征如下:...
    packageimg
  • 推特人类与机器人账号分类数据集TwitterHuman-BotsDataset-danieltreiman

    2025年5月29日   

    推特人类与机器人账号分类数据集TwitterHuman-BotsDataset-danieltreiman 数据来源:互联网公开数据 标签:社交媒体,机器学习,数据集,账号分类,文本分析,网络行为,人工智能,网络安全 数据概述: 该数据集包含来自推特平台的用户账号数据,记录了人类账号与机器人账号的特征信息,用于账号分类任务。主要特征如下:...
    packageimg
  • 酒店评论地理位置分析数据集HotelReviewLocationAnalysis-pradeepsiva

    2025年5月29日   

    酒店评论地理位置分析数据集HotelReviewLocationAnalysis-pradeepsiva 数据来源:互联网公开数据 标签:酒店评论, 地理位置, 文本分析, 情感分析, 数据挖掘, 市场调研, 用户行为, 旅游行业 数据概述: 该数据集包含来自不同来源的酒店评论数据,记录了用户对酒店的评价及其地理位置信息。主要特征如下:...
    packageimg
  • 邮件清洗数据集EmailCleanedDatasets-ashishgoraniya

    2025年5月29日   

    邮件清洗数据集EmailCleanedDatasets-ashishgoraniya 数据来源:互联网公开数据 标签:邮件数据,数据清洗,文本分析,自然语言处理,机器学习,垃圾邮件检测,数据预处理,电子邮件 数据概述: 该数据集包含经过清洗处理的电子邮件数据,主要用于文本分析、垃圾邮件检测等研究。主要特征如下:...
    packageimg
  • 医疗对话数据集MedicalDialogueData-snjyor

    2025年5月29日   

    医疗对话数据集MedicalDialogueData-snjyor 数据来源:互联网公开数据 标签:医疗,对话,数据集,自然语言处理,医学,人工智能,文本分析,问答系统 数据概述: 该数据集包含医疗相关的对话数据,记录了患者与医生或智能医疗系统之间的交流内容。主要特征如下: 时间跨度:数据记录的时间跨度不明确,可能涵盖多个时间段的对话。...
    packageimg