-
英文文本主张与证据数据集TrainEnglishClaimSpanDataset-ariondas
英文文本主张与证据数据集TrainEnglishClaimSpanDataset-ariondas 数据来源:互联网公开数据 标签:自然语言处理,文本分析,证据提取,主张识别,数据集,机器学习,文本分类,信息抽取 数据概述: 该数据集包含英文文本数据,用于训练和评估文本中主张(claims)及其证据(evidence)的识别模型。主要特征如下:... -
写作风格评估数据集WritingStyleAssessmentDataset-yus002
写作风格评估数据集WritingStyleAssessmentDataset-yus002 数据来源:互联网公开数据 标签:写作风格, 文本分析, 机器学习, 文本特征, 风格迁移, 自然语言处理, 语料库, 评估指标 数据概述: 该数据集包含多个CSV文件,记录了用于评估写作风格的数据。主要特征如下: 时间跨度:数据未明确标明时间,可视为静态语料库。... -
Zalo推荐系统用户行为数据集ZaloRecommendationSystemUserBehaviorData-thoquang12345
Zalo推荐系统用户行为数据集ZaloRecommendationSystemUserBehaviorData-thoquang12345 数据来源:互联网公开数据 标签:推荐系统, 用户行为, 自然语言处理, 文本分析, 机器学习, 数据挖掘, 社交媒体, 语料库 数据概述:... -
社交媒体自杀风险检测数据集-mustofaahmed41
社交媒体自杀风险检测数据集-mustofaahmed41 数据来源:互联网公开数据 标签:自杀风险,社交媒体,文本分析,自然语言处理,情感分析,数据集,机器学习,心理健康 数据概述: 该数据集包含来自社交媒体平台的数据,旨在用于自杀风险检测。主要特征如下: 时间跨度:数据记录的时间范围不详,具体时间跨度取决于数据收集的范围。... -
学生作文文本实体识别与分类数据集StudentEssayTextEntityRecognitionandClassification-blattdrama
学生作文文本实体识别与分类数据集StudentEssayTextEntityRecognitionandClassification-blattdrama 数据来源:互联网公开数据 标签:文本分析, 命名实体识别, 自然语言处理, 写作质量评估, 学生作文, 文本分类, 机器学习, 教育 数据概述:... -
学术论文文本数据集PaperTextDataset-divanshu22
学术论文文本数据集PaperTextDataset-divanshu22 数据来源:互联网公开数据 标签:学术论文,文本分析,数据集,自然语言处理,机器学习,文本挖掘,信息检索,教育研究 数据概述: 该数据集包含来自学术期刊和会议的论文文本数据,记录了多篇学术论文的全文内容。主要特征如下: 时间跨度:数据记录的时间范围从2000年到2023年。... -
新闻分类数据集NewsClassificationsDataset-seyb1t
新闻分类数据集NewsClassificationsDataset-seyb1t 数据来源:互联网公开数据 标签:新闻分类,数据集,文本分析,机器学习,自然语言处理,信息提取,分类算法,数据挖掘 数据概述: 该数据集包含来自互联网的新闻文章数据,记录了不同类别新闻的内容和分类标签。主要特征如下:... -
古腾堡项目书籍名称及封面图像数据集ProjectGutenbergBookNamesandCoverImages-mizanurrahmanrafi
古腾堡项目书籍名称及封面图像数据集ProjectGutenbergBookNamesandCoverImages-mizanurrahmanrafi 数据来源:互联网公开数据 标签:古腾堡项目, 图书信息, 封面图像, 文本分析, 图像识别, 数据挖掘, 文学作品, 资源共享 数据概述: 该数据集包含来自古腾堡项目(Project... -
文本特征提取与词向量融合数据集TF-IDFandW2VCombinedDataset-tohidul16182
文本特征提取与词向量融合数据集TF-IDFandW2VCombinedDataset-tohidul16182 数据来源:互联网公开数据 标签:文本分析,特征提取,词向量,机器学习,自然语言处理,数据挖掘,信息检索,深度学习 数据概述: 该数据集包含文本特征提取和词向量融合的数据,记录了通过TF-IDF(词频-... -
社交媒体推文文本分析数据集SocialMediaTweetTextAnalysis-yaasmine
社交媒体推文文本分析数据集SocialMediaTweetTextAnalysis-yaasmine 数据来源:互联网公开数据 标签:社交媒体, 文本分析, 推文, 自然语言处理, 用户行为分析, 情感分析, 数据挖掘, 机器学习 数据概述: 该数据集包含来自社交媒体平台推文的文本数据,记录了推文内容及其相关元数据。主要特征如下:... -
学术论文写作结构分析数据集AcademicEssayStructureAnalysis-evanhuu
学术论文写作结构分析数据集AcademicEssayStructureAnalysis-evanhuu 数据来源:互联网公开数据 标签:论文写作, 文本分析, 自然语言处理, 语篇结构, 论证结构, 文本标注, 机器学习, 教育 数据概述: 该数据集包含用于分析学术论文写作结构的数据,记录了论文中不同论述单元的文本内容及其类型。主要特征如下:... -
新闻文本分类数据集-kk0105
新闻文本分类数据集-kk0105 数据来源:互联网公开数据 标签:新闻,文本分类,自然语言处理,机器学习,数据集,情感分析,主题识别,文本分析 数据概述: 该数据集包含了来自不同来源的新闻文本,用于新闻文本分类任务。主要特征如下: 时间跨度:数据记录的时间范围不固定,取决于新闻来源,但涵盖了近期的新闻信息。... -
奥利维亚搜索数据集OliviaFinderRepoFinalDataset-danielalonsob
奥利维亚搜索数据集OliviaFinderRepoFinalDataset-danielalonsob 数据来源:互联网公开数据 标签:社交媒体,用户画像,文本分析,情感分析,数据集,数据挖掘,自然语言处理,信息检索 数据概述: 该数据集来源于奥利维亚搜索项目,主要记录了社交媒体平台上用户发布的内容,旨在构建用户画像和进行情感分析。主要特征如下:... -
英语相似度评估数据集EnglishSimilarityAssessmentDataset-terrychanorg
英语相似度评估数据集EnglishSimilarityAssessmentDataset-terrychanorg 数据来源:互联网公开数据 标签:自然语言处理,相似度评估,数据集,文本分析,机器学习,语义理解,人工智能,语言模型 数据概述: 该数据集包含用于评估英语文本相似度的数据,记录了不同文本对之间的相似度评分。主要特征如下:... -
阿拉伯语故事文本数据集FinalArabicStoriesDataset-raidouahioune
阿拉伯语故事文本数据集FinalArabicStoriesDataset-raidouahioune 数据来源:互联网公开数据 标签:阿拉伯语,文本数据,故事集,自然语言处理,机器学习,语言研究,文化遗产,文本分析 数据概述: 该数据集包含来自阿拉伯语故事文本的集合,记录了阿拉伯语故事的内容和结构。主要特征如下:... -
泰卢固语罗马化文本数据集TeluguRomanizedTextDataset-teachingmachine
泰卢固语罗马化文本数据集TeluguRomanizedTextDataset-teachingmachine 数据来源:互联网公开数据 标签:泰卢固语,罗马化,文本数据,自然语言处理,数据集,语言学,机器翻译,文本分析 数据概述: 该数据集包含泰卢固语文本的罗马化转写数据,记录了泰卢固语文本与其对应的罗马字母转写版本。主要特征如下:... -
推特人类与机器人账号分类数据集TwitterHuman-BotsDataset-danieltreiman
推特人类与机器人账号分类数据集TwitterHuman-BotsDataset-danieltreiman 数据来源:互联网公开数据 标签:社交媒体,机器学习,数据集,账号分类,文本分析,网络行为,人工智能,网络安全 数据概述: 该数据集包含来自推特平台的用户账号数据,记录了人类账号与机器人账号的特征信息,用于账号分类任务。主要特征如下:... -
酒店评论地理位置分析数据集HotelReviewLocationAnalysis-pradeepsiva
酒店评论地理位置分析数据集HotelReviewLocationAnalysis-pradeepsiva 数据来源:互联网公开数据 标签:酒店评论, 地理位置, 文本分析, 情感分析, 数据挖掘, 市场调研, 用户行为, 旅游行业 数据概述: 该数据集包含来自不同来源的酒店评论数据,记录了用户对酒店的评价及其地理位置信息。主要特征如下:... -
邮件清洗数据集EmailCleanedDatasets-ashishgoraniya
邮件清洗数据集EmailCleanedDatasets-ashishgoraniya 数据来源:互联网公开数据 标签:邮件数据,数据清洗,文本分析,自然语言处理,机器学习,垃圾邮件检测,数据预处理,电子邮件 数据概述: 该数据集包含经过清洗处理的电子邮件数据,主要用于文本分析、垃圾邮件检测等研究。主要特征如下:... -
医疗对话数据集MedicalDialogueData-snjyor
医疗对话数据集MedicalDialogueData-snjyor 数据来源:互联网公开数据 标签:医疗,对话,数据集,自然语言处理,医学,人工智能,文本分析,问答系统 数据概述: 该数据集包含医疗相关的对话数据,记录了患者与医生或智能医疗系统之间的交流内容。主要特征如下: 时间跨度:数据记录的时间跨度不明确,可能涵盖多个时间段的对话。...