-
维基百科中文版处理数据集ProcessedWikihowChineseDataset-akumar99
维基百科中文版处理数据集ProcessedWikihowChineseDataset-akumar99 数据来源:互联网公开数据 标签:自然语言处理,文本数据,数据集,机器学习,文本分类,语义分析,中文处理,信息提取 数据概述: 该数据集包含来自维基百科中文版的数据,经过处理和清洗,记录了维基百科中的大量中文文本内容。主要特征如下: 时间跨度:... -
学生咨询问答语料库StudentInquiryQ-ACorpus-phyngyn
学生咨询问答语料库StudentInquiryQ-ACorpus-phyngyn 数据来源:互联网公开数据 标签:问答系统, 自然语言处理, 学生服务, 文本分类, 情感分析, 信息检索, 语料库, 教育 数据概述: 该数据集包含来自越南某大学学生咨询服务平台的数据,记录了学生提出的问题及其对应的官方解答。主要特征如下:... -
能源行业电子邮件语料库数据集EnergyIndustryEmailCorpus-rodrigomller
能源行业电子邮件语料库数据集EnergyIndustryEmailCorpus-rodrigomller 数据来源:互联网公开数据 标签:电子邮件, 文本分析, 能源行业, Enron, 语料库, 自然语言处理, 词频统计, 信息检索 数据概述: 该数据集包含来自 Enron... -
漫威电影角色台词数据集MarvelMovieCharacterDialogue-meowee
漫威电影角色台词数据集MarvelMovieCharacterDialogue-meowee 数据来源:互联网公开数据 标签:电影数据, 角色台词, 文本分析, 自然语言处理, 情感分析, 数据挖掘, 语料库, 漫威电影 数据概述: 该数据集包含来自漫威电影的台词数据,记录了不同角色的对白内容。主要特征如下:... -
问答系统真实性评估数据集QuestionAnsweringSystemTruthfulnessEvaluationDataset-brucewaynew
问答系统真实性评估数据集QuestionAnsweringSystemTruthfulnessEvaluationDataset-brucewaynew 数据来源:互联网公开数据 标签:问答系统, 真实性, 知识图谱, 文本理解, 自然语言处理, 事实核查, 对抗样本, 机器学习 数据概述:... -
问答社区问题文本真伪识别数据集QuestionTextSincere-InsincereClassification-gayatrisrinivasan
问答社区问题文本真伪识别数据集QuestionTextSincere-InsincereClassification-gayatrisrinivasan 数据来源:互联网公开数据 标签:文本分类, 自然语言处理, 问答社区, 情感分析, 垃圾信息检测, 机器学习, 数据标注, 语义分析 数据概述:... -
情感分析数据集FinalDataCleanSenti-trulssteinkjerl
情感分析数据集FinalDataCleanSenti-trulssteinkjerl 数据来源:互联网公开数据 标签:情感分析,数据集,文本分析,自然语言处理,机器学习,情感分类,中文文本,情绪识别 数据概述:该数据集包含经过清洗和整理的中文文本数据,用于情感分析任务。主要特征如下: 时间跨度:数据记录的时间范围不明确,取决于原始数据的收集时间。... -
英语作文质量评估特征数据集EnglishEssayQualityAssessmentFeatureDataset-wcqyfly
英语作文质量评估特征数据集EnglishEssayQualityAssessmentFeatureDataset-wcqyfly 数据来源:互联网公开数据 标签:作文评估, 文本分析, 机器学习, 语言模型, 自然语言处理, 写作质量, 特征工程, LightGBM模型 数据概述:... -
文本情感分析与特征工程数据集TextSentimentAnalysisandFeatureEngineering-akscent
文本情感分析与特征工程数据集TextSentimentAnalysisandFeatureEngineering-akscent 数据来源:互联网公开数据 标签:文本情感分析, 情感分类, 特征工程, 自然语言处理, 机器学习, 文本预处理, 情感极性, 评价星级 数据概述:... -
孟加拉语文本分句与分割数据集BengaliTextSentenceSegmentationandSplitDataset-jjleesunny
孟加拉语文本分句与分割数据集BengaliTextSentenceSegmentationandSplitDataset-jjleesunny 数据来源:互联网公开数据 标签:孟加拉语, 文本处理, 分句, 文本分割, 自然语言处理, 语料库, 机器学习, 语言学 数据概述:... -
比特币情绪分析数据集BitcoinSentimentAnalysisDataset-hlf2001
比特币情绪分析数据集BitcoinSentimentAnalysisDataset-hlf2001 数据来源:互联网公开数据 标签:比特币,情绪分析,加密货币,社交媒体,自然语言处理,文本挖掘,金融科技,时间序列 数据概述:... -
文本信息处理与索引数据集TextProcessingandIndexingDataset-aryanp2702
文本信息处理与索引数据集TextProcessingandIndexingDataset-aryanp2702 数据来源:互联网公开数据 标签:文本处理, 索引, 信息检索, 语料库, 关键词提取, 机器学习, 自然语言处理, 数据清洗 数据概述: 该数据集包含来自不同来源的文本数据,记录了经过处理的文本内容及其对应的索引信息。主要特征如下:... -
机器学习算法实践案例数据集MachineLearningAlgorithmPracticeCaseDatasets-aayushsin7a
机器学习算法实践案例数据集MachineLearningAlgorithmPracticeCaseDatasets-aayushsin7a 数据来源:互联网公开数据 标签:机器学习, 数据分析, 线性回归, 逻辑回归, 随机森林, 聚类分析, 推荐系统, 自然语言处理 数据概述:... -
情感分析文本数据集SentimentAnalysisTextDataset-cuderpanda
情感分析文本数据集SentimentAnalysisTextDataset-cuderpanda 数据来源:互联网公开数据 标签:情感分析, 文本分类, 自然语言处理, 情绪识别, 情感标注, 机器学习, 深度学习, 语料库 数据概述: 该数据集包含来自公开文本的情感标注数据,记录了不同文本内容对应的情感类别。主要特征如下:... -
医学文献摘要文本处理与分析数据集MedicalLiteratureAbstractTextProcessingandAnalysis-ajayvamsi123
医学文献摘要文本处理与分析数据集MedicalLiteratureAbstractTextProcessingandAnalysis-ajayvamsi123 数据来源:互联网公开数据 标签:医学文献, 文本分析, 自然语言处理, 命名实体识别, 词性标注, 情感分析, 机器学习, 生物医学 数据概述: 该数据集包含来自PubMed... -
WSDM虚假新闻分类数据集WSDMFakeNewsClassificationDataset-xuyinjie
WSDM虚假新闻分类数据集WSDMFakeNewsClassificationDataset-xuyinjie 数据来源:互联网公开数据 标签:虚假新闻,新闻分类,文本分析,机器学习,自然语言处理,社交媒体,数据挖掘,舆情分析 数据概述: 该数据集包含来自WSDM(Web Search and Data... -
新闻真伪识别文本数据集NewsValidityIdentificationTextDataset-saikirankopparthi
新闻真伪识别文本数据集NewsValidityIdentificationTextDataset-saikirankopparthi 数据来源:互联网公开数据 标签:新闻, 文本分类, 真伪识别, 自然语言处理, 机器学习, 舆情分析, 标题, 作者 数据概述: 该数据集包含来自网络新闻的数据,记录了新闻标题、作者、正文内容及其真伪标签。主要特征如下:... -
俄语文学作品文本分析数据集RussianLiteratureTextAnalysisDataset-nikitaprzd
俄语文学作品文本分析数据集RussianLiteratureTextAnalysisDataset-nikitaprzd 数据来源:互联网公开数据 标签:俄语文学, 文本分析, 自然语言处理, 作者分析, 语料库, 情感分析, 文本挖掘, 语言模型 数据概述:... -
尼日利亚选举推文数据集INECTweetsDataset-mikeusen
尼日利亚选举推文数据集INECTweetsDataset-mikeusen 数据来源:互联网公开数据 标签:社交媒体,推特,选举,尼日利亚,情感分析,自然语言处理,政治,数据集 数据概述: 该数据集包含来自推特(Twitter)的公开推文数据,记录了关于尼日利亚选举的相关讨论。主要特征如下: 时间跨度:数据记录的时间范围覆盖了尼日利亚选举期间。... -
游戏评论情感分析数据集GameReviewSentimentAnalysis-studymart
游戏评论情感分析数据集GameReviewSentimentAnalysis-studymart 数据来源:互联网公开数据 标签:情感分析, 文本挖掘, 游戏评论, 正负情感, 机器学习, 自然语言处理, 情感分类, 数据标注 数据概述: 该数据集包含来自亚马逊平台的游戏评论数据,记录了用户对游戏的评价及其对应的情感极性。主要特征如下:...