-
BhashaHMPV_Based印度区域语言HMPV多语言新闻与事实核查数据集
2026年1月20日 30 78 28
数据集概述 本数据集包含印度区域语言的HMPV相关多语言新闻和事实核查文章,覆盖孟加拉语、英语、古吉拉特语等11种语言。通过Splinter框架采集Google新闻文章,利用Google Fact-Check API获取事实核查文章,经预处理和词干提取后整理为结构化文件,可用于多语言医疗文本分析研究。 文件详解...
-
Paĩ_Tavyterã_语言田野调查_名词动词词干提取数据2017_01_02
2026年1月15日 30 5 4
数据集概述 本数据集为巴拉圭Amambay地区Paĩ Tavyterã Guarani语言的田野调查数据,核心内容是该语言名词和动词词干的提取结果,仅包含一个文件,无目录结构和数据拆分。 文件详解 文件名称:PTA_2017_01_02.xlsx 文件格式:XLSX 字段映射介绍:因无内容预览,推测包含Paĩ Tavyterã...
-
COVID-19研究论文词干提取数据集
2025年5月31日 30 92 42
COVID-19研究论文词干提取数据集 数据来源:互联网公开数据 标签:COVID-19研究,NLP技术,词干提取,文本处理,数据科学,公共卫生 数据概述:...
-
新闻文章文本数据分析数据集NewsArticlesTextDataAnalysis-phidole
2025年5月30日 30 207 101
新闻文章文本数据分析数据集NewsArticlesTextDataAnalysis-phidole 数据来源:互联网公开数据 标签:新闻文章, 文本分析, 自然语言处理, 停用词, 词干提取, 文本分类, 情感分析, 数据挖掘 数据概述: 该数据集包含来自新闻文章的数据,记录了新闻标题和文章正文内容。主要特征如下:...
-
商品标题文本预处理数据集ProductTitleTextPreprocessing-akshatgargbot
2025年5月30日 30 67 30
商品标题文本预处理数据集ProductTitleTextPreprocessing-akshatgargbot 数据来源:互联网公开数据 标签:商品标题, 文本预处理, 词干提取, 词形还原, 自然语言处理, 文本挖掘, 数据清洗, 机器学习 数据概述:...
-
俄语推特情感分析数据集RussianTweetsSentimentAnalysisDataset-denislysov
2025年5月19日 30 35 8
俄语推特情感分析数据集RussianTweetsSentimentAnalysisDataset-denislysov 数据来源:互联网公开数据 标签:情感分析, 俄语, 文本处理, 自然语言处理, 机器学习, 文本预处理, 词干提取, 二分类 数据概述: 该数据集包含来自推特的俄语文本数据,用于情感分析研究。主要特征如下:...
-
文本情感分析训练测试数据集TextSentimentAnalysisTrainingandTestingDataset-nuhashafnan
2025年5月17日 30 123 15
文本情感分析训练测试数据集TextSentimentAnalysisTrainingandTestingDataset-nuhashafnan 数据来源:互联网公开数据 标签:情感分析, 文本分类, 机器学习, 自然语言处理, 情感极性, 数据集, 文本预处理, 词干提取 数据概述:...
-
孟加拉语词形还原数据集BengaliLemmaDataset-jakir57
2025年4月29日 30 5 2
孟加拉语词形还原数据集BengaliLemmaDataset-jakir57 数据来源:互联网公开数据 标签:词形还原, 自然语言处理, 孟加拉语, 语言学, 文本分析, 词干提取, 词汇分析, 语料库 数据概述: 该数据集包含孟加拉语词汇的词形还原数据,记录了孟加拉语单词的词形与其对应的词元(lemma)之间的映射关系。主要特征如下:...
-
推特文本数据预处理与情感分析数据集TwitterTextDataPreprocessingandSentimentAnalysis-jiryanfarokhi
2025年4月29日 30 5 3
推特文本数据预处理与情感分析数据集TwitterTextDataPreprocessingandSentimentAnalysis-jiryanfarokhi 数据来源:互联网公开数据 标签:推特数据, 文本预处理, 情感分析, 社交媒体, 文本清洗, 停用词移除, 词干提取, 数据标注 数据概述:...
-
孟加拉语文本词形还原数据集BanglaTextLemmatizationDataset-jakir57
2025年4月29日 30 20 4
孟加拉语文本词形还原数据集BanglaTextLemmatizationDataset-jakir57 数据来源:互联网公开数据 标签:词形还原, 孟加拉语, 自然语言处理, 文本分析, 语言学, 文本预处理, 机器翻译, 词干提取 数据概述: 该数据集包含孟加拉语文本的词形还原数据,旨在为孟加拉语文本处理任务提供支持。主要特征如下:...
-
形态学分析数据集-faizankhan6356
2025年4月26日 30 193 84
形态学分析数据集-faizankhan6356 数据来源:互联网公开数据 标签:形态学,语言学,自然语言处理,数据集,词性标注,词干提取,词形还原,文本分析 数据概述: 该数据集包含了用于形态学分析的文本数据,记录了不同语言的词汇及其形态变化信息。主要特征如下: 时间跨度:数据记录的时间范围不固定,取决于具体数据集,可能涵盖多个历史时期和现代语言。...
-
孟加拉语自然语言处理基础词汇数据集-saifsunny
2025年4月21日 30 115 22
孟加拉语自然语言处理基础词汇数据集-saifsunny 数据来源:互联网公开数据 标签:孟加拉语,NLP,自然语言处理,词汇,语法,停用词,代词,动词,词干提取,文本处理 数据概述:...
-
文章数据集文本预处理-大小写转换过滤分词去停用词词干提取-muhammadalwi
2025年4月21日 30 168 42
文章数据集文本预处理-大小写转换过滤分词去停用词词干提取-muhammadalwi 数据来源:互联网公开数据 标签:文本预处理,自然语言处理,NLP,大小写转换,过滤,分词,停用词,词干提取,文章数据集 数据概述:...
-
高评分电影词干与词形还原分析数据集
2025年4月14日 30 5 2
高评分电影词干与词形还原分析数据集 数据来源:互联网公开数据 标签:电影,高评分,词干提取,词形还原,自然语言处理,文本分析,影视研究 数据概述: 本数据集收录了若干高评分电影的基本信息及其概述内容的词干和词形还原处理结果。数据集包含以下字段: - 电影标题:电影的名称 - 电影概述:对电影剧情的简要描述 - 类型列表:电影所属的类型或标签 -...



