-
MALAYALAM_MIX_CODE_食谱频道YouTube评论文本分类数据集
2026年1月20日 30 131 98
数据集概述 本数据集为用于文本分类的马拉雅拉姆语(混合代码)数据,来自YouTube平台“Veen's Curryworld”和“Lekshmi Nair”两个食谱频道的评论区,通过YouTube API抓取整合。包含“text”(评论内容)和“label”(分类标签)两个属性,标签分为感恩、食谱相关、视频相关等七类,总计含多类标注实例。 文件详解...
-
Kerala_Biodiversity_Monitoring_Network_印度南部蝴蝶物种名录数据
2026年1月3日 30 202 41
数据集概述 本数据集为印度南部蝴蝶物种开放数据集,包含物种的学名、英文名及马拉雅拉姆语名称,由Kerala Biodiversity Monitoring Network为内部项目整理并持续更新。数据集采用Open Data Commons Attribution License v1.0(ODC-BY 1.0)许可协议,共包含2个压缩文件。 文件详解...
-
达罗毗荼语混合文本情感分析与冒犯性语言识别数据集2020
2025年12月21日 30 71 59
数据集概述 该数据集为三种低资源达罗毗荼语(泰米尔语、卡纳达语、马拉雅拉姆语)与英语的混合社交媒体评论数据,包含六万余条YouTube评论,经人工标注用于情感分析和冒犯性语言识别,标注者间一致性较高,支持相关自然语言处理研究。 文件详解 文件名称: DravidianCodeMix-2020.zip 文件格式: ZIP压缩包 内容说明:...
-
马拉雅拉姆语命名实体识别数据集MalayalamLanguageNamedEntityRecognitionDataset-rajumavinmar
2025年5月15日 30 120 93
马拉雅拉姆语命名实体识别数据集MalayalamLanguageNamedEntityRecognitionDataset-rajumavinmar 数据来源:互联网公开数据 标签:命名实体识别, 自然语言处理, 马拉雅拉姆语, 文本标注, 语言学, 机器学习, 文本分析, 语料库 数据概述:...
-
马拉雅拉姆语语音转录数据集MalayalamSpeechTranscriptionDataset-nairsaanvi
2025年5月1日 30 63 36
马拉雅拉姆语语音转录数据集MalayalamSpeechTranscriptionDataset-nairsaanvi 数据来源:互联网公开数据 标签:语音识别, 语音转录, 马拉雅拉姆语, 语言学, 文本分析, 语音数据, 机器学习, 声学模型 数据概述: 该数据集包含来自公开渠道的马拉雅拉姆语语音数据及其对应的文本转录。主要特征如下:...
-
语音转录与说话人识别数据集SpeechTranscriptionandSpeakerRecognitionDataset-nairsaanvi
2025年5月1日 30 37 26
语音转录与说话人识别数据集SpeechTranscriptionandSpeakerRecognitionDataset-nairsaanvi 数据来源:互联网公开数据 标签:语音识别, 说话人识别, 语音转录, 文本标注, 语音数据集, 机器学习, 声音分析, 马拉雅拉姆语 数据概述:...
-
马拉雅拉姆语语音转录数据集MalayalamSpeechTranscriptionDataset-saanvi4nair
2025年4月29日 30 23 12
马拉雅拉姆语语音转录数据集MalayalamSpeechTranscriptionDataset-saanvi4nair 数据来源:互联网公开数据 标签:语音识别, 语音转录, 文本分析, 语言学, 马拉雅拉姆语, 声学模型, 语音标注, 数据集 数据概述: 该数据集包含来自公开来源的马拉雅拉姆语语音数据,并附带相应的转录文本。主要特征如下:...
-
英语-马拉雅拉姆语平行语料库数据集English-MalayalamParallelCorpus-alakaru
2025年4月29日 30 41 1
英语-马拉雅拉姆语平行语料库数据集English-MalayalamParallelCorpus-alakaru 数据来源:互联网公开数据 标签:机器翻译, 语料库, 双语对照, 自然语言处理, 语言学, 文本数据, 英语, 马拉雅拉姆语 数据概述: 该数据集包含英语和马拉雅拉姆语的平行文本,用于机器翻译和跨语言分析。主要特征如下:...
-
数字马拉雅拉姆语言数据集DigitalMalayalamLanguageDataset-amaljossy
2025年4月23日 30 68 35
数字马拉雅拉姆语言数据集DigitalMalayalamLanguageDataset-amaljossy 数据来源:互联网公开数据 标签:数字语言,马拉雅拉姆,数据集,自然语言处理,文本分析,机器学习,语言学,人工智能 数据概述: 该数据集包含来自互联网和公开资源的马拉雅拉姆语言文本数据,记录了各种类型的马拉雅拉姆文本。主要特征如下:...
-
喀拉拉邦政治观点YouTube评论多语言数据集
2025年4月15日 30 54 8
喀拉拉邦政治观点YouTube评论多语言数据集 数据来源:互联网公开数据 标签:政治观点,YouTube评论,喀拉拉邦,多语言,英语,马拉雅拉姆语,Manglish,社交媒体分析,舆情分析 数据概述:...



