-
自然语言处理文本分类数据集
2025年7月27日 30 172 95
自然语言处理文本分类数据集_Natural_Language_Processing_Text_Classification_Dataset 数据来源:互联网公开数据 标签:自然语言处理, 文本分类, 机器学习, 语料库, 文本校正, 情感分析, 数据清洗, 深度学习 数据概述:... -
文本标点符号校正数据集
2025年7月26日 30 142 123
文本标点符号校正数据集_Text_Punctuation_Correction_Dataset 数据来源:互联网公开数据 标签:文本处理, 自然语言处理, 标点符号, 文本校正, 数据标注, 机器学习, 语料库, 文本分析 数据概述: 该数据集包含来自公开文本的数据,记录了用于文本标点符号校正的语料。主要特征如下:... -
越南语文本纠错数据集VietnameseTextErrorCorrectionDataset-dunglduy
2025年5月29日 30 10 8
越南语文本纠错数据集VietnameseTextErrorCorrectionDataset-dunglduy 数据来源:互联网公开数据 标签:文本纠错, 越南语, 自然语言处理, 语言模型, 错误检测, 文本校正, 深度学习, 数据集 数据概述: 该数据集包含越南语文本,记录了原始句子及其对应的错误句子,用于越南语文本纠错任务。主要特征如下:... -
语音识别错误校正数据集SpeechRecognitionErrorCorrectionDataset-tuhuutuong
2025年5月13日 30 23 5
语音识别错误校正数据集SpeechRecognitionErrorCorrectionDataset-tuhuutuong 数据来源:互联网公开数据 标签:语音识别, 语音校正, 文本校正, 声学模型, 语言模型, 深度学习, 数据增强, 自然语言处理 数据概述:... -
韩语文本噪声数据分析数据集KoreanTextNoiseAnalysisDataset-iamyourenergy
2025年4月29日 30 191 149
韩语文本噪声数据分析数据集KoreanTextNoiseAnalysisDataset-iamyourenergy 数据来源:互联网公开数据 标签:韩语文本, 文本噪声, 文本清洗, 语音转换, 机器学习, 自然语言处理, 数据增强, 文本校正 数据概述:... -
常见拼写错误纠正数据集-therahasya00
2025年4月26日 30 68 60
常见拼写错误纠正数据集-therahasya00 数据来源:互联网公开数据 标签:拼写纠错,自然语言处理,数据集,文本校正,语言学,机器学习,文本处理,中文 数据概述: 该数据集包含常见的中文拼写错误及其对应的正确词汇。主要特征如下: 时间跨度:数据记录的时间范围无明确限定,持续更新和维护。 地理范围:数据主要涵盖中国大陆地区常用的中文词汇和表达。...