数据集 - 海数据

中文文本生成评估数据集

2025年8月26日

中文文本生成评估数据集_Chinese_Text_Generation_Evaluation_Dataset 数据来源：互联网公开数据标签：文本生成, 中文, 自然语言处理, 评估, 语言模型, 数据集, 文本质量, 机器翻译数据概述：该数据集包含用于评估中文文本生成模型性能的数据，记录了生成的中文文本及其相应的评估指标。主要特征如下：...

ZIP

中文维基百科2019年文本数据集

2025年8月25日

中文维基百科2019年文本数据集_Chinese_Wikipedia_2019_Text_Dataset 数据来源：互联网公开数据标签：维基百科, 中文, 文本数据, 自然语言处理, 语料库, 文本分析, 语言模型, 知识图谱数据概述：该数据集包含来自2019年中文维基百科的文本数据，记录了维基百科上各种主题的中文文章内容。主要特征如下：...

ZIP

白俄罗斯语语音转录数据集

2025年8月15日

白俄罗斯语语音转录数据集_Belarusian_Speech_Transcription_Dataset 数据来源：互联网公开数据标签：语音识别, 语音转录, 语音合成, 声学模型, 语言模型, 白俄罗斯语, 语音数据, 深度学习数据概述：...

ZIP

多语言维基百科文章翻译质量评估数据集

2025年8月11日

多语言维基百科文章翻译质量评估数据集_Multilingual_Wikipedia_Article_Translation_Quality_Assessment 数据来源：互联网公开数据标签：机器翻译, 文本翻译, 语言模型, 文本质量评估, 多语言, 维基百科, 数据标注, 自然语言处理数据概述：...

ZIP

文本质量评估模型预测结果数据集

2025年8月10日

文本质量评估模型预测结果数据集_Text_Quality_Assessment_Model_Prediction_Results 数据来源：互联网公开数据标签：文本质量, 语言模型, 评估指标, 预测结果, 机器翻译, 自然语言处理, 数据分析, 模型训练数据概述：该数据集包含文本质量评估模型的预测结果以及相关参数。主要特征如下：...

ZIP

英语写作质量评估与预测数据集

2025年8月10日

英语写作质量评估与预测数据集_English_Writing_Quality_Assessment_and_Prediction_Dataset 数据来源：互联网公开数据标签：写作质量, 文本评估, 语言模型, 自然语言处理, 机器学习, 文本分析, 语法, 语义数据概述：...

ZIP

多语言蕴含关系推理数据集_Multilingual_Natural_Language_Inference_Dataset

2025年6月24日

多语言蕴含关系推理数据集_Multilingual_Natural_Language_Inference_Dataset 数据来源：互联网公开数据标签：自然语言处理, 文本推理, 语义理解, 多语言, 情感分析, 机器学习, 语言模型, 语料库数据概述：...

ZIP

语言流畅度评估多维度数据集

2025年7月19日

语言流畅度评估多维度数据集_Language_Fluency_Evaluation_Multi_dimensional_Dataset 数据来源：互联网公开数据标签：文本评估, 语言学, 写作质量, 自然语言处理, 机器学习, 语言模型, 文本分析, 语义理解数据概述：...

ZIP

机器翻译模型生成文本质量评估数据集

2025年8月3日

机器翻译模型生成文本质量评估数据集_Machine_Translation_Model_Text_Generation_Quality_Evaluation 数据来源：互联网公开数据标签：机器翻译, 文本生成, 文本评估, 对比分析, 自然语言处理, 语言模型, 文本质量, 评估指标数据概述：...

ZIP

文本流畅度评估多维度打分数据集

2025年7月29日

文本流畅度评估多维度打分数据集_Text_Fluency_Multi_dimensional_Scoring_Dataset 数据来源：互联网公开数据标签：文本评估, 语言模型, 文本分析, 多维度评分, 机器学习, 自然语言处理, 文本质量, 语料分析数据概述：...

ZIP

英语写作质量评估预测数据集

2025年7月11日

英语写作质量评估预测数据集_English_Writing_Quality_Assessment_and_Prediction 数据来源：互联网公开数据标签：写作质量, 文本评估, 自然语言处理, 机器学习, 深度学习, 语言模型, 文本分析, 英语数据概述：...

ZIP

文本流畅度预训练模型评估数据集

2025年7月10日

文本流畅度预训练模型评估数据集_Text_Fluency_Pre_training_Model_Evaluation_Dataset 数据来源：互联网公开数据标签：自然语言处理, 文本流畅度, 预训练模型, 语言模型, 文本评估, 机器学习, 模型训练, 文本分析数据概述：...

ZIP

学生英语写作质量评估数据集

2025年7月9日

学生英语写作质量评估数据集_Student_English_Writing_Quality_Assessment 数据来源：互联网公开数据标签：写作评估, 文本分析, 语言模型, 英语教育, 自然语言处理, 文本特征, 机器学习, 质量评价数据概述：...

ZIP

印地语语音转录数据集

2025年7月7日

印地语语音转录数据集_Hindi_Speech_Transcription_Dataset 数据来源：互联网公开数据标签：语音识别, 语音转录, 印地语, 声学模型, 语言模型, 语音数据集, 深度学习, 印度数据概述：该数据集包含来自多个来源的印地语语音数据，记录了印地语语音的音频文件及其对应的文本转录。主要特征如下：...

ZIP

孟加拉语文本标点纠正预测数据集

2025年7月7日

孟加拉语文本标点纠正预测数据集_Bangla_Text_Punctuation_Correction_Prediction_Dataset 数据来源：互联网公开数据标签：自然语言处理, 文本纠错, 标点符号, 机器学习, 文本生成, 序列标注, 语言模型, 孟加拉语数据概述：...

ZIP

文本改写提示语数据集

2025年7月6日

文本改写提示语数据集_Text_Rewriting_Prompts 数据来源：互联网公开数据标签：文本生成, 提示工程, 自然语言处理, 文本编辑, 语言模型, 数据标注, 文本转换, 零样本学习数据概述：该数据集包含用于文本改写任务的提示语，记录了多种文本改写指令，旨在引导语言模型生成不同风格和语境的文本。主要特征如下：...

ZIP

写作质量评估多维度打分数据集

2025年6月30日

写作质量评估多维度打分数据集_Writing_Quality_Multi_dimensional_Scoring_Dataset 数据来源：互联网公开数据标签：写作评估, 文本分析, 语言模型, 机器学习, 文本质量, 语法, 连贯性, 词汇数据概述：该数据集包含用于写作质量评估的数据，记录了文本在多个维度上的评分结果。主要特征如下：...

ZIP

文本质量评估数据集_Text_Quality_Assessment_Dataset

2025年6月25日

文本质量评估数据集_Text_Quality_Assessment_Dataset 数据来源：互联网公开数据标签：文本分析, 写作质量, 语言模型, 文本特征, 机器学习, 文本评估, 自然语言处理, 交叉验证数据概述：该数据集包含多个CSV文件，每个文件对应一个交叉验证折叠（cross-validation...