-
-
合成引言数据集
合成引言数据集 数据来源:互联网公开数据 标签:合成文本,机器学习,生成模型,自然语言处理,分类任务,引言生成,深度学习 数据概述: 本数据集包含用于生成分类任务的小型复杂数据集,适用于大语言模型(LLM)生成人类风格引言的研究和验证。数据集包括500条真实引言(490条训练,10条验证)以及通过mistral-... -
螃蟹年龄合成训练数据集
螃蟹年龄合成训练数据集 数据来源:互联网公开数据 标签:螃蟹,年龄预测,合成数据,机器学习,训练集,特征工程,时间序列 数据概述: 本数据集是为 Playground Series Season3 Episode16 的训练任务额外提供的合成数据。数据由“Make Synthetic Crab Age... -
合成蟹类数据集
合成蟹类数据集 数据来源:互联网公开数据 标签:合成数据,蟹类,平衡数据集,机器学习,数据竞赛 数据概述: 本数据集是由特定Notebook生成的合成蟹类数据,旨在提供一个平衡的数据集用于数据分析和机器学习竞赛。该数据集基于原始收集的数据生成,确保了类别之间的均衡分布,适用于各种分类和回归分析任务。 数据用途概述:... -
综合园艺维基数据集
综合园艺维基数据集 数据来源:互联网公开数据 标签:园艺,维基,植物学,合成数据,语义分离,自然语言处理,测试数据,机器学习 数据概述: 本数据集是一个实验性的合成数据集,基于小型维基百科中关于园艺和植物学的条目集合。数据内容由Claude... -
-
文本标点符号校正数据集
文本标点符号校正数据集_Text_Punctuation_Correction_Dataset 数据来源:互联网公开数据 标签:文本处理, 自然语言处理, 标点符号, 文本校正, 数据标注, 机器学习, 语料库, 文本分析 数据概述: 该数据集包含来自公开文本的数据,记录了用于文本标点符号校正的语料。主要特征如下:... -
工程符号数据集
工程符号数据集 数据来源:互联网公开数据 标签:工程符号,图像识别,目标检测,机器学习,数据标注,PDF处理 数据概述: 本数据集包含近1000张标注并框选的图像,涉及少于250种工程符号。每种符号均经过三次旋转处理(分别对应北、南、东、西四个方向,其中北方向为原始方向),旨在提高模型的鲁棒性。 数据用途概述:... -
贝叶斯网络自然语言解释文本数据集
贝叶斯网络自然语言解释文本数据集 数据来源:互联网公开数据 标签:贝叶斯网络,自然语言解释,可解释AI,文本分析,机器学习,语料库,语言学,解释生成 数据概述: 本数据集,即ExBAN语料库(Explanations for BAyesian... -
问答平台问题点赞数预测数据集
问答平台问题点赞数预测数据集 数据来源:互联网公开数据 标签:问答平台,用户行为分析,点赞预测,机器学习,自然语言处理,声誉,用户互动,数据挖掘 数据概述:... -
电商平台用户流失预测数据集
电商平台用户流失预测数据集 数据来源:互联网公开数据 标签:电商,用户流失,客户行为,预测分析,机器学习,客户细分,营销策略 数据概述: 本数据集包含了一个电商平台的用户信息,旨在分析和预测用户流失。数据包含5,630条用户记录,涵盖了20个特征,全面反映了用户的行为、偏好和参与度指标。 关键特征: CustomerID:每个用户的唯一标识符... -
-
-
宝可梦统计数据集
宝可梦统计数据集 数据来源:互联网公开数据 标签:宝可梦,游戏数据,统计分析,机器学习,回归,分类,数据可视化,教育培训 数据概述: 本数据集包含41个字段和801行数据,涵盖了所有宝可梦的各项统计信息。数据集详细记录了宝可梦的名称、类型、生命值、攻击力、防御力、特殊攻击力、特殊防御力、速度等关键属性,适用于各种数据分析任务。 数据用途概述:... -
-
梵语史诗摩诃婆罗多和罗摩衍那诗句英译数据集
梵语史诗摩诃婆罗多和罗摩衍那诗句英译数据集 数据来源:互联网公开数据 标签:梵语, 史诗, 翻译, 语言学, 文本, 诗歌, 语料库, 机器学习, 文本生成 数据概述: 本数据集是一个梵语-英语翻译语料库,包含了从M. N.... -
预测模型目标变量预测结果数据集
预测模型目标变量预测结果数据集_Predictive_Model_Target_Variable_Prediction_Results 数据来源:互联网公开数据 标签:预测模型, 目标变量, 回归分析, 数据预测, 机器学习, 模型评估, 数据分析, 结果提交 数据概述: 该数据集包含一个预测模型的目标变量预测结果。主要特征如下:... -
四次多项式随机变量数据集
四次多项式随机变量数据集 数据来源:互联网公开数据 标签:多项式回归,随机变量,噪声,数据分析,机器学习,统计建模 数据概述: 本数据集包含两个涉及随机变量及其噪声的四次多项式数据集。第一个数据集(dataset3.xlsx)由单一随机变量X生成,X遵循均值为0.25、标准差为7/12的正态分布。通过对X应用四次多项式P(x) = x + 2x^2 -...