-
ASE2021上下文感知代码变更嵌入补丁正确性评估数据集
2026年1月30日 30 13 1
数据集概述 本数据集是论文“Context-Aware Code Change Embedding for Better Patch Correctness Assessment”的配套数据,包含实验所用补丁基准、实验结果文件及模型源代码。补丁分为Small和Large两类,结果覆盖RQ1和RQ2研究问题,支持补丁正确性评估模型的验证与分析。 文件详解...
-
GMHP7k_Based_德语社交媒体厌女症仇恨言论标注语料库数据
2026年1月27日 30 120 93
数据集概述 本数据集为GMHP7k德语厌女症仇恨言论语料库,包含社交媒体平台用户发布的7061条帖子。由志愿者对每条帖子进行仇恨言论和厌女症仇恨言论的二元标注,Fleiss' Kappa标注者间信度分别为0.6409和0.8258,同时提供基于BERT模型的基线分类结果,仇恨言论和厌女症仇恨言论宏平均F1-score最高达0.79和0.75。 文件详解...
-
GitHub_Based_代码审查LLM重要性过滤模型训练与预测数据
2026年1月23日 30 8 4
数据集概述 本数据集为722作业项目数据,包含1500条GitHub PR评论标注数据、BERT模型微调代码、训练后的最优模型及评论重要性预测与邮件通知代码,旨在通过LLM模型实现PR评论的重要性过滤,提升代码审查效率。 文件详解 数据文件 文件名称:1500data.xlsx 文件格式:XLSX 字段映射介绍:包含3人标注的1500条GitHub...
-
MentalHealth_SocialNetworks_Based_社交媒体心理健康评论多维度标注数据集
2025年12月31日 30 35 26
数据集概述 本数据集包含两个Excel文件及相关文档、代码,核心为社交媒体心理健康评论标注数据。数据源自Instagram平台名人心理健康披露相关帖子的评论,共2287条,分别标注了极性、污名属性及情感类别,同时提供机器学习分类模型代码,支持社交媒体心理健康相关文本分析研究。 文件详解 数据文件 文件名称:DatasetMH.xlsx...
-
英语作文评分预测数据集
2025年10月3日 30 101 23
英语作文评分预测数据集_English_Essay_Score_Prediction 数据来源:互联网公开数据 标签:作文评分, 文本分析, 深度学习, 自然语言处理, BERT模型, 写作评估, 情感分析, 机器学习 数据概述: 该数据集包含用于英语作文评分预测的数据,其中核心数据为一篇英语作文的ID以及其对应的分数。主要特征如下:...
-
餐饮评价情感分析数据集
2025年8月26日 30 179 21
餐饮评价情感分析数据集_Restaurant_Review_Sentiment_Analysis 数据来源:互联网公开数据 标签:情感分析, 文本分类, 餐饮评价, 自然语言处理, 深度学习, 评论数据, 中文文本, BERT模型 数据概述:...
-
中文餐饮评论情感分析数据集
2025年8月19日 30 2 0
中文餐饮评论情感分析数据集_Chinese_Restaurant_Review_Sentiment_Analysis_Dataset 数据来源:互联网公开数据 标签:情感分析, 文本分类, 评论数据, 餐饮行业, BERT模型, 深度学习, 自然语言处理, 数据集 数据概述:...
-
学术论文写作结构要素识别预测数据集
2025年8月17日 30 29 21
学术论文写作结构要素识别预测数据集_Academic_Paper_Writing_Structure_Element_Recognition_Prediction 数据来源:互联网公开数据 标签:自然语言处理, 文本分类, 论文写作, 结构分析, 机器学习, BERT模型, 语料库, 数据标注 数据概述:...
-
问答对话生成模型训练数据集
2025年7月30日 30 53 47
问答对话生成模型训练数据集_Question_Answering_Dialogue_Generation_Model_Training_Dataset 数据来源:互联网公开数据 标签:自然语言处理, 文本生成, 问答系统, 对话生成, BERT模型, 预训练模型, 机器学习, 数据集构建 数据概述:...
-
学术论文写作结构识别预测数据集_Academic_Paper_Writing_Structure_Identification_Prediction
2025年6月27日 30 168 111
学术论文写作结构识别预测数据集_Academic_Paper_Writing_Structure_Identification_Prediction 数据来源:互联网公开数据 标签:自然语言处理, 文本分析, 深度学习, 论文写作, 结构识别, 文本标注, BERT模型, 多分类 数据概述:...
-
自然语言处理BERT模型训练测试数据集NaturalLanguageProcessingBERTModelTrainingandTestingDatase...
2025年5月30日 30 23 3
自然语言处理BERT模型训练测试数据集NaturalLanguageProcessingBERTModelTrainingandTestingDataset-qifengsu 数据来源:互联网公开数据 标签:自然语言处理, BERT模型, 文本序列, 机器学习, 深度学习, 预训练模型, 文本编码, 数据集 数据概述:...
-
特征BERT嵌入数据集FeatureBERTEmbeddingsDataset-honglyu
2025年5月30日 30 70 60
特征BERT嵌入数据集FeatureBERTEmbeddingsDataset-honglyu 数据来源:互联网公开数据 标签:自然语言处理,BERT模型,特征嵌入,数据集,深度学习,文本分析,机器学习,语义理解 数据概述: 该数据集包含使用BERT模型生成的文本特征嵌入数据,记录了文本输入在BERT模型中的特征表示。主要特征如下:...
-
中文文本情感分析训练数据集ChineseTextSentimentAnalysisTrainingData-zhangkaihua88
2025年5月30日 30 55 10
中文文本情感分析训练数据集ChineseTextSentimentAnalysisTrainingData-zhangkaihua88 数据来源:互联网公开数据 标签:文本情感分析, 情感分类, 机器学习, 自然语言处理, 情感标注, 中文文本, 深度学习, BERT模型 数据概述:...
-
BERT模型测试数据集BERTDataTestDataset-vha20020362
2025年5月29日 30 193 172
BERT模型测试数据集BERTDataTestDataset-vha20020362 数据来源:互联网公开数据 标签:自然语言处理,BERT模型,数据集,机器学习,文本分析,语言模型,深度学习,人工智能 数据概述: 该数据集包含用于测试BERT模型性能的文本数据,记录了各种类型的文本样本及其标签。主要特征如下: 时间跨度:数据记录的时间范围为当前年份。...
-
BERT模型渐进式提示数据集BERTProgressivePromptsDataset-neffow
2025年5月29日 30 137 100
BERT模型渐进式提示数据集BERTProgressivePromptsDataset-neffow 数据来源:互联网公开数据 标签:自然语言处理, BERT模型, 数据集, 机器学习, 语言模型, 深度学习, 文本分析, 人工智能 数据概述:...
-
教育内容文本相似度分析训练数据集EducationalContentTextSimilarityAnalysisTrainingData-dmitriygerasimov
2025年5月28日 30 38 36
教育内容文本相似度分析训练数据集EducationalContentTextSimilarityAnalysisTrainingData-dmitriygerasimov 数据来源:互联网公开数据 标签:文本相似度, 教育, 课程, 文本分类, 自然语言处理, 机器学习, BERT模型, 语义理解 数据概述:...
-
社交媒体评论情感分析预测数据集SocialMediaCommentSentimentAnalysisPrediction-handudu
2025年5月28日 30 124 81
社交媒体评论情感分析预测数据集SocialMediaCommentSentimentAnalysisPrediction-handudu 数据来源:互联网公开数据 标签:情感分析, 文本分类, 社交媒体, 评论数据, 自然语言处理, 机器学习, 深度学习, BERT模型 数据概述:...
-
多语言恶意评论检测数据集MultilingualToxicCommentDetectionDataset-glkuzi
2025年5月28日 30 97 83
多语言恶意评论检测数据集MultilingualToxicCommentDetectionDataset-glkuzi 数据来源:互联网公开数据 标签:文本分类, 恶意评论, 多语言, 深度学习, 自然语言处理, 情感分析, 数据标注, BERT模型 数据概述:...
-
BERT预训练模型中文数据集BERTPretrainingModelChineseDataset-vedavikassriramadasu
2025年5月18日 30 59 50
BERT预训练模型中文数据集BERTPretrainingModelChineseDataset-vedavikassriramadasu 数据来源:互联网公开数据 标签:自然语言处理,BERT模型,预训练数据,机器学习,文本分析,深度学习,语言理解,数据集 数据概述: 该数据集包含用于BERT(Bidirectional Encoder...
-
生物医学BERT模型COVID-19文本嵌入数据集BioBERT-COVIDEmbeddingsDataset-sourojit
2025年5月17日 30 47 16
生物医学BERT模型COVID-19文本嵌入数据集BioBERT-COVIDEmbeddingsDataset-sourojit 数据来源:互联网公开数据 标签:生物医学,自然语言处理,COVID-19,文本嵌入,深度学习,机器学习,BERT模型,信息检索 数据概述:...



