-
Gemma模型微调综合编码数据集-malakafaqahmad
Gemma模型微调综合编码数据集-malakafaqahmad 数据来源:互联网公开数据 标签:编码,数据集,机器学习,自然语言处理,Gemma,模型微调,代码生成,代码理解 数据概述:该数据集包含用于Gemma模型微调的综合编码数据,旨在提升模型在代码生成、代码理解等任务上的表现。主要特征如下:... -
文本偏见分析与消除数据集TextBiasAnalysisandMitigationDataset-sayakchowdhury99
文本偏见分析与消除数据集TextBiasAnalysisandMitigationDataset-sayakchowdhury99 数据来源:互联网公开数据 标签:文本偏见, 偏见检测, 文本分析, 机器学习, 自然语言处理, 数据集构建, 公平性, 伦理 数据概述:... -
阿拉伯新闻文章标题生成数据集-oussamaseffai
阿拉伯新闻文章标题生成数据集-oussamaseffai 数据来源:互联网公开数据 标签:自然语言处理,文本生成,阿拉伯语,标题生成,机器学习,新闻文章,语言模型,NLP 数据概述: 该数据集包含了阿拉伯语新闻文章及其对应的标题,用于训练和评估阿拉伯语新闻标题生成模型。主要特征如下: 时间跨度:数据记录的时间范围未明确,但涵盖了近期的新闻文章。... -
人工智能写作检测与校对数据集AIWritingDetectionandCorrectionDataset-gauravbrills
人工智能写作检测与校对数据集AIWritingDetectionandCorrectionDataset-gauravbrills 数据来源:互联网公开数据 标签:人工智能, 文本分析, 写作评估, 机器写作, 语言模型, 文本校对, 教育, 自然语言处理 数据概述:... -
越南语文本事实核查数据集VietnameseTextFactVerificationDataset-nguynhngha
越南语文本事实核查数据集VietnameseTextFactVerificationDataset-nguynhngha 数据来源:互联网公开数据 标签:事实核查, 自然语言处理, 文本蕴含, 越南语, 多文档推理, 文本分类, 机器学习, 语料库 数据概述:... -
中文OCR识别数据集-jianse
中文OCR识别数据集-jianse 数据来源:互联网公开数据 标签:OCR,光学字符识别,数据集,图像处理,深度学习,文本识别,中文,自然语言处理 数据概述:该数据集包含用于中文OCR(光学字符识别)任务的图像和对应的文本标注数据。主要特征如下: 时间跨度:数据集涵盖了不同时间段的中文文本图像。... -
训练集翻译数据集TrainingSetTranslationsDataset-franciscomisa
训练集翻译数据集TrainingSetTranslationsDataset-franciscomisa 数据来源:互联网公开数据 标签:翻译,数据集,自然语言处理,机器学习,多语言,文本处理,语言模型,人工智能 数据概述: 该数据集包含来自多个公开来源的翻译训练数据,记录了多种语言之间的翻译对。主要特征如下:... -
UNIN大学毕业论文数据集UNINDatasetforGraduationThesis-dgomez216
UNIN大学毕业论文数据集UNINDatasetforGraduationThesis-dgomez216 数据来源:互联网公开数据 标签:毕业论文,学术研究,自然语言处理,文本分析,数据集,西班牙语,文本挖掘,学术资源 数据概述: 该数据集包含来自哥伦比亚 UNIN 大学(Universidad Internacional del... -
个人信息识别与脱敏数据处理数据集PIIExtrasDataset-stochoshi
个人信息识别与脱敏数据处理数据集PIIExtrasDataset-stochoshi 数据来源:互联网公开数据 标签:数据隐私,个人信息,脱敏处理,数据集,机器学习,自然语言处理,数据安全,信息识别 数据概述: 该数据集包含来自多个来源的个人信息数据,记录了各类文本中个人身份信息(PII)的识别与脱敏处理。主要特征如下:... -
骨骼解剖与问答数据集SkeletalAnatomyQuestionAnsweringDataset-gokulkarthik
骨骼解剖与问答数据集SkeletalAnatomyQuestionAnsweringDataset-gokulkarthik 数据来源:互联网公开数据 标签:解剖学, 问答系统, 文本生成, 机器翻译, 知识图谱, 自然语言处理, 多语言, 数据集 数据概述:... -
图像文本识别训练数据集ImageTextRecognitionTrainingDataset-srndon
图像文本识别训练数据集ImageTextRecognitionTrainingDataset-srndon 数据来源:互联网公开数据 标签:图像识别, 文本识别, OCR, 数据标注, 计算机视觉, 深度学习, 图像处理, 自然语言处理 数据概述:... -
情感分析与情感价值评估数据集EVA-FinalSentimentAnalysisandSentimentValueEvaluationDataset-xaoyang
情感分析与情感价值评估数据集EVA-FinalSentimentAnalysisandSentimentValueEvaluationDataset-xaoyang 数据来源:互联网公开数据 标签:情感分析,数据集,自然语言处理,机器学习,文本挖掘,情感计算,数据科学,人工智能 数据概述:... -
数据库SQL语句生成与解析数据集DatabaseSQLGenerationandParsingDataset-saadaouiossama
数据库SQL语句生成与解析数据集DatabaseSQLGenerationandParsingDataset-saadaouiossama 数据来源:互联网公开数据 标签:SQL, 数据库, 自然语言处理, 文本生成, 语义理解, 数据分析, 机器学习, 数据库查询 数据概述:... -
清洗后的电子邮件数据集-ashishgoraniya
清洗后的电子邮件数据集-ashishgoraniya 数据来源:互联网公开数据 标签:电子邮件,数据集,文本分析,自然语言处理,垃圾邮件检测,信息检索,情感分析,数据清洗 数据概述: 该数据集包含了经过清洗的电子邮件数据,主要用于文本分析和自然语言处理任务。主要特征如下: 时间跨度:数据记录的时间跨度不明确,取决于原始邮件的时间范围。... -
孟加拉语语音识别句子数据集BengaliSpeechRecognitionSentenceDataset-sadib2506
孟加拉语语音识别句子数据集BengaliSpeechRecognitionSentenceDataset-sadib2506 数据来源:互联网公开数据 标签:语音识别, 孟加拉语, 语音数据, 文本数据, 语音转录, 自然语言处理, 深度学习, 声学模型 数据概述:... -
电影评论情感分析数据集MovieReviewSentimentAnalysis-mosesmoncy
电影评论情感分析数据集MovieReviewSentimentAnalysis-mosesmoncy 数据来源:互联网公开数据 标签:情感分析, 文本分类, 自然语言处理, 电影评论, 情感极性, 机器学习, 影评, 数据标注 数据概述: 该数据集包含来自互联网的电影评论数据,记录了电影评论文本及其对应的情感极性标签。主要特征如下:... -
房地产投资基金公告文本分析数据集RealEstateInvestmentFundsAnnouncementTextAnalysisDataset-fran...
房地产投资基金公告文本分析数据集RealEstateInvestmentFundsAnnouncementTextAnalysisDataset-franckepeixoto 数据来源:互联网公开数据 标签:房地产, 基金, 公告, 文本分析, 财务报告, 市场研究, 巴西, 自然语言处理 数据概述:... -
CNN新闻摘要语料库Tokenized数据集-ivanzhytkevych
CNN新闻摘要语料库Tokenized数据集-ivanzhytkevych 数据来源:互联网公开数据 标签:新闻摘要,文本摘要,自然语言处理,深度学习,机器翻译,数据集,文本分析,NLP 数据概述: 该数据集包含来自CNN新闻的文本数据,主要用于文本摘要任务。主要特征如下: 时间跨度:数据记录的时间范围涵盖了新闻发布的时间段,具体时间范围未明确。... -
法律文本分词数据集BKAILegalCorpusSegmentedDataset-lamtruong1594
法律文本分词数据集BKAILegalCorpusSegmentedDataset-lamtruong1594 数据来源:互联网公开数据 标签:法律文本,数据集,分词,自然语言处理,文本分析,机器学习,法律研究,语义理解 数据概述: 该数据集包含来自BKAI机构提供的法律文本数据,记录了已分词的法律文本内容。主要特征如下:... -
推特用户自杀倾向数据集SuicideTweetDataset-duybuingoc
推特用户自杀倾向数据集SuicideTweetDataset-duybuingoc 数据来源:互联网公开数据 标签:社交媒体,推特,自杀倾向,文本分析,自然语言处理,情感分析,机器学习,心理健康 数据概述: 该数据集包含了从推特(Twitter)上收集的用户推文数据,旨在用于研究和分析用户自杀倾向。主要特征如下:...