-
虚假新闻检测文本数据集FakeNewsDetectionTextDataset-sherifsamyabdelkarem
虚假新闻检测文本数据集FakeNewsDetectionTextDataset-sherifsamyabdelkarem 数据来源:互联网公开数据 标签:虚假新闻, 文本分类, 新闻标题, 新闻内容, 自然语言处理, 机器学习, 舆情分析, 文本情感 数据概述:... -
社交媒体情感分析负面情感文本数据集SocialMediaSentimentAnalysisNegativeTextCorpus-mariaeremeeva
社交媒体情感分析负面情感文本数据集SocialMediaSentimentAnalysisNegativeTextCorpus-mariaeremeeva 数据来源:互联网公开数据 标签:情感分析, 文本分类, 负面情绪, 社交媒体, 文本数据, 自然语言处理, 机器学习, 数据标注 数据概述:... -
跨编码器数据集Cross-EncoderDataset-epsilon12345
跨编码器数据集Cross-EncoderDataset-epsilon12345 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本匹配,语义相似度,信息检索,深度学习,模型训练,语言模型 数据概述: 该数据集包含了用于训练和评估跨编码器模型的数据,主要用于提升文本匹配和语义理解的性能。主要特征如下:... -
虚假新闻分类数据集FakeNewsClassificationDataset-rahilmerchant
虚假新闻分类数据集FakeNewsClassificationDataset-rahilmerchant 数据来源:互联网公开数据 标签:虚假新闻,数据集,文本分类,自然语言处理,机器学习,社交媒体,信息验证,新闻分析 数据概述:... -
NIT项目-自然语言处理数据集NITProject-NaturalLanguageProcessingDataset-peculiarview
NIT项目-自然语言处理数据集NITProject-NaturalLanguageProcessingDataset-peculiarview 数据来源:互联网公开数据 标签:自然语言处理,NLP,数据集,文本分析,机器翻译,情感分析,信息抽取,文本分类 数据概述: 该数据集由NIT项目提供,包含了多种自然语言处理任务的文本数据。主要特征如下:... -
IBMDebater论点句子搜索数据集IBMDebaterClaimSentencesSearchDataset-kaggleqrdl
IBMDebater论点句子搜索数据集IBMDebaterClaimSentencesSearchDataset-kaggleqrdl 数据来源:互联网公开数据 标签:自然语言处理,文本挖掘,数据集,论点识别,机器学习,语义分析,学术研究,文本分类 数据概述: 该数据集来源于IBM Debater项目,专注于从文本中提取和识别论点句子。主要特征如下:... -
印地语-英语平行语料库数据集-harshityadavjnu
印地语-英语平行语料库数据集-harshityadavjnu 数据来源:互联网公开数据 标签:机器翻译,自然语言处理,印地语,英语,语料库,语言学,文本分析,跨语言 数据概述:该数据集包含印地语和英语的平行文本数据,旨在用于机器翻译、跨语言信息检索等任务。主要特征如下: 时间跨度:数据记录的时间跨度不明确,取决于语料库的收集时间。... -
人机对话大型语言模型数据集NewHuman-LLMDataset-hozaifazaki99
人机对话大型语言模型数据集NewHuman-LLMDataset-hozaifazaki99 数据来源:互联网公开数据 标签:人机对话,大型语言模型,数据集,自然语言处理,对话生成,情感分析,文本理解,人工智能 数据概述: 该数据集包含人与大型语言模型(LLM)之间的对话记录,旨在促进对LLM在各种对话场景下的性能评估和改进。主要特征如下:... -
大型语言模型版本三按来源拆分数据集LLMV3SplitbySourceDataset-saiyan1202
大型语言模型版本三按来源拆分数据集LLMV3SplitbySourceDataset-saiyan1202 数据来源:互联网公开数据 标签:自然语言处理,数据集,机器学习,语言模型,数据拆分,文本分析,人工智能,模型训练 数据概述: 该数据集为大型语言模型版本三(LLM V3)的数据集,按照数据来源进行拆分,记录了不同来源的文本数据。主要特征如下:... -
法律案例裁判文书数据集LegalCaseJudgmentDocumentsDataset-thnhan3011
法律案例裁判文书数据集LegalCaseJudgmentDocumentsDataset-thnhan3011 数据来源:互联网公开数据 标签:法律研究,司法数据,数据集,机器学习,自然语言处理,人工智能,案例分析,裁判文书 数据概述: 该数据集包含来自中国各级法院的法律案例裁判文书数据,记录了各类案件的详细信息。主要特征如下:... -
灾害推文文本嵌入数据集DisasterTweetsTextEmbeddingsDataset-askaraitzhan
灾害推文文本嵌入数据集DisasterTweetsTextEmbeddingsDataset-askaraitzhan 数据来源:互联网公开数据 标签:灾害管理,社交媒体,文本分析,自然语言处理,机器学习,情感分析,危机响应,社会研究 数据概述:... -
学生学术写作评价数据集DF-LLM-StudentDataset-alvaromendizabal
学生学术写作评价数据集DF-LLM-StudentDataset-alvaromendizabal 数据来源:互联网公开数据 标签:学术写作,数据集,自然语言处理,LLM,文本分析,教育,写作评估,机器学习 数据概述: 该数据集包含来自不同学生的学术写作样本,旨在用于评估和改进学生学术写作能力。主要特征如下:... -
真实与虚假新闻数据集RealandFakeNewsDataset-hruturajbabar
真实与虚假新闻数据集RealandFakeNewsDataset-hruturajbabar 数据来源:互联网公开数据 标签:新闻分析,数据集,文本分类,机器学习,信息传播,媒体研究,自然语言处理,社会研究 数据概述: 该数据集包含来自公开新闻来源的真实与虚假新闻数据,记录了新闻文本内容及相关信息。主要特征如下:... -
SquadV2增强比例检查数据集SquadV2AugmentedProportionCheckDataset-lachonman2
SquadV2增强比例检查数据集SquadV2AugmentedProportionCheckDataset-lachonman2 数据来源:互联网公开数据 标签:自然语言处理,问答系统,数据集,文本增强,机器学习,数据质量,自动化评估,深度学习 数据概述: 该数据集基于Squad... -
通用拼音输入法词库数据集GPNUAllWordsDataset-nazmuddhohaansary
通用拼音输入法词库数据集GPNUAllWordsDataset-nazmuddhohaansary 数据来源:互联网公开数据 标签:词库,输入法,数据集,中文,自然语言处理,语言资源,文本处理,机器学习 数据概述: 该数据集包含通用拼音输入法(GPNU)的完整词库数据,记录了中文词语及其对应的拼音信息。主要特征如下:... -
英语文档学习与研究数据集LECREnglishDocumentsDataset-gabrielbchacon
英语文档学习与研究数据集LECREnglishDocumentsDataset-gabrielbchacon 数据来源:互联网公开数据 标签:英语文档,数据集,语言学,自然语言处理,机器学习,文本分析,教育,学术研究 数据概述:... -
DRCAT文本摘要数据集DRCATDatasetwithReferenceText-hozaifazaki99
DRCAT文本摘要数据集DRCATDatasetwithReferenceText-hozaifazaki99 数据来源:互联网公开数据 标签:文本摘要,数据集,自然语言处理,机器翻译,深度学习,文本分析,语言模型,信息检索 数据概述: 该数据集包含来自DRCAT(Dynamic Relation-based Content Adaptation... -
文本生成与真伪识别平衡数据集TextGeneration-AuthenticityBalancedDataset-nju123
文本生成与真伪识别平衡数据集TextGeneration-AuthenticityBalancedDataset-nju123 数据来源:互联网公开数据 标签:文本生成, 自然语言处理, 文本分类, 真伪辨别, 数据平衡, 机器写作, 语料分析, 深度学习 数据概述: 该数据集包含来自文本生成任务的数据,记录了文本内容及其生成状态。主要特征如下:... -
扩散模型数据库元数据分割数据集DiffusionDBMetadataSplitCSVsDataset-motono0223
扩散模型数据库元数据分割数据集DiffusionDBMetadataSplitCSVsDataset-motono0223 数据来源:互联网公开数据 标签:扩散模型,元数据,数据集,机器学习,深度学习,图像生成,自然语言处理,计算机视觉 数据概述: 该数据集为扩散模型数据库的元数据分割数据集,记录了扩散模型训练和测试所需的元数据信息。主要特征如下:... -
科技新闻文本分类数据集TechnologyNewsTextClassificationDataset-bahodirmaydonov
科技新闻文本分类数据集TechnologyNewsTextClassificationDataset-bahodirmaydonov 数据来源:互联网公开数据 标签:文本分类, 新闻摘要, 科技新闻, 自然语言处理, 机器翻译, 情感分析, 数据标注, 乌兹别克语 数据概述:...