-
虚假新闻预处理数据集-gongjunmin
虚假新闻预处理数据集-gongjunmin 数据来源:互联网公开数据 标签:虚假新闻,文本分析,自然语言处理,数据集,机器学习,新闻分类,信息检索,舆情分析 数据概述: 该数据集包含了经过预处理的虚假新闻数据,旨在用于文本分析和自然语言处理任务。主要特征如下: 时间跨度:数据记录的时间范围涵盖近年来新闻报道。... -
arXiv论文集增强版包含文体特征数据集arXivDatasetEnhancedwithStylometricFeatures-desaraxhura
arXiv论文集增强版包含文体特征数据集arXivDatasetEnhancedwithStylometricFeatures-desaraxhura 数据来源:互联网公开数据 标签:学术研究,文体分析,数据集,机器学习,文本挖掘,自然语言处理,信息检索,数据科学 数据概述:... -
图像描述生成数据集ImageCaptioningDataset-amank4212
图像描述生成数据集ImageCaptioningDataset-amank4212 数据来源:互联网公开数据 标签:图像识别, 自然语言处理, 图像描述, 计算机视觉, 深度学习, 数据集, 文本生成, 多模态 数据概述: 该数据集包含图片及其对应的描述文本,旨在用于图像描述生成任务。主要特征如下: 时间跨度:数据未标明具体时间,视作静态数据集使用。... -
DAGI-DAUC-GPT3-5语言模型评估数据集DAGI-DAUC-GPT3-5LanguageModelEvaluationDataset-aleron751
DAGI-DAUC-GPT3-5语言模型评估数据集DAGI-DAUC-GPT3-5LanguageModelEvaluationDataset-aleron751 数据来源:互联网公开数据 标签:自然语言处理,语言模型,数据集,机器学习,文本生成,模型评估,人工智能,深度学习 数据概述: 该数据集包含来自DAGI-... -
心理健康论坛文本情感分析数据集MentalHealthForumTextSentimentAnalysis-mohammad4tef
心理健康论坛文本情感分析数据集MentalHealthForumTextSentimentAnalysis-mohammad4tef 数据来源:互联网公开数据 标签:心理健康, 情感分析, 文本分类, 社交媒体, BPD, 论坛数据, 自然语言处理, 情感识别 数据概述:... -
十万条带噪声印度英语语音数据集10LakhNoisyIndianEnglishSpeechDataset-prasta4
十万条带噪声印度英语语音数据集10LakhNoisyIndianEnglishSpeechDataset-prasta4 数据来源:互联网公开数据 标签:语音识别,数据集,印度英语,噪声,声学模型,机器学习,语音处理,自然语言处理 数据概述: 该数据集包含来自印度的英语语音数据,记录了在各种噪声环境下的语音样本。主要特征如下:... -
学生写作评估与生成文本数据集StudentEssayAssessmentandGeneratedTextDataset-conjuring92
学生写作评估与生成文本数据集StudentEssayAssessmentandGeneratedTextDataset-conjuring92 数据来源:互联网公开数据 标签:文本生成, 写作评估, 机器学习, 自然语言处理, 文本分析, 情感分析, 教育, 写作风格 数据概述:... -
写作过程与行为分析数据集LinkingWritingProcessDataset-taichikondo
写作过程与行为分析数据集LinkingWritingProcessDataset-taichikondo 数据来源:互联网公开数据 标签:写作过程,行为分析,数据集,教育技术,自然语言处理,机器学习,写作研究,认知科学 数据概述: 该数据集记录了写作过程中的用户行为和文本生成数据,用于分析写作行为模式与文本质量的关系。主要特征如下:... -
疫情情感分析数据集EpidemicSituationSentimentAnalysisDataset-guojinxu
疫情情感分析数据集EpidemicSituationSentimentAnalysisDataset-guojinxu 数据来源:互联网公开数据 标签:疫情,情感分析,数据集,自然语言处理,机器学习,公共卫生,文本挖掘,社会研究 数据概述: 该数据集包含来自疫情期间的网络文本数据,记录了公众对疫情事件的情感和观点表达。主要特征如下:... -
医学图像问答数据集MedicalImageQuestionAnsweringDataset-samsrithajalukuri
医学图像问答数据集MedicalImageQuestionAnsweringDataset-samsrithajalukuri 数据来源:互联网公开数据 标签:医学影像, 图像问答, 深度学习, 自然语言处理, 图像识别, 知识图谱, 医学教育, 图像标注 数据概述:... -
多模态分析数据集DAISSEMultimodalAnalysisDataset-avnimittal
多模态分析数据集DAISSEMultimodalAnalysisDataset-avnimittal 数据来源:互联网公开数据 标签:多模态数据,数据分析,机器学习,人工智能,图像处理,自然语言处理,模式识别,计算机视觉 数据概述: 该数据集包含来自DAISSE项目的多模态数据,记录了结合图像、文本、声音等多种数据类型的综合信息。主要特征如下:... -
Reddit问答社区帖子数据集AskRedditDataset-gaganagarwal77
Reddit问答社区帖子数据集AskRedditDataset-gaganagarwal77 数据来源:互联网公开数据 标签:问答社区,数据集,社交媒体,文本分析,自然语言处理,机器学习,网络行为,数据挖掘 数据概述:... -
堤坝巡查与管理文本数据集LeveePatrolandManagementTextDataset-ictworld
堤坝巡查与管理文本数据集LeveePatrolandManagementTextDataset-ictworld 数据来源:互联网公开数据 标签:堤坝, 巡查, 管理, 水利, 文本分析, 自然语言处理, 越南语, 法规文件, 风险管理 数据概述: 该数据集包含来自越南相关法规文件的文本数据,记录了关于堤坝巡查与管理的相关规定和指导方针。主要特征如下:... -
俄罗斯地址信息结构化数据集RussianAddressStructuredDataset-zokost
俄罗斯地址信息结构化数据集RussianAddressStructuredDataset-zokost 数据来源:互联网公开数据 标签:地址解析, 地理信息, 文本挖掘, 结构化数据, 俄罗斯, 数据清洗, 自然语言处理, 机器学习 数据概述: 该数据集包含来自俄罗斯地区的地址信息,旨在用于地址标准化、地理编码和相关数据分析任务。主要特征如下:... -
音频腌黄瓜数据集PicklesforAudioofMELDDataset-xylarwardhan
音频腌黄瓜数据集PicklesforAudioofMELDDataset-xylarwardhan 数据来源:互联网公开数据 标签:音频数据,情感识别,数据集,自然语言处理,机器学习,语音识别,情感分析,多模态学习 数据概述:... -
新闻媒体文章内容分析数据集NewsMediaArticlesContentAnalysis-somaadithya
新闻媒体文章内容分析数据集NewsMediaArticlesContentAnalysis-somaadithya 数据来源:互联网公开数据 标签:新闻媒体, 内容分析, 文本挖掘, 自然语言处理, 舆情分析, 情感分析, 文本分类, 数据集 数据概述: 该数据集包含来自Medium平台的文章数据,记录了文章的标题、正文等内容。主要特征如下:... -
哈萨克斯坦公共服务问答数据集KazakhstanPublicServiceQuestionAnsweringDataset-dianastam
哈萨克斯坦公共服务问答数据集KazakhstanPublicServiceQuestionAnsweringDataset-dianastam 数据来源:互联网公开数据 标签:问答系统, 公共服务, 自然语言处理, 文本匹配, 机器阅读理解, 信息检索, 哈萨克斯坦, Egov 数据概述:... -
马达加斯加语语音转录数据集MalagasySpeech-to-TextDataset-misandratrarazafy
马达加斯加语语音转录数据集MalagasySpeech-to-TextDataset-misandratrarazafy 数据来源:互联网公开数据 标签:语音识别, 语音转录, 马达加斯加语, 声学模型, 语言模型, 语音数据, 机器学习, 自然语言处理 数据概述: 该数据集包含马达加斯加语的语音音频及其对应的文本转录,旨在为语音识别(Speech-... -
多语言虚假新闻检测数据集MultilingualFakeNewsDetectionDataset-begonil
多语言虚假新闻检测数据集MultilingualFakeNewsDetectionDataset-begonil 数据来源:互联网公开数据 标签:虚假新闻,数据集,多语言,自然语言处理,文本分类,机器学习,新闻分析,信息传播 数据概述: 该数据集包含来自多个国家和地区的新闻文章,记录了不同语言环境下的新闻真实性分类信息。主要特征如下:... -
新闻摘要文本分析数据集NewsSummaryTextAnalysisDataset-usmannwaheed
新闻摘要文本分析数据集NewsSummaryTextAnalysisDataset-usmannwaheed 数据来源:互联网公开数据 标签:新闻摘要, 文本分析, 自然语言处理, 摘要生成, 标题生成, 文本摘要, 机器学习, 语料库 数据概述: 该数据集包含来自新闻网站的摘要信息,记录了新闻标题和对应的文本正文。主要特征如下:...