找到11,858个数据集

标签: 自然语言处理

过滤结果
  • 两步Wave-Net语音合成数据集-garganany

    2025年4月24日   

    两步Wave-Net语音合成数据集-garganany 数据来源:互联网公开数据 标签:语音合成,深度学习,数据集,音频处理,人工智能,自然语言处理,WaveNet,语音生成 数据概述: 该数据集包含用于训练两步 WaveNet 模型的数据,主要用于语音合成任务。主要特征如下: 时间跨度:数据记录了音频的录制时间,具体时间跨度取决于原始数据。...
    packageimg
  • 隐含仇恨言论排名数据集ImplicitHateSpeechwithRankingDataset-devayani14

    2025年4月24日   

    隐含仇恨言论排名数据集ImplicitHateSpeechwithRankingDataset-devayani14 数据来源:互联网公开数据 标签:仇恨言论,数据集,文本分析,情感分析,机器学习,自然语言处理,社会研究,内容审核 数据概述:该数据集包含来自多个在线平台的文本数据,记录了带有隐含仇恨言论的言论内容及其对应的排名。主要特征如下:...
    packageimg
  • 电影相似度分析数据集MoviesSimilarityDataset-devendra45

    2025年4月24日   

    电影相似度分析数据集MoviesSimilarityDataset-devendra45 数据来源:互联网公开数据 标签:电影分析,相似度计算,数据集,推荐系统,机器学习,数据挖掘,娱乐产业,自然语言处理 数据概述: 该数据集包含来自多个电影数据库的电影信息,记录了电影之间的相似度关系及相关特征。主要特征如下:...
    packageimg
  • LaTeX文档分析数据集LaTeXDocumentAnalysisDataset-sai1881

    2025年4月24日   

    LaTeX文档分析数据集LaTeXDocumentAnalysisDataset-sai1881 数据来源:互联网公开数据 标签:LaTeX, 文档分析, 数据集, 语法结构, 文学研究, 自然语言处理, 计算机科学, 学术资源 数据概述:...
    packageimg
  • 用户评论情感分析数据集CommentsScoreDataset-esgintn

    2025年4月24日   

    用户评论情感分析数据集CommentsScoreDataset-esgintn 数据来源:互联网公开数据 标签:评论分析,情感分析,数据集,自然语言处理,机器学习,文本挖掘,用户行为,社交媒体 数据概述:该数据集包含来自各种来源的用户评论数据,记录了用户对特定主题或产品的评论及其对应的情感评分。主要特征如下:...
    packageimg
  • RedditWSB论坛帖子数据集RedditWSBPostsDataset-dataranch

    2025年4月24日   

    RedditWSB论坛帖子数据集RedditWSBPostsDataset-dataranch 数据来源:互联网公开数据 标签:社交媒体,金融,股票,投资,文本分析,自然语言处理,舆情分析,机器学习 数据概述: 该数据集包含来自 Reddit 网站 WallStreetBets(WSB)子版块的帖子数据,记录了用户在 WSB...
    packageimg
  • 俄英虚假新闻翻译数据集RUS-ENFakeNewsTranslationDataset-nimbus32

    2025年4月24日   

    俄英虚假新闻翻译数据集RUS-ENFakeNewsTranslationDataset-nimbus32 数据来源:互联网公开数据 标签:虚假新闻,翻译,数据集,俄语,英语,自然语言处理,机器翻译,文本分析 数据概述: 该数据集包含了俄语(RUS)到英语(EN)的虚假新闻翻译数据,旨在促进虚假信息检测和跨语言分析的研究。主要特征如下:...
    packageimg
  • 电影评论情感分析数据集IMDBReviewSentimentAnalysisDataset-princegupta19998

    2025年4月24日   

    电影评论情感分析数据集IMDBReviewSentimentAnalysisDataset-princegupta19998 数据来源:互联网公开数据 标签:自然语言处理,情感分析,数据集,文本挖掘,机器学习,电影评论,人工智能,大数据 数据概述:...
    packageimg
  • 合并的Dataverse语言识别数据集MergedDataverseBhashaLanguageRecognitionDataset-samansarkerjoy

    2025年4月24日   

    合并的Dataverse语言识别数据集MergedDataverseBhashaLanguageRecognitionDataset-samansarkerjoy 数据来源:互联网公开数据 标签:语言识别,数据集,自然语言处理,机器学习,语音识别,多语言,人工智能,数据分析 数据概述:...
    packageimg
  • 数据2024中国计算机学会CCF检索增强生成RAG数据集-yxw666

    2025年4月24日   

    2024中国计算机学会CCF检索增强生成RAG数据集-yxw666 数据来源:互联网公开数据 标签:自然语言处理,检索增强生成,数据集,文本生成,信息检索,机器学习,人工智能,CCF 数据概述: 该数据集由中国计算机学会(CCF)提供,旨在促进检索增强生成(RAG)技术的研究与发展。主要特征如下: 时间跨度:数据记录的时间范围为2024年。...
    packageimg
  • 改进型图像字幕数据集ImprovedCaptionsDataset-sameerbairwa07

    2025年4月24日   

    改进型图像字幕数据集ImprovedCaptionsDataset-sameerbairwa07 数据来源:互联网公开数据 标签:图像字幕,数据集,自然语言处理,计算机视觉,深度学习,文本生成,视觉理解,人工智能 数据概述: 该数据集包含经过改进的图像字幕数据,记录了与图像内容相匹配的,经过优化的描述性文本。主要特征如下:...
    packageimg
  • 数学竞赛解题API数据集MathematicsContestSolvingviaAPIDataset-sumansuhag

    2025年4月24日   

    数学竞赛解题API数据集MathematicsContestSolvingviaAPIDataset-sumansuhag 数据来源:互联网公开数据 标签:数学竞赛,解题,API,数据集,人工智能,自然语言处理,数学建模,编程 数据概述: 该数据集包含通过API解决数学竞赛问题的相关数据,记录了使用API解答数学竞赛试题的过程和结果。主要特征如下:...
    packageimg
  • LLM文本检测数据集-wcylxh

    2025年4月24日   

    LLM文本检测数据集-wcylxh 数据来源:互联网公开数据 标签:自然语言处理,文本检测,数据集,机器学习,语言模型,文本分析,内容识别,风险评估 数据概述: 该数据集包含用于检测大型语言模型(LLM)生成的文本数据,旨在帮助研究人员和开发人员识别由LLM生成的文本。主要特征如下: 时间跨度:数据记录的时间范围为近期,包含最新LLM生成的内容。...
    packageimg
  • 文本生成模型Gemma数据集-minhsienweng

    2025年4月24日   

    文本生成模型Gemma数据集-minhsienweng 数据来源:互联网公开数据 标签:文本生成,机器学习,自然语言处理,数据集,人工智能,语言模型,深度学习,文本分析...
    packageimg
  • 飞机航班评价与情感分析数据集AirplaneTweetsDataset-abdelrahmangamil

    2025年4月24日   

    飞机航班评价与情感分析数据集AirplaneTweetsDataset-abdelrahmangamil 数据来源:互联网公开数据 标签:航空业,社交媒体,数据集,情感分析,文本挖掘,机器学习,客户服务,自然语言处理 数据概述: 该数据集包含来自Twitter平台关于飞机航班的用户评价和反馈数据,记录了乘客对航班服务的情感态度和具体评价。主要特征如下:...
    packageimg
  • 疾病诊断信息数据集DiagnosisMessageDataset-zenbot99

    2025年4月24日   

    疾病诊断信息数据集DiagnosisMessageDataset-zenbot99 数据来源:互联网公开数据 标签:医疗健康,诊断信息,数据集,临床研究,机器学习,自然语言处理,医学文本,数据分析 数据概述: 该数据集包含来自医疗诊断场景的信息数据,记录了疾病诊断相关的文本或结构化信息。主要特征如下:...
    packageimg
  • 预处理数据集含停用词-文本处理与分析数据集PreprocessedDatawithStopwords-TextProcessingandAnalysisD...

    2025年4月24日   

    预处理数据集含停用词-文本处理与分析数据集PreprocessedDatawithStopwords-TextProcessingandAnalysisDataset-solomonschwiger 数据来源:互联网公开数据 标签:文本处理,数据集,自然语言处理,停用词,机器学习,数据预处理,文本分析,信息检索 数据概述:...
    packageimg
  • 基于OpenAI生成的数据集DS3GeneratedDatafromOpenAI-devayani14

    2025年4月24日   

    基于OpenAI生成的数据集DS3GeneratedDatafromOpenAI-devayani14 数据来源:互联网公开数据 标签:人工智能,数据集,自然语言处理,文本生成,机器学习,数据挖掘,OpenAI,数据分析 数据概述: 该数据集包含由OpenAI模型生成的各种文本数据,涵盖了广泛的主题和应用场景。主要特征如下:...
    packageimg
  • 诗歌分类数据集PoemsCategorizationDatasets-harunshimanto

    2025年4月24日   

    诗歌分类数据集PoemsCategorizationDatasets-harunshimanto 数据来源:互联网公开数据 标签:诗歌,文本分类,自然语言处理,数据集,情感分析,文学研究,机器学习,创作风格 数据概述: 该数据集包含了各类诗歌作品,旨在用于诗歌的自动分类和分析。主要特征如下: 时间跨度:数据涵盖了不同历史时期和流派的诗歌作品。...
    packageimg
  • 德国2021年患者对医生评论与评分数据集

    2025年4月24日   

    德国2021年患者对医生评论与评分数据集 数据来源:互联网公开数据 标签:患者评论,医生评分,文本分类,自然语言处理,德国医疗,情感分析,机器学习,数据科学 数据概述:...
    packageimg