找到11,756个数据集

标签: 自然语言处理

过滤结果
  • 阿拉伯语手语数据集阿拉伯语手语数据集-sumayahalwadei

    2025年5月30日   

    阿拉伯语手语数据集阿拉伯语手语数据集-sumayahalwadei 数据来源:互联网公开数据 标签:手语,阿拉伯语,数据集,语言识别,机器学习,自然语言处理,教育,文化交流 数据概述: 该数据集包含经过修改的阿拉伯语手语视频数据,记录了阿拉伯语手语的多种表达方式。主要特征如下: 时间跨度: 数据记录的时间范围从2015年到2020年。 地理范围:...
    packageimg
  • 斯坦福大学自然语言处理课程单词嵌入数据集StanfordNLPCourseWordEmbeddingsDataset-png261

    2025年5月30日   

    斯坦福大学自然语言处理课程单词嵌入数据集StanfordNLPCourseWordEmbeddingsDataset-png261 数据来源:互联网公开数据 标签:自然语言处理,词嵌入,数据集,斯坦福大学,文本分析,机器学习,深度学习,语义分析 数据概述:...
    packageimg
  • 虚假与真实新闻数据集FakeandTrueNewsDataset-faisalmabood

    2025年5月30日   

    虚假与真实新闻数据集FakeandTrueNewsDataset-faisalmabood 数据来源:互联网公开数据 标签:新闻分析,数据集,文本分类,机器学习,信息传播,新闻检测,自然语言处理,媒体研究 数据概述: 该数据集包含来自公开新闻来源的虚假与真实新闻数据,记录了两类新闻的内容、来源和发布时间等信息。主要特征如下:...
    packageimg
  • 故事数据集StoryDataset-ahmadrezacuet

    2025年5月30日   

    故事数据集StoryDataset-ahmadrezacuet 数据来源:互联网公开数据 标签:故事,文本数据,自然语言处理,情感分析,叙事分析,数据集,机器学习,语言模型 数据概述: 该数据集包含大量故事文本,涵盖多种主题和风格。主要特征如下: 时间跨度:数据的时间跨度取决于故事的创作时间,从古代神话传说到现代小说均有收录。...
    packageimg
  • 预处理简历数据集PreprocessedResumeDataset-hjhgkyo

    2025年5月30日   

    预处理简历数据集PreprocessedResumeDataset-hjhgkyo 数据来源:互联网公开数据 标签:简历,数据集,人力资源,招聘,机器学习,文本分析,自然语言处理,求职 数据概述: 该数据集包含经过预处理的简历数据,适用于人力资源管理和招聘过程中的自动化筛选。主要特征如下: 时间跨度:数据记录的时间范围从2018年到2022年。...
    packageimg
  • 自然语言处理与医学词汇标准化数据集NLP-UMLSDataset-quctngngvng

    2025年5月30日   

    自然语言处理与医学词汇标准化数据集NLP-UMLSDataset-quctngngvng 数据来源:互联网公开数据 标签:自然语言处理,医学词汇,数据集,文本挖掘,机器学习,医学信息学,语义分析,临床文档 数据概述: 该数据集包含自然语言处理技术与医学词汇标准化(Unified Medical Language...
    packageimg
  • 锡尔赫特-纳格里手写体字符识别数据集SylhetiNagriOCRDataset-sushmit0109

    2025年5月30日   

    锡尔赫特-纳格里手写体字符识别数据集SylhetiNagriOCRDataset-sushmit0109 数据来源:互联网公开数据 标签:OCR,手写体识别,锡尔赫特语,纳格里文字,数据集,图像识别,自然语言处理,人工智能 数据概述: 该数据集包含锡尔赫特-纳格里文字的手写体字符图像,旨在用于光学字符识别(OCR)系统的训练和评估。主要特征如下:...
    packageimg
  • 济州岛旅游景点评论数据集DACONJejuOfficialDataset-jinsil0716

    2025年5月30日   

    济州岛旅游景点评论数据集DACONJejuOfficialDataset-jinsil0716 数据来源:互联网公开数据 标签:旅游,数据集,评论分析,自然语言处理,情感分析,文本挖掘,济州岛,旅游业 数据概述: 该数据集包含来自DACON(韩国数据竞赛平台)的济州岛旅游景点评论数据,记录了游客对济州岛各个景点的评价信息。主要特征如下:...
    packageimg
  • 越南新闻文本摘要数据集VietnameseNewsTextSummarizationDataset-uyentruong

    2025年5月30日   

    越南新闻文本摘要数据集VietnameseNewsTextSummarizationDataset-uyentruong 数据来源:互联网公开数据 标签:文本摘要, 自然语言处理, 越南语, 机器翻译, 深度学习, 文本生成, 语料库, 数据集 数据概述: 该数据集包含来自越南新闻的文章及其对应的摘要,旨在用于文本摘要任务。主要特征如下:...
    packageimg
  • 文本摘要生成训练数据集TextSummarizationTrainingDataset-mridul3301

    2025年5月30日   

    文本摘要生成训练数据集TextSummarizationTrainingDataset-mridul3301 数据来源:互联网公开数据 标签:文本摘要, 自然语言处理, 机器翻译, 深度学习, 文本生成, 数据集构建, 摘要生成, 语料库 数据概述: 该数据集包含用于文本摘要任务的训练数据,记录了源文本及其对应的摘要。主要特征如下:...
    packageimg
  • 在线性别歧视可解释性检测数据集ExplainableDetectionofOnlineSexism-EDOS-maifeeulasad

    2025年5月30日   

    在线性别歧视可解释性检测数据集ExplainableDetectionofOnlineSexism-EDOS-maifeeulasad 数据来源:互联网公开数据 标签:性别歧视,自然语言处理,数据集,机器学习,文本分析,情感分析,社交媒体,可解释性 数据概述: 该数据集主要用于研究和开发在线性别歧视的检测模型,旨在提高模型的可解释性。主要特征如下:...
    packageimg
  • 尼泊尔新闻文本数据集NepaliNewsTextDataset-sulavtimilsina

    2025年5月30日   

    尼泊尔新闻文本数据集NepaliNewsTextDataset-sulavtimilsina 数据来源:互联网公开数据 标签:新闻文本, 尼泊尔语, 文本分类, 自然语言处理, 语料库, 新闻报道, 文本分析, 数据挖掘 数据概述: 该数据集包含来自尼泊尔新闻网站NepaliPatra的文本数据,记录了各种新闻报道的内容。主要特征如下:...
    packageimg
  • 数字素养与文献引用关系标注数据集DigitalLiteracyandCitationRelationshipAnnotationDataset-khanhdaom

    2025年5月30日   

    数字素养与文献引用关系标注数据集DigitalLiteracyandCitationRelationshipAnnotationDataset-khanhdaom 数据来源:互联网公开数据 标签:数字素养, 引用关系, 文本标注, 文本挖掘, 自然语言处理, 学术文献, 机器学习, 数据集构建 数据概述:...
    packageimg
  • 评论情感分析预测数据集CommentSentimentAnalysisPrediction-goldenlock

    2025年5月30日   

    评论情感分析预测数据集CommentSentimentAnalysisPrediction-goldenlock 数据来源:互联网公开数据 标签:情感分析, 评论数据, 文本分类, 机器学习, 模型评估, 预测, 数据挖掘, 自然语言处理 数据概述:...
    packageimg
  • 自然语言处理NLP职位描述数据集-koti4878m

    2025年5月30日   

    自然语言处理NLP职位描述数据集-koti4878m 数据来源:互联网公开数据 标签:自然语言处理,NLP,职位描述,文本分析,机器学习,招聘,数据挖掘,文本分类 数据概述:该数据集包含来自互联网的职位描述文本数据,主要记录了不同行业的职位描述信息。主要特征如下: 时间跨度:数据记录的时间范围跨度不定,取决于爬取时间与数据来源。...
    packageimg
  • 乌兹别克语音识别数据集VoiceRecognitionUzbekDataset-bexruznutfilloyev

    2025年5月30日   

    乌兹别克语音识别数据集VoiceRecognitionUzbekDataset-bexruznutfilloyev 数据来源:互联网公开数据 标签:语音识别,乌兹别克语,数据集,自然语言处理,机器学习,语音处理,音频分析,语言学 数据概述: 该数据集包含乌兹别克语的语音数据,旨在用于语音识别系统的训练和评估。主要特征如下: 时间跨度:...
    packageimg
  • 长短期记忆网络情感分析数据集LSTMSentimentAnalysisDataset-tomwell

    2025年5月30日   

    长短期记忆网络情感分析数据集LSTMSentimentAnalysisDataset-tomwell 数据来源:互联网公开数据 标签:情感分析,自然语言处理,数据集,机器学习,文本挖掘,深度学习,情感计算,文本分类 数据概述: 该数据集包含用于情感分析任务的文本数据,记录了不同文本内容的情感倾向。主要特征如下:...
    packageimg
  • 夏威夷酒店评论数据集2011-2021数据集-ztamnaja

    2025年5月30日   

    夏威夷酒店评论数据集2011-2021数据集-ztamnaja 数据来源:互联网公开数据 标签:酒店评论,数据集,旅游分析,自然语言处理,用户评价,机器学习,消费者行为,旅游业 数据概述:该数据集包含来自夏威夷酒店的用户评论数据,记录了游客对夏威夷各大酒店的反馈。主要特征如下: 时间跨度:数据记录的时间范围从2011年到2021年。...
    packageimg
  • 用户对话情感分析数据集UserDialogueSentimentAnalysis-aeryss

    2025年5月30日   

    用户对话情感分析数据集UserDialogueSentimentAnalysis-aeryss 数据来源:互联网公开数据 标签:情感分析, 对话数据, 自然语言处理, 文本分类, 客户服务, 满意度, 机器学习, 数据标注 数据概述:...
    packageimg
  • 英语到印地语翻译数据集English-to-HindiTranslateDataset-saediscrazy

    2025年5月30日   

    英语到印地语翻译数据集English-to-HindiTranslateDataset-saediscrazy 数据来源:互联网公开数据 标签:机器翻译,自然语言处理,数据集,印地语,英语,文本翻译,语言模型,多语言 数据概述: 该数据集包含英语到印地语的翻译文本对,旨在用于机器翻译模型的训练和评估。主要特征如下: 时间跨度:...
    packageimg