-
英语-乌尔都语翻译数据集English-UrduTranslationDataset-cygnusanubis
英语-乌尔都语翻译数据集English-UrduTranslationDataset-cygnusanubis 数据来源:互联网公开数据 标签:机器翻译, 语言模型, 文本翻译, 英语, 乌尔都语, 自然语言处理, 双语对照, 语料库 数据概述: 该数据集包含英语和乌尔都语的翻译对,记录了英语句子及其对应的乌尔都语翻译。主要特征如下:... -
垃圾邮件识别文本数据集SpamEmailTextDataset-diveyanand
垃圾邮件识别文本数据集SpamEmailTextDataset-diveyanand 数据来源:互联网公开数据 标签:垃圾邮件, 文本分类, 自然语言处理, 邮件过滤, 机器学习, 二分类, 数据标注, 语料库 数据概述: 该数据集包含来自公开邮件语料库的文本数据,记录了邮件内容及其是否为垃圾邮件的标注信息。主要特征如下:... -
越南语新闻文本主题分类数据集VietnameseNewsTextTopicClassificationDataset-harrythai
越南语新闻文本主题分类数据集VietnameseNewsTextTopicClassificationDataset-harrythai 数据来源:互联网公开数据 标签:越南语, 新闻, 文本分类, 主题识别, 自然语言处理, 语料库, 数据标注, 机器学习 数据概述:... -
社交媒体文本性别歧视检测数据集SocialMediaTextSexismDetectionDataset-himarusti
社交媒体文本性别歧视检测数据集SocialMediaTextSexismDetectionDataset-himarusti 数据来源:互联网公开数据 标签:性别歧视, 文本分类, 社交媒体, 情感分析, 自然语言处理, 机器学习, 数据标注, 语料库 数据概述:... -
口语对话语音转录文本数据集SpokenDialogueTranscriptionData-jonhigk
口语对话语音转录文本数据集SpokenDialogueTranscriptionData-jonhigk 数据来源:互联网公开数据 标签:语音识别, 文本转录, 口语对话, 语音分析, 情感分析, 语料库, 自然语言处理, 置信度 数据概述: 该数据集包含来自口语对话的语音转录文本,记录了对话的语音内容、时间戳及置信度信息。主要特征如下:... -
电影评论情感分析数据集MovieReviewsSentimentAnalysisDataset-fajardenyelfianita
电影评论情感分析数据集MovieReviewsSentimentAnalysisDataset-fajardenyelfianita 数据来源:互联网公开数据 标签:情感分析, 文本分类, 电影评论, 自然语言处理, 情感极性, 机器学习, 语料库, 数据标注 数据概述:... -
BBC新闻文本分类数据集BBCNewsTextClassificationDataset-anagarcialozano
BBC新闻文本分类数据集BBCNewsTextClassificationDataset-anagarcialozano 数据来源:互联网公开数据 标签:文本分类, 新闻分析, 自然语言处理, 机器学习, 语料库, 文本挖掘, 情感分析, 媒体研究 数据概述:... -
新闻摘要生成验证数据集NewsSummarizationValidationDataset-osamamahmoud14
新闻摘要生成验证数据集NewsSummarizationValidationDataset-osamamahmoud14 数据来源:互联网公开数据 标签:新闻摘要, 自然语言处理, 文本生成, 机器翻译, 文本摘要, 验证数据集, 深度学习, 语料库 数据概述:... -
新闻文本分类数据集NewsTextClassificationDataset-abdulraffayali
新闻文本分类数据集NewsTextClassificationDataset-abdulraffayali 数据来源:互联网公开数据 标签:文本分类, 新闻分析, 自然语言处理, 机器学习, 文本挖掘, 语料库, 媒体报道, 类别标注 数据概述: 该数据集包含来自英国广播公司(BBC)的新闻文本,记录了不同类别的新闻文章内容。主要特征如下:... -
新闻文本分类数据集NewsTextClassificationDataset-amunsentom
新闻文本分类数据集NewsTextClassificationDataset-amunsentom 数据来源:互联网公开数据 标签:新闻文本, 文本分类, 机器学习, 自然语言处理, 类别标签, 语料库, 文本分析, 舆情分析 数据概述:... -
文本分类IAB类别标注数据集TextClassificationIABCategoryDataset-payne18
文本分类IAB类别标注数据集TextClassificationIABCategoryDataset-payne18 数据来源:互联网公开数据 标签:文本分类, IAB分类, 语料库, 自然语言处理, 机器学习, 类别预测, 文本标注, 语料分析 数据概述:... -
自然语言处理Word2Vec模型文章标题数据集NaturalLanguageProcessingWord2VecModelArticleTitles-al...
自然语言处理Word2Vec模型文章标题数据集NaturalLanguageProcessingWord2VecModelArticleTitles-alisamalakhova 数据来源:互联网公开数据 标签:自然语言处理, 文本分析, 词嵌入, Word2Vec, Gensim, 机器学习, 文本挖掘, 语料库 数据概述:... -
圣经文本行内容数据集BibleTextLineContent-vincentbutterfield
圣经文本行内容数据集BibleTextLineContent-vincentbutterfield 数据来源:互联网公开数据 标签:圣经, 文本分析, 宗教, 经典, 自然语言处理, 文本挖掘, 语料库, 文本行 数据概述: 该数据集包含来自圣经文本的数据,记录了圣经不同章节的文本行内容。主要特征如下:... -
越南语用户意图识别数据集VietnameseUserIntentRecognitionDataset-daominhkhanh
越南语用户意图识别数据集VietnameseUserIntentRecognitionDataset-daominhkhanh 数据来源:互联网公开数据 标签:自然语言处理, 意图识别, 文本分类, 越南语, 机器学习, 情感分析, 数据标注, 语料库 数据概述:... -
波斯语文本情感分析数据集PersianTextSentimentAnalysisDataset-anila1191399
波斯语文本情感分析数据集PersianTextSentimentAnalysisDataset-anila1191399 数据来源:互联网公开数据 标签:情感分析, 自然语言处理, 波斯语, 文本分类, 情绪识别, 机器学习, 语料库, 语言模型 数据概述: 该数据集包含波斯语文本数据,用于情感分析任务。主要特征如下:... -
语音转录文本数据集SpeechTranscriptionTextDataset-sanjaymalladi29
语音转录文本数据集SpeechTranscriptionTextDataset-sanjaymalladi29 数据来源:互联网公开数据 标签:语音识别, 文本分析, 语音转录, 文本标注, 自然语言处理, 数据挖掘, 语料库, 文本校对 数据概述: 该数据集包含语音转录文本数据,记录了从语音文件中提取的文本内容。主要特征如下:... -
项目管理实践标准文本分析数据集ProjectManagementPracticeStandardTextAnalysisDataset-maaouiabergaya
项目管理实践标准文本分析数据集ProjectManagementPracticeStandardTextAnalysisDataset-maaouiabergaya 数据来源:互联网公开数据 标签:项目管理, 文本分析, 实践标准, PMI, 知识管理, 语料库, 自然语言处理, 文本挖掘 数据概述:... -
-
英语语料库词频与逆文档频率数据集EnglishCorpusFrequencyandIDFDataset-nataltiger26
英语语料库词频与逆文档频率数据集EnglishCorpusFrequencyandIDFDataset-nataltiger26 数据来源:互联网公开数据 标签:语料库,词频分析,逆文档频率,自然语言处理,数据集,文本挖掘,机器学习,信息检索 数据概述:... -
错误标注泰米尔语语料库数据集Error-annotatedTamilCorpusDataset-neechalkaran
错误标注泰米尔语语料库数据集Error-annotatedTamilCorpusDataset-neechalkaran 数据来源:互联网公开数据 标签:自然语言处理,泰米尔语,语料库,错误标注,机器学习,语言技术,文本分析,数据挖掘 数据概述:该数据集包含来自泰米尔语的错误标注语料,记录了泰米尔语文本中的各类错误及其标注信息。主要特征如下:...