-
命名实体识别标注数据集NamedEntityRecognitionAnnotationDataset-haris77ramlee
命名实体识别标注数据集NamedEntityRecognitionAnnotationDataset-haris77ramlee 数据来源:互联网公开数据 标签:命名实体识别, 自然语言处理, 文本标注, 序列标注, 机器学习, 实体识别, 语料库, 标注数据 数据概述:... -
AI文本检测数据集-deepaksingh2510
AI文本检测数据集-deepaksingh2510 数据来源:互联网公开数据 标签:文本检测,人工智能,数据集,自然语言处理,机器学习,文本分析,图像识别,深度学习 数据概述: 该数据集旨在用于AI文本检测任务,包含了各种类型的文本图像和标注信息。主要特征如下: 时间跨度:数据记录的时间范围不限,持续更新。... -
新闻爬取与分析数据集-kennykurniadi
新闻爬取与分析数据集-kennykurniadi 数据来源:互联网公开数据 标签:新闻,文本分析,自然语言处理,数据集,舆情分析,情感分析,机器学习,新闻爬取 数据概述: 该数据集包含从多个新闻网站爬取的新闻文章数据,记录了不同来源的新闻内容、发布时间、作者、标题、正文等信息。主要特征如下: 时间跨度:数据记录的时间范围从[起始时间]到[结束时间]。... -
学术论文摘要分类数据集AcademicPaperAbstractCategorization-avanishgadhikar
学术论文摘要分类数据集AcademicPaperAbstractCategorization-avanishgadhikar 数据来源:互联网公开数据 标签:学术论文, 摘要, 分类, 自然语言处理, 文本挖掘, 机器学习, 论文推荐, arXiv 数据概述: 该数据集包含来自arXiv预印本平台发布的学术论文摘要,旨在用于文本分类任务。主要特征如下:... -
维基百科旅行模板提取数据集-dkayton
维基百科旅行模板提取数据集-dkayton 数据来源:互联网公开数据 标签:维基百科,旅行,模板,文本挖掘,自然语言处理,数据集,信息提取,知识图谱 数据概述: 该数据集包含从维基百科中提取的旅行相关模板数据,记录了旅行相关的结构化信息。主要特征如下: 时间跨度:数据记录的时间范围不固定,取决于维基百科数据的更新。... -
音乐情感分析数据集MusicEmotionAnalysisDataset-theprasenjeet
音乐情感分析数据集MusicEmotionAnalysisDataset-theprasenjeet 数据来源:互联网公开数据 标签:音乐分析,情感识别,数据集,机器学习,自然语言处理,音频处理,情感计算,人工智能 数据概述: 该数据集包含来自公开音乐平台的音乐情感分析数据,记录了不同音乐作品所引发的情感反应。主要特征如下:... -
阿拉伯语新闻文本摘要数据集ArabicNewsTextSummarization-ynawal
阿拉伯语新闻文本摘要数据集ArabicNewsTextSummarization-ynawal 数据来源:互联网公开数据 标签:文本摘要, 阿拉伯语, 自然语言处理, 机器翻译, 文本分析, 新闻语料库, 深度学习, 语料库 数据概述: 该数据集包含来自阿拉伯语新闻文章的文本内容及其对应的摘要。主要特征如下:... -
新闻文章内容挖掘数据集NewsArticleContentMiningDataset-tousifmdaminfaisal
新闻文章内容挖掘数据集NewsArticleContentMiningDataset-tousifmdaminfaisal 数据来源:互联网公开数据 标签:新闻文章,内容挖掘,自然语言处理,文本分析,情感分析,主题建模,信息检索,机器学习 数据概述: 该数据集包含了来自各种新闻媒体的文章内容,旨在用于内容挖掘、文本分析和自然语言处理研究。主要特征如下:... -
社交媒体仇恨言论文本分类数据集SocialMediaHateSpeechTextClassificationDataset-zodiac99
社交媒体仇恨言论文本分类数据集SocialMediaHateSpeechTextClassificationDataset-zodiac99 数据来源:互联网公开数据 标签:仇恨言论, 文本分类, 社交媒体, 自然语言处理, 情感分析, 机器学习, 数据标注, 语料库 数据概述:... -
维基百科训练数据集Wiki-TrainDataset-victoriasaz
维基百科训练数据集Wiki-TrainDataset-victoriasaz 数据来源:互联网公开数据 标签:自然语言处理,文本分析,数据集,机器学习,维基百科,文本分类,语言模型,信息检索 数据概述: 该数据集包含来自维基百科的文本数据,主要用于训练自然语言处理模型。主要特征如下:... -
泰语光学字符识别数据集OCRThaiDataset-kontheeboonmeeprakob
泰语光学字符识别数据集OCRThaiDataset-kontheeboonmeeprakob 数据来源:互联网公开数据 标签:光学字符识别,OCR,泰语,数据集,自然语言处理,图像识别,机器学习,文本分析 数据概述: 该数据集包含用于泰语光学字符识别(OCR)任务的图像数据,记录了泰语文字的图像及其对应的文本。主要特征如下:... -
Transformer模型代码修复数据集TransformerModelCodeFixDataset-pavel92
Transformer模型代码修复数据集TransformerModelCodeFixDataset-pavel92 数据来源:互联网公开数据 标签:Transformer,代码修复,数据集,自然语言处理,机器学习,代码生成,软件工程,编程 数据概述:... -
推荐系统与自然语言处理Zalo用户行为数据集RecommendationSystem-NLPZaloUserBehaviorDataset-anhbuivuongtam
推荐系统与自然语言处理Zalo用户行为数据集RecommendationSystem-NLPZaloUserBehaviorDataset-anhbuivuongtam 数据来源:互联网公开数据 标签:推荐系统, 自然语言处理, 用户行为分析, 文本分析, 机器学习, 数据挖掘, 社交媒体, 深度学习 数据概述:... -
虚假新闻识别孟加拉语数据集FakeNewsDetectionBengaliDataset-shafiultanvir
虚假新闻识别孟加拉语数据集FakeNewsDetectionBengaliDataset-shafiultanvir 数据来源:互联网公开数据 标签:虚假新闻, 文本分类, 自然语言处理, 孟加拉语, 新闻分析, 恶意信息, 机器学习, 情感分析 数据概述: 该数据集包含来自互联网的孟加拉语新闻文本数据,记录了用于识别虚假新闻的信息。主要特征如下:... -
编程问答知识库训练集ProgrammingQ-AKnowledgeBaseTrainingSet-brucepayton
编程问答知识库训练集ProgrammingQ-AKnowledgeBaseTrainingSet-brucepayton 数据来源:互联网公开数据 标签:编程问答, 自然语言处理, 文本生成, 问答系统, 知识库, 机器学习, Python, Bash 数据概述:... -
亚马逊商品评论情感分析增强数据集AmazonReviewPolaritySentimentAnalysisEnhancedDataset-deepkumarprasad
亚马逊商品评论情感分析增强数据集AmazonReviewPolaritySentimentAnalysisEnhancedDataset-deepkumarprasad 数据来源:互联网公开数据 标签:情感分析, 文本挖掘, 评论分析, 语义分析, 情感极性, 机器学习, 自然语言处理, 数据增强 数据概述:... -
文本与提示词相关性分析数据集Text-PromptRelevanceAnalysis-hajarhisham
文本与提示词相关性分析数据集Text-PromptRelevanceAnalysis-hajarhisham 数据来源:互联网公开数据 标签:文本分类, 自然语言处理, 提示词, 相关性分析, 数据标注, 机器学习, 文本匹配, 语料库 数据概述: 该数据集包含来自互联网公开数据,记录了文本内容与提示词之间的相关性。主要特征如下:... -
客户服务对话问答数据集CustomerServiceDialogueQuestionandAnswerDataset-franborjavalero
客户服务对话问答数据集CustomerServiceDialogueQuestionandAnswerDataset-franborjavalero 数据来源:互联网公开数据 标签:客户服务, 对话分析, 问答系统, 文本处理, 自然语言处理, 情感分析, 数据标注, 机器学习 数据概述:... -
阿拉伯语新闻摘要数据集ArabicNewsSummarizationDataset-fadyelkbeer
阿拉伯语新闻摘要数据集ArabicNewsSummarizationDataset-fadyelkbeer 数据来源:互联网公开数据 标签:新闻摘要, 阿拉伯语, 自然语言处理, 文本摘要, 机器翻译, 新闻语料库, 文本分析, 语言模型 数据概述: 该数据集包含来自BBC新闻的阿拉伯语新闻文章及其摘要,旨在用于文本摘要任务。主要特征如下:... -
词向量与联系人评估数据集-dionisistotsila
词向量与联系人评估数据集-dionisistotsila 数据来源:互联网公开数据 标签:自然语言处理,联系人管理,数据集,词向量,文本分析,机器学习,关系提取,信息检索 数据概述: 该数据集包含用于评估词向量在联系人信息处理中的应用的数据,侧重于联系人之间的关系分析和信息提取。主要特征如下: 时间跨度:...