-
文本摘要困惑度评估数据集TextSummarizationPerplexityEvaluation-deveshloungani
文本摘要困惑度评估数据集TextSummarizationPerplexityEvaluation-deveshloungani 数据来源:互联网公开数据 标签:文本摘要, 困惑度, 自然语言处理, 评估, 机器学习, 文本分析, 摘要质量, 语料库 数据概述:... -
图书描述及分类数据集BookDescriptionandCategorizationDataset-kshitizsikriwal
图书描述及分类数据集BookDescriptionandCategorizationDataset-kshitizsikriwal 数据来源:互联网公开数据 标签:图书, 描述, 分类, 文本分析, 自然语言处理, 机器学习, 类别标签, 语料库 数据概述: 该数据集包含图书的描述信息及其对应的分类标签,旨在用于文本分析和机器学习任务。主要特征如下:... -
新闻文本分类数据集NewsTextClassification-mattjohn
新闻文本分类数据集NewsTextClassification-mattjohn 数据来源:互联网公开数据 标签:文本分类, 新闻分析, 自然语言处理, 机器学习, 语料库, 文本挖掘, 情感分析, 类别预测 数据概述: 该数据集包含来自BBC新闻网站的文章,记录了不同类别的新闻文本内容,用于文本分类任务。主要特征如下:... -
诗歌情感分析数据集PoetryEmotionAnalysisDataset-atulkrishnan25
诗歌情感分析数据集PoetryEmotionAnalysisDataset-atulkrishnan25 数据来源:互联网公开数据 标签:情感分析, 诗歌, 自然语言处理, 文本分类, 情感识别, 语料库, 诗歌创作, 文本挖掘 数据概述: 该数据集包含来自互联网的诗歌文本,并标注了相应的情感类别。主要特征如下:... -
中文日常语句翻译数据集ChineseDailySentenceTranslationDataset-jahnaviyelamanchi
中文日常语句翻译数据集ChineseDailySentenceTranslationDataset-jahnaviyelamanchi 数据来源:互联网公开数据 标签:机器翻译, 语言学习, 中文, 文本数据, 语料库, 句子翻译, 自然语言处理, 语言模型 数据概述:... -
科技新闻文本主题分析数据集TechnologyNewsTextTopicAnalysisDataset-annabad
科技新闻文本主题分析数据集TechnologyNewsTextTopicAnalysisDataset-annabad 数据来源:互联网公开数据 标签:新闻文本, 科技, 主题分类, 文本挖掘, 自然语言处理, 数据清洗, 机器学习, 语料库 数据概述: 该数据集包含来自互联网的新闻文本数据,记录了科技领域相关新闻的文本内容及其主题分类。主要特征如下:... -
维基百科电影剧情语句数据集WikipediaMoviePlotSentences-ranjitp20
维基百科电影剧情语句数据集WikipediaMoviePlotSentences-ranjitp20 数据来源:互联网公开数据 标签:电影剧情, 文本分析, 自然语言处理, 语料库, 文本挖掘, 情感分析, 剧本创作, 数据集 数据概述: 该数据集包含来自维基百科电影剧情介绍的句子,记录了电影剧情的关键语句。主要特征如下:... -
文学作品作者识别文本数据集LiteraryAuthorIdentificationTextDataset-shruti0406
文学作品作者识别文本数据集LiteraryAuthorIdentificationTextDataset-shruti0406 数据来源:互联网公开数据 标签:文本分析, 作者识别, 自然语言处理, 文本分类, 机器学习, 语料库, 风格分析, 写作风格 数据概述: 该数据集包含来自文学作品的文本片段,用于训练和评估作者识别模型。主要特征如下:... -
电影评论情感分析数据集FilmReviewSentimentAnalysis-mohamednageeye12
电影评论情感分析数据集FilmReviewSentimentAnalysis-mohamednageeye12 数据来源:互联网公开数据 标签:情感分析, 文本分类, 电影评论, 自然语言处理, 机器学习, 数据标注, 情感极性, 语料库 数据概述: 该数据集包含来自电影评论的数据,记录了电影评论文本及其对应的情感极性标签。主要特征如下:... -
文本检索与信息排序数据集TextRetrievalandInformationRankingDataset-aleksandariliskovic
文本检索与信息排序数据集TextRetrievalandInformationRankingDataset-aleksandariliskovic 数据来源:互联网公开数据 标签:文本检索, 信息排序, 搜索, 机器学习, 自然语言处理, 语料库, 相关性, 评估 数据概述:... -
越南问答数据集VietnameseQuestionAnsweringDataset-vutlol
越南问答数据集VietnameseQuestionAnsweringDataset-vutlol 数据来源:互联网公开数据 标签:问答系统, 自然语言处理, 越南语, 文本检索, 信息抽取, 机器阅读理解, 数据集, 语料库 数据概述: 该数据集包含用于构建和评估越南语问答系统的数据,涵盖了多个领域的问题与答案。主要特征如下:... -
英文命名实体识别数据集EnglishNamedEntityRecognitionDataset-ruanamxoai
英文命名实体识别数据集EnglishNamedEntityRecognitionDataset-ruanamxoai 数据来源:互联网公开数据 标签:命名实体识别, 自然语言处理, 文本标注, 序列标注, 机器学习, 实体识别, 数据集, 语料库 数据概述:... -
僧伽罗语对话数据集SinhalaDialogueDataset-preminda
僧伽罗语对话数据集SinhalaDialogueDataset-preminda 数据来源:互联网公开数据 标签:僧伽罗语, 文本数据, 对话语料, 语言学, 自然语言处理, 文本分析, 语料库, 机器学习 数据概述: 该数据集包含来自公开渠道的僧伽罗语对话文本,记录了不同场景下的对话内容。主要特征如下:... -
Java编程常用方法与代码片段数据集JavaProgrammingCommonMethodsandCodeSnippets-lohzheungyik2021
Java编程常用方法与代码片段数据集JavaProgrammingCommonMethodsandCodeSnippets-lohzheungyik2021 数据来源:互联网公开数据 标签:Java, 编程, 代码片段, 常用方法, 编程实践, 开发者工具, 软件工程, 语料库 数据概述:... -
孟加拉语语料库2022数据集-srjony
孟加拉语语料库2022数据集-srjony 数据来源:互联网公开数据 标签:孟加拉语,语料库,自然语言处理,文本分析,机器学习,语言学,学术研究,数据集 数据概述:该数据集包含来自多个来源的孟加拉语文本数据,记录了广泛的孟加拉语语料,适用于自然语言处理、文本分析等任务。主要特征如下: 时间跨度:数据记录的时间范围从2020年到2022年。... -
英俄平行语料翻译数据集English-RussianParallelTranslationDataset-user17234
英俄平行语料翻译数据集English-RussianParallelTranslationDataset-user17234 数据来源:互联网公开数据 标签:机器翻译, 语料库, 自然语言处理, 文本对齐, 语言学, 俄语, 英语, 语言模型 数据概述: 该数据集包含来自互联网的英俄平行语料,记录了英语句子及其对应的俄语翻译。主要特征如下:... -
自然语言问答上下文数据集NaturalQuestionsSmall-thedrcat
自然语言问答上下文数据集NaturalQuestionsSmall-thedrcat 数据来源:互联网公开数据 标签:自然语言处理, 问答系统, 文本理解, 信息检索, 机器阅读, 语料库, 数据集, 文本分析 数据概述: 该数据集包含来自互联网的自然语言问答数据,记录了用户提出的问题、相关的上下文段落以及答案。主要特征如下:... -
社交媒体灾难事件文本分类数据集SocialMediaDisasterEventTextClassificationDataset-sheikhsharfuddinmim
社交媒体灾难事件文本分类数据集SocialMediaDisasterEventTextClassificationDataset-sheikhsharfuddinmim 数据来源:互联网公开数据 标签:文本分类, 社交媒体, 灾难事件, 自然语言处理, 机器学习, 情感分析, 语料库, 深度学习 数据概述:... -
法语文本翻译数据集FrenchTextTranslation-aadiwalid
法语文本翻译数据集FrenchTextTranslation-aadiwalid 数据来源:互联网公开数据 标签:机器翻译, 法语, 文本数据, 自然语言处理, 语料库, 语言学, 数据分析, 翻译模型 数据概述: 该数据集包含来自互联网的法语文本片段,主要用于机器翻译模型的训练和评估。主要特征如下: 时间跨度:数据未明确标注时间,可视为静态文本语料。... -
电影评论情感分析数据集MovieReviewSentimentAnalysis-bhuvanlohitdevnakka
电影评论情感分析数据集MovieReviewSentimentAnalysis-bhuvanlohitdevnakka 数据来源:互联网公开数据 标签:情感分析, 文本分类, 电影评论, 自然语言处理, 机器学习, 情感极性, 数据标注, 语料库 数据概述:...