-
孟加拉语同义句识别基准语料库数据集
孟加拉语同义句识别基准语料库数据集 数据来源:互联网公开数据 标签:同义句检测,孟加拉语,语料库,自然语言处理,文本分析,机器学习,语言模型评估 数据概述: 本数据集是一个用于孟加拉语同义句识别的基准语料库,收录了8,787对人工标注的句子对,这些句子对来源于23家报纸头版在四个类别中的内容。该数据集旨在为孟加拉语同义句检测的研究提供全面的基准。... -
梵语史诗摩诃婆罗多和罗摩衍那诗句英译数据集
梵语史诗摩诃婆罗多和罗摩衍那诗句英译数据集 数据来源:互联网公开数据 标签:梵语, 史诗, 翻译, 语言学, 文本, 诗歌, 语料库, 机器学习, 文本生成 数据概述: 本数据集是一个梵语-英语翻译语料库,包含了从M. N.... -
自然故事语料库数据集1963-2021
自然故事语料库数据集1963-2021 数据来源:互联网公开数据 标签:自然语言处理,阅读时间,语料库,低频语法构型,心理学,语言学 数据概述:... -
当代美国英语语料库数据集
当代美国英语语料库数据集 数据来源:互联网公开数据 标签:美国英语,语料库,语言学,文本分析,文学,新闻,学术,社交媒体,电影字幕,电视字幕 数据概述:... -
阿拉伯语新闻文本分类语料库
阿拉伯语新闻文本分类语料库 数据来源:互联网公开数据 标签:阿拉伯语,新闻,文本分类,自然语言处理,机器学习,语料库 数据概述: 本数据集包含以阿拉伯语撰写的新闻文本,涵盖了9个不同的新闻类别,以CSV格式存储。数据集旨在为阿拉伯语新闻文本的分类任务提供支持,包含数万条新闻数据,每条数据均标注了具体的类别信息。 数据用途概述:... -
英语学习资源网站文本语料库数据集-OneStopEnglish-2024
英语学习资源网站文本语料库数据集-OneStopEnglish-2024 数据来源:互联网公开数据 标签:英语学习,文本语料库,语言学习,英语教学,文本分析,语料库,词汇,语法,阅读理解 数据概述: 本数据集包含OneStopEnglish网站提供的文本语料库,以CSV格式存储。语料库中的文本内容涵盖了小学、初中、高中不同英语水平的材料。... -
旁遮普语沙木基语料库词频统计数据集
旁遮普语沙木基语料库词频统计数据集 数据来源:互联网公开数据 标签:旁遮普语,沙木基语,语言学,词频统计,文本分析,自然语言处理,语料库 数据概述: 本数据集基于从互联网收集的旁遮普语沙木基语料库构建而成,包含单字词(unigram)和双字词(bigram)的频率统计信息。 数据文件包括: unigram-p.csv:包含50,000个单字词及其词频。... -
CounselChat心理咨询对话数据集
CounselChat心理咨询对话数据集 数据来源:互联网公开数据 标签:心理咨询,对话,NLP,自然语言处理,情感分析,文本数据,CounselChat,语料库 数据概述: 本数据集收录了从 CounselChat 网站抓取的心理咨询对话数据。 CounselChat... -
韩国语词汇频率数据集
韩国语词汇频率数据集 数据来源:互联网公开数据 标签:词汇频率,韩国语,自然语言处理,NLP,词频统计,语言学,语料库,词根分析,借词研究 数据概述 本数据集由韩国国立国语研究院(National Institute of the Korean... -
罗马尼亚语维基源文学语料库1963-2021
罗马尼亚语维基源文学语料库1963-2021 数据来源:互联网公开数据 标签:罗马尼亚文学,维基源,语料库,自然语言处理,机器学习,古典文学,文本分析 数据概述:... -
网络评论建设性分析语料库
网络评论建设性分析语料库 数据来源:互联网公开数据 标签:网络评论,建设性分析,语料库,自然语言处理,机器学习,媒体互动,社会分析 数据概述: 本数据集为Constructive Comments Corpus (C3),包含12,000条评论数据,每条评论均经过人工标注,标注内容包括评论的建设性特征及其相关属性。该数据集是从Simon Fraser... -
讽刺文本情感分析语料库数据集V2-讽刺文本分类数据集
讽刺文本情感分析语料库数据集V2-讽刺文本分类数据集 数据来源:互联网公开数据 标签:讽刺,情感分析,文本分类,自然语言处理,语料库,机器学习,社交媒体,语言学 数据概述:... -
泰语文本处理数据集
泰语文本处理数据集 数据来源:互联网公开数据 标签:自然语言处理,泰语,文本分析,语料库,语言研究,机器学习,数据稀缺,创业生态,商业分析,投资趋势,行业分布 数据概述: 本数据集旨在支持泰语文本处理和自然语言处理(NLP)研究。数据集包含泰... -
英语语言学习者能力评估语料库1963-2021
英语语言学习者能力评估语料库1963-2021 数据来源:互联网公开数据 标签:英语学习者,语言能力评估,写作样本,语料库,NLP,教育研究,评估方法 数据概述:... -
垃圾邮件过滤研究-SpamAssassin邮件数据集
垃圾邮件过滤研究-SpamAssassin邮件数据集 数据来源:互联网公开数据 标签:垃圾邮件,SpamAssassin,邮件,文本分类,自然语言处理,机器学习,贝叶斯,语料库 数据概述:... -
阿尔巴尼亚方言语料库数据集2023
阿尔巴尼亚方言语料库数据集2023 数据来源:互联网公开数据 标签:阿尔巴尼亚方言,语料库,社交媒体数据,地缘标签,机器学习,语言学研究 数据概述: 阿尔巴尼亚方言语料库数据集是由ERCAN CANHASI和REXHEP SHIJAKU基于《The Albanian Dialect... -
技能与职位描述语料库数据集
技能与职位描述语料库数据集 数据来源:互联网公开数据 标签:技能,职位描述,自然语言处理,技能提取,机器学习,语料库,技能分析 数据概述: 本数据集基于大量职位描述数据构建,经过多轮数据清洗、格式标准化和预处理,最终形成了一套结构化、高质量的技能语料库。数据集包含了与技能相关的文本信息,适用于技能提取、技能分类、技能推荐等场景。 数据用途概述:... -
孟加拉语维基百科语料库数据集
孟加拉语维基百科语料库数据集 数据来源:互联网公开数据 标签:孟加拉语,维基百科,自然语言处理,NLP,文本分析,机器学习,语料库 数据概述:... -
PHINC-平行印地英混合语社交媒体语料库用于机器翻译
PHINC-平行印地英混合语社交媒体语料库用于机器翻译 数据来源:互联网公开数据 标签:印地英混合语,机器翻译,社交媒体,代码混合,自然语言处理,多语言处理,语料库 数据概述:... -
德语词汇列表数据集
德语词汇列表数据集 数据来源:互联网公开数据 标签:德语词汇,语言学,语料库,书籍,文本分析,教育,研究 数据概述: 本数据集收录了11本德语书籍的文本内容,总计超过3000页。数据集中只包含一个字段,为德语词汇列表。这些书籍来源于互联网资源,包括DOABooks和USP E-Disciplinas平台上的相关文档。 数据用途概述:...