-
阿尔及利亚网阿拉伯语新闻文章数据集1963-2021
阿尔及利亚网阿拉伯语新闻文章数据集1963-2021 数据来源:互联网公开数据 标签:阿拉伯语新闻,自然语言处理,机器学习,语料库,情感分析,主题分类,命名实体识别 数据概述:... -
多语言命名实体识别数据集
多语言命名实体识别数据集 数据来源:互联网公开数据 标签:命名实体识别,多语言数据,自然语言处理,语言模型,数据标注,机器学习,深度学习 数据概述:... -
孟加拉语命名实体识别数据集B-NER2023年
孟加拉语命名实体识别数据集B-NER2023年 数据来源:互联网公开数据 标签:孟加拉语,命名实体识别,自然语言处理,数据集,基础评估,学术研究 数据概述: 本数据集B-NER收录了大量孟加拉语文本中的命名实体,涵盖了人名、地名、组织名等类别,是目前最大的孟加拉语命名实体数据集。数据集经过精心标注,为孟加拉语自然语言处理研究提供了坚实的基础。... -
伦巴第语命名实体识别与语言训练数据集
伦巴第语命名实体识别与语言训练数据集 数据来源:互联网公开数据 标签:伦巴第语,命名实体识别,NER,语言模型,文本处理,自然语言处理,维基百科,WikiANN,语言训练,文本标注 数据概述: 本数据集是基于WikiANN项目构建的伦巴第语(Lombard)文本数据集,用于命名实体识别(NER)和语言模型训练。... -
COVID-19扩展元数据语义知识树数据集
COVID-19扩展元数据语义知识树数据集 数据来源:互联网公开数据 标签:COVID-19,元数据,医学知识,命名实体识别,知识图谱,语义分析,分类树 数据概述: 本数据集基于COVID-19开放研究数据集,通过结合医学领域专业知识和语义分析技术,对原始文章元数据进行了扩展和结构化处理。数据集包含了以下内容: 1. 每行数据的唯一编号。 2.... -
期刊引用数据命名实体识别数据集
期刊引用数据命名实体识别数据集 数据来源:互联网公开数据 标签:期刊引用,命名实体识别,学术文献,数据结构化,数据库管理,研究分析,数据集成,机器学习,数字图书馆,学术网络 数据概述:... -
印度区域语言命名实体识别标注数据集
印度区域语言命名实体识别标注数据集 数据来源:互联网公开数据 标签:命名实体识别,印度语言,数据标注,自然语言处理,Tamil,NER,区域语言 数据概述:... -
多语言印地语NLP数据集
多语言印地语NLP数据集 数据来源:互联网公开数据 标签:印地语NLP,自然语言处理,机器翻译,情感分析,命名实体识别,文本摘要,语言理解,多语言文本,新闻文章,社交媒体,对话文本 数据概述:... -
山区命名实体识别数据集
山区命名实体识别数据集 数据来源:互联网公开数据 标签:命名实体识别,山区,自然地理,文本分析,机器学习,自然语言处理 数据概述: 本数据集用于命名实体识别(NER)任务,旨在识别文本中的山区名称。数据集中的每条记录对应一个由OpenAI的ChatGPT生成的推文或句子。数据集包含多种类型的推文/文本,其中包括专注于山区体验的内容,也可能涉及其他主题。... -
命名实体识别数据集
命名实体识别数据集 数据来源:互联网公开数据 标签:命名实体识别,自然语言处理,预训练语言模型,文本标注,机器学习,数据科学,Kaggle数据集 数据概述: 本数据集主要用于运行基于预训练语言模型的命名实体识别(NER)任务的笔记本。数据集包含三个关键字段:1. 文本内容(Text),2. 实体标注(Labels),3.... -
命名实体识别文本信息标注数据集
命名实体识别文本信息标注数据集 数据来源:互联网公开数据 标签:命名实体识别,自然语言处理,文本分析,机器学习,数据标注,信息抽取,文本挖掘 数据概述:... -
多语言维基百科命名实体识别数据集
多语言维基百科命名实体识别数据集 数据来源:互联网公开数据 标签:多语言,维基百科,命名实体识别,PER,LOC,ORG,MISC,自然语言处理,机器学习 数据概述:... -
Coleridge竞赛数据集标签挖掘与整理数据集
Coleridge竞赛数据集标签挖掘与整理数据集 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本挖掘,机器学习,命名实体识别,Coleridge竞赛,标签提取,数据标注 数据概述:... -
-
综合新闻文章数据集
综合新闻文章数据集 数据来源:互联网公开数据 标签:新闻文章,自然语言处理,情感分析,主题建模,机器学习,文本分类,命名实体识别 数据概述: 本数据集汇集了来自多个来源的新闻文章,涵盖了包括科技、体育、金融、政治、教育、健康和娱乐在内的多个类别。数据集旨在为自然语言处理(NLP)任务、情感分析、主题建模等机器学习应用提供多样且广泛的数据支持。... -
印度最高法院判决文件与分析数据集1963-2021
印度最高法院判决文件与分析数据集1963-2021 数据来源:互联网公开数据 标签:最高法院,印度,法律判决,文本分析,命名实体识别,TF-IDF,词向量,情感分析,RNN 数据概述: 本数据集包含从印度最高法院网站抓取的判决文件及其分析结果。数据集包括两个主要文件:data_files.csv 和... -
多语言命名实体识别数据集英语
多语言命名实体识别数据集英语 数据来源:互联网公开数据 标签:多语言,命名实体识别,PER,LOC,ORG,MISC,自然语言处理 数据概述: 本数据集为多语言命名实体识别任务提供了一个经过处理的数据集版本,主要来源于GitHub项目(https://github.com/afshinrahimi/mmner),并在Amazon Cloud... -
-