-
楚瓦什语维基百科平行语料库数据集Chuvash-WikiParallelCorpusDataset-kvzhirnov
楚瓦什语维基百科平行语料库数据集Chuvash-WikiParallelCorpusDataset-kvzhirnov 数据来源:互联网公开数据 标签:语言资源,平行语料库,自然语言处理,机器翻译,楚瓦什语,维基百科,多语言数据,文本分析 数据概述:... -
阿法奥罗莫语维基百科数据集AfaanOromoWikipediaDataset-beknanchemedabeki
阿法奥罗莫语维基百科数据集AfaanOromoWikipediaDataset-beknanchemedabeki 数据来源:互联网公开数据 标签:维基百科,语言资源,数据集,自然语言处理,文本挖掘,多语言,人工智能,语言学 数据概述: 该数据集包含来自阿法奥罗莫语维基百科的文本数据,记录了阿法奥罗莫语维基百科的完整内容。主要特征如下:... -
图卢维基百科数据转储2023年数据集-moreducks
图卢维基百科数据转储2023年数据集-moreducks 数据来源:互联网公开数据 标签:维基百科,数据集,自然语言处理,文本分析,机器学习,知识图谱,语言学,信息检索 数据概述: 该数据集包含来自图卢维基百科的2023年数据转储,记录了图卢维基百科上的文章内容和元数据。主要特征如下: 时间跨度:数据记录的时间范围从图卢维基百科创建到2023年。... -
中文维基百科词向量模型训练数据集-文本语料-2023年
中文维基百科词向量模型训练数据集-文本语料-2023年 数据来源:互联网公开数据 标签:自然语言处理, 词向量, word2vec, 文本语料, 中文, 维基百科, 机器学习, 深度学习, 训练数据 数据概述:... -
维基百科科学主题条目数据集WikipediaScienceTopicDataset-shams1
维基百科科学主题条目数据集WikipediaScienceTopicDataset-shams1 数据来源:互联网公开数据 标签:科学知识,维基百科,数据集,自然语言处理,文本分析,教育研究,信息检索,数据挖掘 数据概述: 该数据集包含来自维基百科的科学主题条目数据,记录了维基百科上关于科学领域的条目信息。主要特征如下:... -
法语维基百科数据集WikiFrenchDataset-manueldesiretaira
法语维基百科数据集WikiFrenchDataset-manueldesiretaira 数据来源:互联网公开数据 标签:维基百科,法语,数据集,自然语言处理,文本分析,机器学习,语言学,学术资源 数据概述:该数据集包含来自法语维基百科的数据,记录了维基百科中各个条目的内容。主要特征如下: 时间跨度:数据记录的时间范围从2001年到2023年。... -
-
维基百科文章上下文语境数据集WikipediaArticleContextDataset-yalickj
维基百科文章上下文语境数据集WikipediaArticleContextDataset-yalickj 数据来源:互联网公开数据 标签:自然语言处理,文本分析,维基百科,数据集,语境理解,机器学习,文本挖掘,知识图谱 数据概述:该数据集包含来自维基百科的文章数据,旨在研究文章的上下文语境信息。主要特征如下:... -
维基电影分类与描述数据集2023
维基电影分类与描述数据集2023 数据来源:互联网公开数据 标签:电影,维基百科,分类,描述,电影数据,娱乐研究,文化分析 数据概述: 本数据集包含从维基百科获取的130,406部电影的详细描述和分类信息。数据集通过本地维基数据转储获取电影名称,并使用wikipediaapi库下载每部电影的描述及类别信息,提供了全面的电影数据资源。 数据用途概述:... -
维基百科数据集DCWikiDataCSV-jungwoonseok
维基百科数据集DCWikiDataCSV-jungwoonseok 数据来源:互联网公开数据 标签:维基百科,数据集,文本分析,自然语言处理,机器学习,信息检索,学术资源,知识图谱 数据概述:该数据集包含来自维基百科的数据,记录了大量维基百科页面的内容和属性。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2020年。... -
维基百科字母顺序分类数据集WikiAZDataset-fidanmusazade
维基百科字母顺序分类数据集WikiAZDataset-fidanmusazade 数据来源:互联网公开数据 标签:维基百科,数据集,字母分类,文本挖掘,信息检索,自然语言处理,机器学习,知识图谱 数据概述: 该数据集包含来自维基百科的数据,记录了维基百科条目按照字母顺序分类的详细信息。主要特征如下: 时间跨度:数据记录的时间范围从维基百科的创建至今。... -
维基百科文章向量文件数据集WikipediaArticlesVectorFileDataset-sachinsk
维基百科文章向量文件数据集WikipediaArticlesVectorFileDataset-sachinsk 数据来源:互联网公开数据 标签:维基百科,文章向量,自然语言处理,数据集,机器学习,文本分析,词嵌入,信息检索 数据概述: 该数据集包含来自维基百科的文章向量数据,记录了维基百科文章的词嵌入向量。主要特征如下: 时间跨度:... -
维基百科法语数据集WikipediaFrenchDataset-manueldesiretaira
维基百科法语数据集WikipediaFrenchDataset-manueldesiretaira 数据来源:互联网公开数据 标签:维基百科,法语,数据集,自然语言处理,文本分析,语言学,机器学习,信息检索 数据概述: 该数据集包含来自维基百科的法语语言内容,记录了多个领域的百科全书条目。主要特征如下:... -
维基百科矿物数据信息综合数据库-florianneukirchen
维基百科矿物数据信息综合数据库-florianneukirchen 数据来源:互联网公开数据 标签:矿物学,矿物,维基百科,化学成分,晶体结构,莫氏硬度,Strunz分类,地球科学 数据概述:... -
维基百科表格问答数据集-thedevastator
维基百科表格问答数据集-thedevastator 数据来源:互联网公开数据 标签:表格问答,自然语言处理,人工智能,数据科学,复杂问题,维基百科,半结构化数据 数据概述:... -
印度NIFTY50成分公司维基百科文章文本数据集-aakashsaroop
印度NIFTY50成分公司维基百科文章文本数据集-aakashsaroop 数据来源:互联网公开数据 标签:NIFTY50, 印度, 股票市场, 公司信息, 维基百科, 文本数据, 金融, 商业 数据概述: 本数据集包含了印度NIFTY... -
奔跑吧兄弟韩剧维基百科数据集RunningManKoreanShowWikipediaDataset-zeeniye
奔跑吧兄弟韩剧维基百科数据集RunningManKoreanShowWikipediaDataset-zeeniye 数据来源:互联网公开数据 标签:奔跑吧兄弟,韩剧,电视剧,维基百科,数据集,文化研究,媒体分析,娱乐产业 数据概述:该数据集包含来自维基百科的《奔跑吧兄弟》韩剧的相关数据,记录了这部韩国著名综艺节目从首播以来的详细信息。主要特征如下:... -
印地语维基百科数据集HindiWikipediaDataset-vjdwary
印地语维基百科数据集HindiWikipediaDataset-vjdwary 数据来源:互联网公开数据 标签:维基百科,印地语,数据集,自然语言处理,文本分析,机器学习,语言资源,多语言处理 数据概述: 该数据集包含来自印地语维基百科的文本数据,记录了维基百科上的文章内容。主要特征如下:... -
孟加拉语维基百科文本数据集
孟加拉语维基百科文本数据集 数据来源:互联网公开数据 标签:孟加拉语,维基百科,文本数据,自然语言处理,机器学习,语言模型,文本挖掘 数据概述:... -
土耳其维基百科人物出生日期数据集1923-2010-rusiano
土耳其维基百科人物出生日期数据集1923-2010-rusiano 数据来源:互联网公开数据 标签:土耳其,维基百科,人物,出生日期,历史,数据分析,人口统计 数据概述:...