-
印度语维基百科文章问答对数据集-问答生成-36-6k
印度语维基百科文章问答对数据集-问答生成-36-6k 数据来源:互联网公开数据 标签:问答对,印度语,维基百科,自然语言处理,机器翻译,问答生成,文本数据,语言学习 数据概述:... -
美国电影维基百科数据-1970年代至2020年代
美国电影维基百科数据-1970年代至2020年代 数据来源:互联网公开数据 标签:电影,美国,维基百科,剧情,标题,图像,NLP,机器学习,推荐系统 数据概述:... -
伦巴第语命名实体识别与语言训练数据集
伦巴第语命名实体识别与语言训练数据集 数据来源:互联网公开数据 标签:伦巴第语,命名实体识别,NER,语言模型,文本处理,自然语言处理,维基百科,WikiANN,语言训练,文本标注 数据概述: 本数据集是基于WikiANN项目构建的伦巴第语(Lombard)文本数据集,用于命名实体识别(NER)和语言模型训练。... -
-
维基百科页面数据集
维基百科页面数据集 数据来源:互联网公开数据 标签:维基百科,文本内容,自然语言处理,嵌入模型,信息检索,知识图谱,数据挖掘 数据概述: 本数据集基于Wikipedia页面内容构建,包含从原始竞赛数据集中提取的问答数据。数据集主要字段包括问题ID、维基百科页面建议、页面内容等。此外,数据集中还包含了通过Sentence-... -
电子邮件通信网络数据集
电子邮件通信网络数据集 数据来源:互联网公开数据 标签:电子邮件网络,社交网络分析,信息传播,社区结构,网络科学,Enron,欧洲研究机构,维基百科,Resistance游戏,动态网络 数据概述: 本数据集包含多个电子邮件通信网络的数据,具体如下: email-... -
英国议会议员维基百科页面浏览数据与统计分析数据集2019-2024
英国议会议员维基百科页面浏览数据与统计分析数据集2019-2024 数据来源:互联网公开数据 标签:英国议会, 议员, 维基百科, 页面浏览量, 政治, 数据分析, 选举, 下议院, 上议院 数据概述:... -
维基百科关于谷歌的页面浏览量统计数据集-2023
维基百科关于谷歌的页面浏览量统计数据集-2023 数据来源:互联网公开数据 标签:维基百科,谷歌,页面浏览量,搜索,互联网,信息检索,数据分析,多语言 数据概述:... -
维基百科多语言文本识别数据集-2018
维基百科多语言文本识别数据集-2018 数据来源:互联网公开数据 标签:文本识别,多语言,维基百科,自然语言处理,机器学习,语言学,文本分类,数据集 数据概述: WiLI-2018数据集是一个用于评估多语言文本识别任务的基准数据集,包含了来自维基百科的235种语言的235,000个文本段落。该数据集经过精心平衡,并提供了训练集和测试集划分。... -
维基百科页面LLM科学考试训练数据集
维基百科页面LLM科学考试训练数据集 数据来源:互联网公开数据 标签:维基百科,LLM,科学考试,训练数据,物理概念,文本提取,教育研究 数据概述:... -
格莱美第一季数据集
格莱美第一季数据集 数据来源:互联网公开数据 标签:格莱美,电视剧,收视率,导演,流行度,数据可视化, IMDb,维基百科 数据概述: 本数据集收录了《格莱美》第一季至第六季的剧集信息,包括剧集编号、剧集标题、导演、播出日期以及剧集评分。剧集评分基于1至10的评分标准,由IMDb用户给出。 数据用途概述:... -
-
印度尼西亚维基百科表格数据集1963-2021
印度尼西亚维基百科表格数据集1963-2021 数据来源:互联网公开数据 标签:维基百科,印度尼西亚,表格数据,地理,人口统计,经济,文化,政治,数据提取,CSV文件 数据概述:... -
维基百科音乐艺术家关联关系数据集
维基百科音乐艺术家关联关系数据集 数据来源:互联网公开数据 标签:音乐,艺术家,维基百科,链接,关系,影响,风格,推荐系统,网络分析,数据可视化 数据概述:... -
-
-
YALICKJ维基百科带上下文数据集
YALICKJ维基百科带上下文数据集 数据来源:互联网公开数据 标签:维基百科,上下文,数据集,自然语言处理,机器学习,文本分析 数据概述: 本数据集基于YALICKJ在Kaggle上提供的维基百科数据集,并增加了由Chris Notebook生成的上下文列。数据集包含了维基百科页面的文本内容及其对应的上下文信息,适用于自然语言处理和机器学习任务。... -
数据3000文本恢复挑战提示数据集
数据3000文本恢复挑战提示数据集 数据来源:互联网公开数据 标签:文本恢复,提示生成,创造力,文本处理,专业设置,维基百科,相似度评分 数据概述:... -
中日游戏艺术家与插图师标签分类数据集2023
中日游戏艺术家与插图师标签分类数据集2023 数据来源:互联网公开数据 标签:中日游戏艺术家,插图师,标签分类,维基百科,生成式AI,话题分类 数据概述:... -
维基百科产品名称提及数据集
维基百科产品名称提及数据集 数据来源:互联网公开数据 标签:维基百科,产品名称,提及频率,时间序列,市场分析,产品趋势,自然语言处理 数据概述: 本数据集收录了维基百科页面中提及的产品名称及其出现频率,涵盖多个时间点的数据。数据集通过对维基百科文章的分析,提取出不同产品名称的提及情况,为了解市场趋势和产品影响力提供了宝贵的数据支持。 数据用途概述:...