-
海量网页文本内容采集数据集-CommonCrawl样本数据
海量网页文本内容采集数据集-CommonCrawl样本数据 数据来源:互联网公开数据 标签:网页文本,互联网,爬虫,数据挖掘,自然语言处理,文本分析,网页内容,Common Crawl 数据概述: 本数据集是Common Crawl数据集的一个样本,包含来自互联网的网页文本内容。Common... -
-
Habr-com网站IT技术文章发布数据集-2024
Habr-com网站IT技术文章发布数据集-2024 数据来源:互联网公开数据 标签:IT技术, 互联网, 科技, 文章, 博客, 数据分析, 商业, 计算机科学 数据概述: 本数据集包含了从 Habr.com 网站抓取的 38443 篇帖子数据。Habr.com 是一个专注于发布与信息技术、商业和互联网相关的文章、新闻和分析文章的网站。... -
谷歌主题与全球百万热门网站关联数据集
谷歌主题与全球百万热门网站关联数据集 数据来源:互联网公开数据 标签:谷歌主题,网站分类,域名,热门网站,数据分析,互联网,主题建模 数据概述: 本数据集整合了全球最受欢迎的100万个域名,并与谷歌主题进行了关联。域名数据来源于http://s3-us-west-1.amazonaws.com/umbrella-... -
维基百科关于谷歌的页面浏览量统计数据集-2023
维基百科关于谷歌的页面浏览量统计数据集-2023 数据来源:互联网公开数据 标签:维基百科,谷歌,页面浏览量,搜索,互联网,信息检索,数据分析,多语言 数据概述:... -
SaaS企业服务行业信息概览数据集
SaaS企业服务行业信息概览数据集 数据来源:互联网公开数据 标签:SaaS,软件服务,企业服务,行业分析,市场调研,公司信息,创业公司,技术,商业,互联网 数据概述: 本数据集包含了500家软件即服务(SaaS, Software as a... -
Steam平台全球下载带宽使用量统计数据集-按区域划分-时间序列
Steam平台全球下载带宽使用量统计数据集-按区域划分-时间序列 数据来源:互联网公开数据 标签:Steam,下载带宽,游戏,互联网,时间序列,数据分析,区域分布,网络流量,用户行为 数据概述:... -
谷歌用户搜索行为及广告点击数据集-2023年第一季度
谷歌用户搜索行为及广告点击数据集-2023年第一季度 数据来源:互联网公开数据 标签:谷歌,搜索,广告,点击,行为分析,用户画像,市场营销,数据,互联网 数据概述:... -
数据100000随机互联网域名数据集
数据100000随机互联网域名数据集 数据来源:互联网公开数据 标签:域名,互联网,测试,营销,数据集 数据概述: 本数据集包含100,000个已注册的互联网域名,适用于测试网络爬虫功能或验证市场营销想法。这些域名涵盖了不同的行业和用途,为用户提供了一个多样化的测试样本。 数据用途概述:... -
全球IPv4地址国家分配数据集
全球IPv4地址国家分配数据集 数据来源:互联网公开数据 标签:IPv4地址,互联网,IP分配,国家,网络,数据分析,地理分布,whois,国家代码 数据概述:... -
YouTube平台早期视频数据分析数据集-2005年
YouTube平台早期视频数据分析数据集-2005年 数据来源:互联网公开数据 标签:YouTube,视频,早期,互联网,社交媒体,数据分析,视频内容,用户行为 数据概述:... -
-
印度孟买地区招聘职位信息数据集-2021年2月
印度孟买地区招聘职位信息数据集-2021年2月 数据来源:互联网公开数据 标签:招聘,职位,就业,印度,孟买,求职,公司,行业,互联网,数据分析 数据概述: 本数据集包含2021年2月从shine.com网站(https://www.shine.com/job-search/jobs-in-... -
IP地址地理位置信息数据库数据集
IP地址地理位置信息数据库数据集 数据来源:互联网公开数据 标签:IP地址,地理位置,IP2Region,网络,位置信息,数据分析,区域划分,互联网,数据管理 数据概述:... -
-
纽约市-nyc域名注册信息数据集-2014年3月20日至2017年8月31日
纽约市-nyc域名注册信息数据集-2014年3月20日至2017年8月31日 数据来源:互联网公开数据 标签:.nyc域名,域名注册,纽约市,城市数据,网站,互联网,数据分析,市场营销 数据概述:... -
全球互联网顶级域名列表
本列表收录已加入DNS根域的顶级域名,正式列表请以IANA为准,截止2019年官方列表拥有1530个顶级域名[3],其中部分已弃用。 类型 根据IANA定义: 基础设施顶级域(ARPA) 通用顶级域(gTLD) 通用受限制顶级域(grTLD) 赞助类顶级域(sTLD) 国家和地区顶级域(ccTLD) 测试顶级域(tTLD) -
-
全球固定宽带订阅数据集2023
标题:全球固定宽带订阅数据集(2023) 数据内容: 该数据集记录了2023年全球范围内以至少256 kbit/s下载速度固定访问公共互联网的订阅信息。数据集包含以下字段: - Entity:标识订阅所属的实体(如国家、地区或运营商),共有222种不同的值。 - Code:标识订阅的编码,共有209种不同的值。 -... -
此数据集代表一组可能出现在互联网页面上的广告
数据集名称:此数据集代表一组可能出现在互联网页面上的广告 数据数量:3 数据集关键词:互联网 数据集格式:data, names, DOCUMENTATION