数据集

专利文献关键词关系分析数据集PatentDocumentKeywordRelationAnalysis-yuutahasegawa

数据来源：互联网公开数据

标签：专利分析, 文本挖掘, 关键词提取, 关系抽取, 自然语言处理, 专利分类, 文本相似度, 知识图谱

数据概述：该数据集包含来自专利文献的关键词关系数据，记录了关键词之间的关联信息。主要特征如下：时间跨度：数据未标明具体时间，视作静态语料数据集使用。地理范围：数据来源于全球范围内的专利文献，涵盖多个技术领域。数据维度：包括id（唯一标识符），anchor（锚点关键词），target（目标关键词），context（上下文信息），score（关联分数），code（专利分类号），title（专利标题），section（专利所属章节），class（专利分类号），subclass（子分类号），group（组别），main_group（主组别），anchor_lem（锚点关键词词干），target_lem（目标关键词词干）。数据格式：CSV格式，文件名为train_with_spacy.csv，便于文本处理和关系分析。来源信息：数据来源于专利文献，并经过关键词提取和关系构建处理。该数据集适合用于专利技术发展趋势分析、专利分类、关键词关联分析、以及知识图谱构建等领域。

数据用途概述：该数据集具有广泛的应用潜力，特别适用于以下场景：研究与分析：适用于自然语言处理、信息检索、知识图谱构建等领域的学术研究，例如关键词关系挖掘、专利技术演进分析等。行业应用：可以为知识产权行业、技术情报分析机构提供数据支持，特别是在专利检索、技术竞争分析、技术布局规划等方面。决策支持：支持企业进行技术研发方向的决策、竞争对手分析、以及技术风险评估。教育和培训：作为自然语言处理、信息检索、专利分析等课程的实训数据，帮助学生和研究人员深入理解专利文献分析方法。此数据集特别适合用于探索关键词之间的关联关系，分析不同技术领域的发展趋势，并构建技术知识图谱，从而帮助用户更好地理解和利用专利信息。

数据与资源

versions_20250328015938.zipZIP
0.91 MiB

下载

附加信息

字段	值
版本	1.0
数据集大小	0.91 MiB
最后更新	2025年4月29日
创建于	2025年4月29日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。