印度法律咨询数据集

印度法律咨询数据集数据来源：互联网公开数据
标签：法律咨询,印度法律,宪法,法律格式,律师专业,向量数据库,文本嵌入

数据概述：
本数据集结合了多个公开数据源，旨在为印度法律咨询领域提供全面的文本和结构化信息。数据集由以下部分组成：

法律文本数据：来源于Hugging Face平台上的两个数据集：
nisaar/Articles_Constitution_3300_Instruction_Set：包含印度宪法相关条款及其解释指导。
nisaar/Lawyer_GPT_India：涵盖印度律师专业领域的法律文档和案例分析。
法律格式与宪法背景：补充了来自https://www.legalhelplineindia.com/free-legal-formats/的法律格式文档和宪法相关内容，为数据集提供了更丰富的上下文支持。
向量数据库：数据集包含一个HNSWLib向量数据库（context.bin），其中每个向量维度为768，最大元素数为1275。该数据库存储了从文本数据中提取的嵌入向量，用于高效检索和语义匹配。
文本文件：text.csv包含了所有用于生成向量嵌入的原始文本内容，确保数据集的透明性和可追溯性。

数据用途概述：
本数据集适用于多个法律相关场景，尤其在印度法律咨询、法律研究、法律培训和法律技术创新领域具有重要价值。具体应用场景包括但不限于：

本数据集提供了丰富的法律文本和结构化数据，结合先进的向量检索技术，为印度法律领域提供了全面、高效的数据支持。

数据与资源

字段	值
版本	1.0
数据集大小	13.56 MiB
最后更新	2025年4月19日
创建于	2025年4月19日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。