波斯语医药问答与专家回复专业数据集

数据集概述

该数据集包含一万二千三百九十九条按药品名称分类的波斯语评论,其中三千八百一十条(百分之三十八点一)附有专家回复及专家专业领域信息。数据集还涵盖药品名称、Martindale分类、专家类别与专业领域数据,以及波斯语内容的英文翻译版本。

文件详解

该数据集由数据文件和代码文件组成,具体说明如下: - 数据文件: - Dataset.xlsx: Excel格式文件,包含波斯语医药评论、专家回复、药品名称、Martindale分类、专家专业领域及英文翻译等核心数据。 - 代码文件 (位于 code/Webscraping/ 目录下): - scraping english name of martindale catg.ipynb: Jupyter Notebook文件,用于抓取Martindale分类英文名称的代码 - scraping Doctor expertises.ipynb: Jupyter Notebook文件,用于抓取医生专业领域信息的代码 - scraping comments.ipynb: Jupyter Notebook文件,用于抓取评论数据的代码

适用场景

  • 自然语言处理模型训练: 用于微调波斯语医药领域问答大语言模型(LLMs)
  • 医药信息分析: 分析波斯语场景下常见的药品相关问题及专家回复规律
  • 医学数据挖掘: 研究药品Martindale分类与用户咨询内容的关联
  • 跨语言医药研究: 基于波斯语-英语双语数据开展多语言医药信息分析
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 4.18 MiB
最后更新 2025年11月28日
创建于 2025年11月28日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。