找到582个数据集

标签: NLP

过滤结果
  • 用于 NLP 任务的高质量金融新闻数据集

    2025年2月13日   

    此存储库包含从各个金融网站精心抓取的数据集。数据提取过程可确保文本高质量且准确,包括网站及其嵌入 PDF 的内容。 数据集特征 日期: 公告日期。 主题:财经新闻的主题。 内容:公告的全部内容,包括网站文本和 PDF。 附加处理字段 我们应用先进的 Mixtral 7X8 模型来生成以下附加字段:...
    packageimg
  • Math23K中文数学应用题NLP数据集

    2024年11月10日   

    Math23K 是为解决数学单词问题而创建的数据集,包含从互联网上爬取的 23、162 个中文问题。
    packageimg