-
-
arXiv论文摘要与嵌入向量每日更新数据集
arXiv论文摘要与嵌入向量每日更新数据集 数据来源:互联网公开数据 标签:arXiv,论文,摘要,嵌入向量,自然语言处理,机器学习,科研,学术,每日更新 数据概述: 本数据集包含每日arXiv论文的标题、摘要以及对应的嵌入向量。数据集每天更新,其中不包含周六、周日及节假日的论文。嵌入向量的计算方法详见提供的Notebook文件。... -
-
Steam游戏评论关键要素标注数据集-英语评论-2024
Steam游戏评论关键要素标注数据集-英语评论-2024 数据来源:互联网公开数据 标签:游戏评论,Steam,用户评价,文本分析,情感分析,自然语言处理,机器学习,数据标注 数据概述:... -
推特情感分析STS-Gold数据集
推特情感分析STS-Gold数据集 数据来源:互联网公开数据 标签:推特,情感分析,文本数据,社交媒体,情感极性,机器学习,自然语言处理 数据概述: 本数据集由Saif等人(2013)创建,包含2026条推文及其对应的ID和情感极性标签。这些推文用于训练情感分析模型。若使用本数据集,请引用原论文。 原论文引用:Saif, H., Fernandez,... -
-
多语言复杂问答数据集-涵盖8种语言
多语言复杂问答数据集-涵盖8种语言 数据来源:互联网公开数据 标签:多语言,问答,自然语言处理,NLP,机器翻译,语言模型,数据集,复杂问题,文本分析 数据概述: 本数据集由Hugging Face... -
学术引用意图分类数据集
学术引用意图分类数据集 数据来源:互联网公开数据 标签:学术引用,意图分类,科学文章,计算机科学,生物医学,生态学,数据挖掘,机器学习,文本分析,自然语言处理 数据概述: 本数据集来源于Huggingface... -
亚马逊产品评论情感分析数据集
亚马逊产品评论情感分析数据集 数据来源:互联网公开数据 标签:亚马逊,产品评论,情感分析,消费者反馈,市场研究,自然语言处理,数据分析 数据概述: 本数据集包含了亚马逊平台上各类产品的客户评论,涵盖了广泛的消费产品,提供了宝贵的消费者意见和情感见解。数据集中的评论内容丰富多样,有助于了解不同产品在消费者心中的表现和评价。 数据用途概述:... -
wikiHow文章读者反馈与文章特征关联数据集
wikiHow文章读者反馈与文章特征关联数据集 数据来源:互联网公开数据 标签:wikiHow,文章质量,读者反馈,自然语言处理,机器学习,文章分析,内容评估 数据概述:... -
垃圾邮件分类邮件数据集
垃圾邮件分类邮件数据集 数据来源:互联网公开数据 标签:垃圾邮件,邮件分类,文本分析,机器学习,数据挖掘,自然语言处理, Spam Detection 数据概述:... -
斯瓦希里语自然语言处理数据集
斯瓦希里语自然语言处理数据集 数据来源:互联网公开数据 标签:斯瓦希里语,自然语言处理,网络内容检测,机器学习,深度学习,人工智能,文本分类,数据安全 数据概述:... -
葡萄牙语文本到SQL查询生成数据集2023
葡萄牙语文本到SQL查询生成数据集2023 数据来源:互联网公开数据 标签:葡萄牙语,文本到SQL,自然语言处理,机器学习,数据库 数据概述: 本数据集是b-mc2/sql-create-context数据集的葡萄牙语翻译版本,基于WikiSQL和Spider数据集构建。数据集包含了葡萄牙语问题、SQL CREATE... -
阿拉伯语推特情感分析数据集
阿拉伯语推特情感分析数据集 数据来源:互联网公开数据 标签:阿拉伯语,推特,情感分析,社交媒体,文本分析,自然语言处理,情感趋势 数据概述: 本数据集来源于推特,包含用阿拉伯语书写的推文,并根据内容被标注为正面或负面。数据集涵盖了广泛的主题和情感表达,适用于分析阿拉伯语社交媒体上的公众情绪和观点。 数据用途概述:... -
希腊语COVID-19疫苗接种推文数据集
希腊语COVID-19疫苗接种推文数据集 数据来源:互联网公开数据 标签:希腊语,COVID-19,疫苗接种,社交媒体分析,自然语言处理,文本分类,公共卫生,数据标注 数据概述: 本数据集包含2021年7月至8月期间收集的希腊语推文,内容聚焦于COVID-19疫苗接种相关话题。数据集中的推文经过人工标注,为研究希腊语社交媒体内容提供了高质量的文本资源。... -
写作者数据集
写作者数据集 数据来源:互联网公开数据 标签:写作者,自然语言处理,文本分类,审计,多语言训练 数据概述: 本数据集包含从1963年至2021年间关于写作者的文本记录,文本主要以俄语撰写。数据集涵盖了各种类型的文档,包括但不限于文章、报告等,为自然语言处理和文本分类提供了丰富的训练素材。 数据用途概述:... -
-
印度尼西亚至土耳其患者医生问答数据集1963-2021
印度尼西亚至土耳其患者医生问答数据集1963-2021 数据来源:互联网公开数据 标签:患者,医生,问答,翻译,医学,自然语言处理,教育 数据概述:... -
OpenAIHumanEval代码生成评估数据集
OpenAIHumanEval代码生成评估数据集 数据来源:互联网公开数据 标签:代码生成,自然语言处理,编程,Python,模型评估,机器学习,Hugging Face,OpenAI,编程问题,单元测试 数据概述:... -
WhatsApp聊天记录分析数据集
WhatsApp聊天记录分析数据集 数据来源:互联网公开数据 标签:WhatsApp,聊天记录,社交媒体,数据分析,项目实践,初学者,数据挖掘,自然语言处理 数据概述:...