-
BM25基础训练集数据集-danielphalen
BM25基础训练集数据集-danielphalen 数据来源:互联网公开数据 标签:信息检索,文本处理,数据集,自然语言处理,BM25,搜索算法,文本相似度,机器学习 数据概述:该数据集包含用于训练和评估BM25(Best Match 25)模型的文本数据,主要用于信息检索任务。主要特征如下: 时间跨度:数据涵盖了从特定时间段内收集的文本数据。... -
数据2018阿里巴巴NLP文本相似度数据集AtecNLPSimDataset-chongjiujjin
2018阿里巴巴NLP文本相似度数据集AtecNLPSimDataset-chongjiujjin 数据来源:互联网公开数据 标签:自然语言处理,文本相似度,数据集,机器学习,语义分析,人工智能,语言模型,情感分析 数据概述: 该数据集由阿里巴巴提供,专注于自然语言处理中的文本相似度任务。主要特征如下: 时间跨度:数据记录的时间范围为2018年。... -
Quora问答配对训练数据集QuoraQuestionPairTrainingDataset-ankitnarang
Quora问答配对训练数据集QuoraQuestionPairTrainingDataset-ankitnarang 数据来源:互联网公开数据 标签:问答配对,数据集,自然语言处理,文本相似度,机器学习,数据挖掘,信息检索,知识图谱 数据概述: 该数据集包含来自Quora问答平台的配对问题数据,记录了成对的问题及其相似性标签。主要特征如下:... -
SIAM-SES句子相似度数据集0-50-2-emam2002
SIAM-SES句子相似度数据集0-50-2-emam2002 数据来源:互联网公开数据 标签:自然语言处理,文本相似度,数据集,语义分析,机器学习,中文,情感分析,文本匹配 数据概述: 该数据集包含来自 SIAM-SES 的中文句子对,用于评估句子间的语义相似度。主要特征如下: 时间跨度:数据记录时间不明确,但数据集本身为静态数据。... -
Quora问答平台问题重复识别数据集
Quora问答平台问题重复识别数据集 数据来源:互联网公开数据 标签:问答平台,自然语言处理,机器学习,文本相似度,重复问题,Quora,语义分析 数据概述:... -
SentEval句子嵌入评估工具包数据集
SentEval句子嵌入评估工具包数据集 数据来源:互联网公开数据 标签:自然语言处理, 句子嵌入, 评估, 文本相似度, 情感分析, 语义理解, 迁移学习, 语言学探针 数据概述:... -
-
Quora平台重复问题识别数据集
Quora平台重复问题识别数据集 数据来源:互联网公开数据 标签:Quora,问答平台,重复问题,自然语言处理,文本相似度,数据挖掘,用户体验 数据概述:...