自然语言意图识别用于语音助手的IDE操作指令数据集
数据来源:互联网公开数据
数据来源:
本数据集由开发者自建并审核(self-approved),用于自然语言处理中的意图识别任务,特别针对集成开发环境(IDE)中的常见操作命令。
数据内容:
该数据集包含用户在IDE中可能发出的自然语言指令及其对应的操作意图,共覆盖25种以上与文件、函数、类管理相关的常见开发功能。数据集可用于训练意图分类模型,从而实现自然语言驱动的代码编辑、IDE语音助手等应用。
字段定义:
text:用户输入的自然语言指令或命令,形式多样,可包含不同表达风格。
intent:该指令对应的IDE功能意图标签,涵盖文件/文件夹操作、函数/类的管理、代码运行与编辑等操作。
意图类别(部分示例):
open_file_folder
close_file_folder
rename_file_folder
create_file_folder
save_file_folder
import_function / import_class
move_function / move_class
modify_function_name / modify_class_name
delete_function / delete_class
copy_function / copy_class
compile_code
run_code
undo
redo
数据格式:
CSV格式,共两列:text 和 intent。每行为一个训练样本,适用于直接导入NLP模型进行文本分类任务。
时间范围:
该数据集不包含时间维度信息,为静态文本数据集。
更新频率:
数据集为静态版本,暂未说明是否存在后续版本或定期更新机制。
适用场景:
IDE语音/文本助手开发
编程语言智能命令解析
自然语言指令意图识别模型训练
人机交互系统中的文本理解模块
编程教育与辅助开发工具构建
标签:意图识别,自然语言指令,IDE自动化,开发者工具,NLP分类任务,代码编辑助手,结构化数据,命令解析,文本分类,人机交互