DNA序列对齐算法数据集1963-2021
数据来源:互联网公开数据
标签:DNA序列,对齐算法,Needleman-Wunsch算法,机器学习,并行计算,生物信息学,序列分析
数据概述:
本数据集收录了六组DNA/RNA序列对齐数据,用于一种常见的序列对齐算法——Needleman-Wunsch算法。研究提出了一种利用机器学习技术实现的快速并行算法。当前实现使用多层感知器和ADAM优化器,实现了99.7%的准确率,并在两个长度为4.1百万核苷酸的DNA序列上达到了每秒2912 Giga细胞更新的性能。通过分治策略,该实现适用于极长序列的对齐。
数据用途概述:
该数据集适用于DNA序列对齐算法的研究、开发和优化。研究人员可以利用此数据集评估和比较不同的序列对齐方法。此外,该数据集还适用于生物信息学研究,帮助科学家理解DNA序列的相似性和差异性。数据集也适合用于教育培训,帮助学习者掌握序列对齐的基本原理和应用方法。
数据集包含以下文件:
- csvlist.txt(在zip文件中)
- csv3testdata.csv(数据集3T)
- csv6testdata.csv(数据集6T)
更多信息请参阅参考文献。使用本数据集时,请引用相关文献。
参考文献:
1. Rashed, A. E. E. D., Amer, H. M., El-Seddek, M., & Moustafa, H. E. D. (2021). Sequence Alignment Using Machine Learning-Based Needleman-Wunsch Algorithm. IEEE Access, 9, 109522-109535.
2. Rashed, A. E. E. D., Obaya, M., El, H., & Moustafa, D. (2021). Accelerating DNA pairwise sequence alignment using FPGA and a customized convolutional neural network. Computers & Electrical Engineering, 92, 107112.
视频教程:https://youtube.com/playlist?list=PLAI6JViu7XmfZWy3wtE4A-dPCelzgwO3U
PPT演示:https://www.slideshare.net/AmrRashed3/implementation-of-dna-sequence-alignment-algorithms-using-fpga-mland-cnn?from_m_app=android
IEEE DATAPORT链接:https://ieee-dataport.org/documents/dna-sequence-alignment-datasets-based-nw-algorithm