Linux-based Essential Bioinformatics
Linux生物信息技术基础
北京大学本研合上课
第6讲 BLAST应用实例
简介
基于序列局部相似性的数据库搜索系统(Basic Local Alignment Search Tool, BLAST)是常用生物信息工具,
由美国国家生物技术信息中心NCBI负责开发、维护和更新。BLAAST系统包括通用程序和专用程序两部分。
(
NCBI BLAST主页)
通用程序包括:
- BlastP: 用蛋白质序列搜索蛋白质序列数据库
- PSI-BLAST: 位点特异性迭代BLAST (Position-specific iterated BLAST)
- DELTA-BLAST: 基于保守结构域的快速搜索(Domain Enhanced Lookup Time Accelarated BLAST)
- PHI-BLAST: 基于序列模体的数据库搜索(Pattern Hit Initiated BLAST)
- BlastN: 用核酸序列搜索核酸序列数据库
- BlastX: 将核酸序列按6条读码框翻译成蛋白质序列后搜索蛋白质序列数据库
- tBlastN: 将核酸序列数据库中的序列按6条读码框翻译成蛋白质序列,用蛋白质序列搜索翻译后得到的蛋白质序列
专用程序包括
-
下载、安装、配置
- 下载:教学服务器公用目录/rd1/home/public/BLAST/BLAST_TOOL/ncbi-blast-2.16.0+-x64-linux.tar.gz
(本地下载)
(NCBI文件服务器下载)
-
安装:
-
在本人根目录下创建安装目录install/blast
mkdir -p install/blast
-
在安装目录install/blast下建立公共目录BLAST软件包链接
ln -s /rd1/home/public/BLAST/BLAST_TOOL/ncbi-blast-2.16.0+-x64-linux.tar.gz .
-
在安装目录install/blast下解压
tar zxvf ncbi-blast-2.16.0+-x64-linux.tar.gz
-
配置
-
在用户根目录下创建bin子目录
mkdir bin
- 将安装目录bin下文件复制到用户根目录bin子目录下
cp ~/install/blast/ncbi-blast-2.16.0+/bin/* ~/bin
实例1:人的血红蛋白alpha和beta亚基比对
- 目的:了解BLAST算法的基本原理和步骤
- 程序:blastp -query HBA_HUMAN.FASTA -subject HBB_HUMAN.FASTA -out HBA-HBB.out
- 结果:分值114, 期望值2e-38,相同位点43%,相似位点61%,空位三处6%
实例2:拟南芥和水稻SPL转录因子比较
- 目的:找出拟南芥17个SPL和水稻19个SPL转录因子中的同源基因
- 程序:blastp -query 17SPL_ARATH.FASTA -subject 19SPL_ORYSJ.FASTA -out SPL.out -outfmt 7
- 结果:SPL7_ARATH与SPL9_ORYSJ为同源基因
实例3
实例4
实例5
参考文献
-
罗静初,序列数据库搜索系统BLAST简介
(知网首发)