Linux-based Essential Bioinformatics
Linux生物信息技术基础
北京大学本研合上课
第6讲 BLAST数据库搜索系统
简介
基于序列局部相似性的数据库搜索系统(Basic Local Alignment Search Tool, BLAST)是常用生物信息工具,
由美国国家生物技术信息中心NCBI负责开发、维护和更新。BLAAST系统包括通用程序和专用程序两部分。
(
NCBI BLAST主页)
通用程序包括:
- BlastP: 用蛋白质序列搜索蛋白质序列数据库
- PSI-BLAST: 位点特异性迭代BLAST (Position-specific iterated BLAST)
- DELTA-BLAST: 基于保守结构域的快速搜索(Domain Enhanced Lookup Time Accelarated BLAST)
- PHI-BLAST: 基于序列模体的数据库搜索(Pattern Hit Initiated BLAST)
- BlastN: 用核酸序列搜索核酸序列数据库
- BlastX: 将核酸序列按6条读码框翻译成蛋白质序列后搜索蛋白质序列数据库
- tBlastN: 将核酸序列数据库中的序列按6条读码框翻译成蛋白质序列,用蛋白质序列搜索翻译后得到的蛋白质序列
下载、安装、配置
- 下载:教学服务器公用目录/rd1/home/public/BLAST/BLAST_TOOL/ncbi-blast-2.16.0+-x64-linux.tar.gz
(本地下载)
(NCBI文件服务器下载)
-
安装:
-
在本人根目录下创建安装目录install/blast
mkdir -p install/blast
-
在安装目录install/blast下建立公共目录BLAST软件包链接
ln -s /rd1/home/public/BLAST/BLAST_TOOL/ncbi-blast-2.16.0+-x64-linux.tar.gz .
-
在安装目录install/blast下解压
tar zxvf ncbi-blast-2.16.0+-x64-linux.tar.gz
-
配置
-
在用户根目录下创建bin子目录
mkdir bin
- 将安装目录bin下文件复制到用户根目录bin子目录下
cp ~/install/blast/ncbi-blast-2.16.0+/bin/* ~/bin
应用实例
实例1:人的血红蛋白alpha和beta亚基比对
- 目的:了解BLAST算法的基本原理和步骤
- 用法:blastp -query HBA_HUMAN.FASTA -subject HBB_HUMAN.FASTA -out HBA-HBB.out
- 结果:分值114, 期望值2e-38,相同位点43%,相似位点61%,空位三处6%
实例2:拟南芥和水稻SPL转录因子比较
- 目的:找出拟南芥17个SPL和水稻19个SPL转录因子中的同源基因
- 用法:blastp -query 17SPL_ARATH.FASTA -subject 19SPL_ORYSJ.FASTA -out SPL.out -outfmt 7
- 结果:SPL7_ARATH与SPL9_ORYSJ为同源基因
实例3:764个玉米转录因子蛋白质序列及其编码序列数据库构建索引和搜索方法
- 目的:掌握构建数据库索引的基本方法,了解四种通用BLAST程序的基本用法
- 构建数据库索引方法
- makeblastdb -in ZMTF_CDS.FASTA dbtype nucl
- makeblastdb -in ZMTF_PEP.FASTA dbtype prot
- 数据库搜索命令
- 蛋白质序列搜索蛋白质序列数据库:blastp -query AtSPL3_PEP.FASTA -db ZMTF_PEP.FASTA -evalue 0.1 -out blastp
- 核酸序列搜索核酸序列数据库:blastn -query AtSPL3_CDS.FASTA -db ZMTF_CSDS.FASTA -evalue 0.1 -out blastn
- 核酸序列搜索蛋白质序列数据库:blastx -query AtSPL3_CDS.FASTA -db ZMTF_PEP.FASTA -evalue 0.1 -out blastx
<>蛋白质序列搜索核酸序列数据库:tblastn -query AtSPL3_PEP.FASTA -db ZMTF_CDS.FASTA -evalue 0.1 -out tblastn
- 结果分析:blastp可以搜索到4个序列,而blastn搜索不到,blastx和tblastn结果与blastp相同
参考文献
-
罗静初,序列数据库搜索系统BLAST简介
(知网首发)