Linux-based Essential Bioinformatics
Linux生物信息技术基础
北京大学本研合上课

第6讲 BLAST应用实例

简介

基于序列局部相似性的数据库搜索系统(Basic Local Alignment Search Tool, BLAST)是常用生物信息工具, 由美国国家生物技术信息中心NCBI负责开发、维护和更新。BLAAST系统包括通用程序和专用程序两部分。 (NCBI BLAST主页)

通用程序包括:
  1. BlastP: 用蛋白质序列搜索蛋白质序列数据库
    1. PSI-BLAST: 位点特异性迭代BLAST (Position-specific iterated BLAST)
    2. DELTA-BLAST: 基于保守结构域的快速搜索(Domain Enhanced Lookup Time Accelarated BLAST)
    3. PHI-BLAST: 基于序列模体的数据库搜索(Pattern Hit Initiated BLAST)
  2. BlastN: 用核酸序列搜索核酸序列数据库
  3. BlastX: 将核酸序列按6条读码框翻译成蛋白质序列后搜索蛋白质序列数据库
  4. tBlastN: 将核酸序列数据库中的序列按6条读码框翻译成蛋白质序列,用蛋白质序列搜索翻译后得到的蛋白质序列
专用程序包括

下载、安装、配置

  1. 下载:教学服务器公用目录/rd1/home/public/BLAST/BLAST_TOOL/ncbi-blast-2.16.0+-x64-linux.tar.gz (本地下载) (NCBI文件服务器下载)
  2. 安装:
    1. 在本人根目录下创建安装目录install/blast
      mkdir -p install/blast
    2. 在安装目录install/blast下建立公共目录BLAST软件包链接
      ln -s /rd1/home/public/BLAST/BLAST_TOOL/ncbi-blast-2.16.0+-x64-linux.tar.gz .
    3. 在安装目录install/blast下解压
      tar zxvf ncbi-blast-2.16.0+-x64-linux.tar.gz
  3. 配置
    1. 在用户根目录下创建bin子目录 mkdir bin
    2. 将安装目录bin下文件复制到用户根目录bin子目录下 cp ~/install/blast/ncbi-blast-2.16.0+/bin/* ~/bin

实例1:人的血红蛋白alpha和beta亚基比对

  1. 目的:了解BLAST算法的基本原理和步骤
  2. 程序:blastp -query HBA_HUMAN.FASTA -subject HBB_HUMAN.FASTA -out HBA-HBB.out
  3. 结果:分值114, 期望值2e-38,相同位点43%,相似位点61%,空位三处6%

实例2:拟南芥和水稻SPL转录因子比较

  1. 目的:找出拟南芥17个SPL和水稻19个SPL转录因子中的同源基因
  2. 程序:blastp -query 17SPL_ARATH.FASTA -subject 19SPL_ORYSJ.FASTA -out SPL.out -outfmt 7
  3. 结果:SPL7_ARATH与SPL9_ORYSJ为同源基因

实例3

实例4

实例5

参考文献

  1. 罗静初,序列数据库搜索系统BLAST简介 (知网首发)
英文ABC主页 | 中文LEB主页 | 教学计划 | 教学大纲 | 教学实例 | 常用命令 ] [Linux教程 | Linux基础 | Linux命令全称 | vim键盘 | 数据科学 ]