• 推荐课程
5
分享
收藏

1. 每个实验室都应该搭建自己的 Blast 网站


假如你需要研究苹果基因组中与果皮颜色相关的基因,而果皮颜色在梨中已经研究的很清楚。所以,我们需要以梨中控制果皮颜色的基因作为 query,以苹果的整个基因集作为 Database,进行 blast 搜索。那么,你要怎么实现这个事情呢?

如果你研究的物种基因序列已经包含在了 NCBI 数据库中,那么可以直接使用 NCBI 的网页版 blast。

如果NCBI 不包含你研究的物种数据,比如最新版的苹果基因组,或者是自己拼接的基因组、转录组,这时候,你就可以自行搭建一个私有的 blast 网站。

目前,搭建blast 网站的软件有两款,ViroBLASTSequenceServer。我们介绍下 ViroBLAST 的使用。

2. 安装 ViroBLAST

# 安装 blast+
$ conda install blast

# 安装 apache2 服务
$ sudo apt-get install apache2 

# 安装 PHP
sudo apt-get install libapache2-mod-php php php-gd

# 下载 viroblast
$ wget http://indra.mullins.microbiol.washington.edu/viroblast/download.php?ID=viroblast.tar.gz
$ mv download.php?ID=viroblast.tar.gz viroblast.tar.gz

# 解压
$ tar -zxvpf viroblast.tar.gz

# 移动到 /var/www/html 下
$ mv viroblast /var/www/html/

网页访问:http://hostname/viroblast/viroblast.php

3. 配置

构建 blast 数据库
基因集作为 blast 数据库放在 db 文件夹里。我们用苹果的蛋白序列来测试。

$ cd db/protein
$ wget wget https://iris.angers.inra.fr/gddh13/downloads/GDDH13_1-1_prot.fasta.bz2
$ bunzip2 GDDH13_1-1_prot.fasta.bz2
$ makeblastdb -in GDDH13_1-1_prot.fasta -out GDDH13 -dbtype prot

参考配置文件
配置文件为:viroblast.ini

# 配置 blast+ 路径
blast+: /home/genek/ncbi-blast-2.7.1+/bin
# 配置数据库
blastn: test_na_db => Nucleotide test database
blastp: test_aa_db => Protein test database, GDDH13 => Apple Protein Database
blastx: test_aa_db => Protein test database, GDDH13 => Apple Protein Database
tblastn: test_na_db => Nucleotide test database
tblastx: test_na_db => Nucleotide test database
评论(0)
你还没有登录,请先登录注册
  • 还没有人评论,欢迎说说您的想法!