众所周知,python在数据分析领域十分常用,而作为数据科学的一个分支,生物信息学也是对python偏爱有加。今天我们就来看看一个功能强大的python生信分析包——Biopython。什么?还不知道?知道又不会用?又out啦各位,现在跟着小编来一步步实现一些很实用的python分析工具吧。
征服星辰
实现目标
预备工作
学点语言 装好pyhton
当然作为入门,python语言基础还是要会一点点的,不过不需要很深。工具嘛,我们只用关心怎么用得溜,平时也没人追究勺子咋造的只管拿来用,是吧~Biopython是一个包含大量实用功能模块的集合,它支持的数据结构可谓非常广泛:
-
Blast结果 – standalone和在线Blast
-
Clustalw
-
FASTA
-
GenBank
-
PubMed和Medline
-
……
太多了,这里就不一一列举了,更多详情访问项目主页就可以,介绍非常详细。
项目主页:https://github.com/biopython/biopython
安装pyhton
Windows平台的用户请先安装好python。喏,在这里下载:
https://www.python.org/ftp/python/2.7.13/python-2.7.13.msi
一路next就可以安装好(python版本随意,2.X和3.X都有对应的Biopython包,上面的链接是2.X版本的)。
进入正题
搭建分析环境
下面,小编来教大家搭建虚拟的Linux分析环境。
啥叫虚拟环境呢?举个不恰当的栗子:假如你是一个工作兢兢业业的好员工,平时没有时间收拾屋子,突然想大扫除一下,那么多家具怎么办呢?突然你大手一挥,家里变得空空如也,这下可以随意规划收拾了!……,先打住哈,上文后来出现的“空空的屋子”其实就是个虚拟的环境啦,你可以随意在这个房间里放任何东西,跟新家一样儿样儿的。小编现在就是要教你建一个“新家!”——生物信息分析专用虚拟环境,之后放进去的第一个“家具”就是本文的主人公Biopython啦。
下载安装Anaconda
首先下载Anaconda——python的一个集成发行版(你可以认为这是全副武装的python,当然核心的部分仍然是python~)。
# wget https://repo.continuum.io/archive/Anaconda2-4.3.1-Linux-x86_64.sh
下载完以后,执行安装:
# sh Anaconda2-4.3.1-Linux-x86_64.sh
执行后会提示你安装,遇到enter,就enter确认,遇到许可说明什么的也确认yes,然后就到达安装界面。
红圈内代表默认安装位置,如果想自己指定安装路径,那可以输入相应的路径>>>/XXX/XXX/anaconda之类的。
然后等待执行完就可以开始正式创建安装环境!
虚拟环境创建及启动
# conda create -n test_biopython python==2.7.13
小小地解释一下上面的命令:
conda create命令创建虚拟的python环境;
参数-n后面跟的是你要创建的环境名称,比如test_biopython,当然你想叫ABCD,shuaigeshiwo我也拦不住,但最好跟你想做的项目相关;
后面是python版本。
执行命令后,需要下载一些基本的包,提示需要你输入y,输入就可以。
# source activate test_biopython
执行上面的命令后,你创建的虚拟环境就激活了!标志就是你的命令行前面会有一个圆括号包围的(test_biopython),就像下面这样:
Biopython安装
现在我们来在刚刚创建的虚拟环境里放第一个“家具”——Biopython:
# pip install biopython
剩下的安装过程小编表示围观就可以,等到以下界面出现,就代表这个工具可以使用了~
打开解释器,导入一下biopython试试(导入的时候记得要用Bio)
# python
>>> import Bio
没问题,可以使用了!
好了,本次的Biopython教程到这儿就告一段咯~下回,小编来教你怎么用Biopython编写python生物信息分析工具,期待一下吧~
供稿:李洋
编辑:王丽燕
- 本文固定链接: https://oversea.maimengkong.com/kyjc/1559.html
- 转载请注明: : 萌小白 2023年6月10日 于 卖萌控的博客 发表
- 百度已收录