笔记|基因组与比较基因组学学习整理(3)
卖萌控的博客
点击这里进入电脑版页面!体验更好
笔记|基因组与比较基因组学学习整理(3)
2022-7-9 萌小白


时间有限,只写命令行部分。



我之前夸下海口,要达到浙大博士毕业水平。(是的,我脸皮很厚)



今天看了浙大昆虫基因组学的一份博士学位论文,还是明显地感觉到了差距,确实需要做很多,这个人有一篇4分,一篇9分,和两篇中文,9分的这篇是搭建了一个数据库,这个需要的计算机知识确实很多。



事实上,我都不知道做生物信息学,到底是生物学还是计算机能力要求更多。目前感觉到,确实对于计算机专业的学生来说,做这件事可能更容易上手一些。



从脚踏实际开始干事儿里去学习知识可能是最好的方法。



=======准备工作=====




  1. gff或gtf格式结构注释文件


  2. 一条基因仅保存一条最长转录本的fasta格式文件



gffread -T -o **.gef **.gff3



mutategtf,lenth = abs(end-saaa.4tart)+1)%>%



sed -i.bak 's/.IT



#做一个总的注释信息



======基因家族聚类=======



$ orthofind -f data -S diamond -M msa -T fastatree -t 6



=====共线性=====



MCSanX data/sind_vvin



prefix=sind_vvin



java dot_plotter -g data/$prefix.gff



-s data/$prefix.collinearity



-c $prefix.dual_synteny.ctl



-o $prefix.dot.png



java dual_plotter -g data/$prefix.gff



-s data/$prefix.collinearity



-c $prefix.dual_synteny.ctl



-o $prefix.dot.png



java circle_plotter -g data/$prefix.gff



-s data/$prefix.collinearity



-c $prefix.dual_synteny.ctl



-o $prefix.dot.png



java bar_plotter -g data/$prefix.gff



-s data/$prefix.collinearity



-c $prefix.dual_synteny.ctl



-o $prefix.dot.png



=====分化时间计算======



mcmctree mcmctree.ctl > run.log



cat FigTree.tre



mv out.BV in.BV



mcmctree mcmctree.ctl



codeml codeml.ctl



mcmctree mcmctree.ctl



mv out.BV in.BV



======基因家族收缩扩张=======



基因家族聚类统计表格



带分化时间的物种进化树



cat cafe.



date



load -i example_data.tab -p 0.01 -t 10 -l log .txt



tree (((A:6,B:6):81,(C:17,D:17):70:6,dog:93)



lambda -a



report global_cafe.out



date



cafe ./cafe.



对cafe结果进行汇总统计



python2 ../..//python_s/catetutorial_report_analysisi.py



-i global_cafe.out.cafe



-o global_cafe.out.summary



> global_cafe.out.summary.log



python2 ../..//python_s/cafetutorial_draw_tree.py



-i global_cafe.out.summary_nod.txt



-t '(((A:6,B:6):81,(C:17,D:17):70:6,dog:93)'



-d '(((A<0>.B***'



-y Expansions -o expansions_tree.png



=====正选择分析======



muscle -in all_FAD.fasta > all_FAD.muscle.fasta



/pub/anaconda3/envs/orthofinder/bin/rexmlHPC-PTGREADS -f a



-p 123 -x 123 -#100



-m PROTGAMMAJTT



-n out



-s all_FAD.muscle.fasta



1>tree.log 2>tree.err



====circos使用



circos -cof circos.conf



circos -man



转自:BaNono

发表评论:
昵称

邮件地址 (选填)

个人主页 (选填)

内容