资源预览内容
第1页 / 共34页
第2页 / 共34页
第3页 / 共34页
第4页 / 共34页
第5页 / 共34页
第6页 / 共34页
第7页 / 共34页
第8页 / 共34页
第9页 / 共34页
第10页 / 共34页
亲,该文档总共34页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
. . rcos为了能准确地画出染色体示意图,染色体的定义,位置,大小,以及显示的形式都是circos需要考虑的。这些要素需要在数据文件当中定义出来。数据结构染色体组型(karyotypes)是一类特殊的数据。一般的,它保存在名为xx.karyotype.txt文件当中。它将定义染色体的大小,ID,名称和颜色。每一行一条染色体,格式如下:chr - ID LABEL START END COLOR最开始的chr表示,这一行将定义一个染色体。然后是一个短线占位符。这个占位符通常用来定义所属关系,对于染色体来说,没有所属。ID是染色体唯一且不能重复的标识。之后的LABEL是将来用于显示在图上的文本。如果一个染色体组型文件里面包含多个不同来源的染色体组,设置ID最好的办法就是使用前缀。比如hs=homo sapiens, mm=mus musculus等等。有时候你可以使用hs19做为前缀来明示数据来源版本。其实,即使是只有一个来源的染色体组,也最好使用前缀,以规文件格式。START和END值定义了染色体的大小。对于染色体组型文件,需要指明的是,这里的START和END应该是染色体本身的大小,而不是你想绘制部分的起止位置。指定绘制部分将由其它文件来定义。COLOR是于定义显示的颜色。如果染色体组不以条纹(cytogenetic bands)图谱覆盖的话,那么就会以这里设置的颜色显示。对于人类基因组而言,circos预设了与染色体相同的名字做为颜色名,比如chr1, chr2, chrX, chrY, chrUn.下面就是hg19的例子:chr - hs1 hs1 0 249250621 chr1chr - hs2 hs2 0 243199373 chr2chr - hs3 hs3 0 198022430 chr3chr - hs4 hs4 0 191154276 chr4chr - hs5 hs5 0 180915260 chr5chr - hs6 hs6 0 171115067 chr6chr - hs7 hs7 0 159138663 chr7chr - hs8 hs8 0 146364022 chr8chr - hs9 hs9 0 141213431 chr9chr - hs10 hs10 0 135534747 chr10chr - hs11 hs11 0 135006516 chr11chr - hs12 hs12 0 133851895 chr12chr - hs13 hs13 0 115169878 chr13chr - hs14 hs14 0 107349540 chr14chr - hs15 hs15 0 102531392 chr15chr - hs16 hs16 0 90354753 chr16chr - hs17 hs17 0 81195210 chr17chr - hs18 hs18 0 78077248 chr18chr - hs19 hs19 0 59128983 chr19chr - hs20 hs20 0 63025520 chr20chr - hs21 hs21 0 48129895 chr21chr - hs22 hs22 0 51304566 chr22chr - hsx hsx 0 155270560 chrxchr - hsy hsy 0 59373566 chry一般的,我们都会在染色体组型文件当中加上条纹图谱的信息,这样才会让染色体图谱看上去有被染色的效果。文件格式与之前的一致,也只有七列。band DOMAIN ID LABEL START END COLOR这里的DOMAIN就是染色体组型当中的ID就好了,其它的定义与前面的一致。下面就是一个例子。band hs1 p36.33 p36.33 0 2300000 gnegband hs1 p36.32 p36.32 2300000 5400000 gpos25band hs1 p36.31 p36.31 5400000 7200000 gnegband hs1 p36.23 p36.23 7200000 9200000 gpos25band hs1 p36.22 p36.22 9200000 12700000 gnegband hs1 p36.21 p36.21 12700000 16200000 gpos50band hs1 p36.13 p36.13 16200000 20400000 gnegband hs1 p36.12 p36.12 20400000 23900000 gpos25band hs1 p36.11 p36.11 23900000 28000000 gnegband hs1 p35.3 p35.3 28000000 30200000 gpos25band hs1 p35.2 p35.2 30200000 32400000 gnegband hs1 p35.1 p35.1 32400000 34600000 gpos25band hs1 p34.3 p34.3 34600000 40100000 gnegband hs1 p34.2 p34.2 40100000 44100000 gpos25band hs1 p34.1 p34.1 44100000 46800000 gnegband hs1 p33 p33 46800000 50700000 gpos75band hs1 p32.3 p32.3 50700000 56100000 gnegband hs1 p32.2 p32.2 56100000 59000000 gpos50band hs1 p32.1 p32.1 59000000 61300000 gnegband hs1 p31.3 p31.3 61300000 68900000 gpos50band hs1 p31.2 p31.2 68900000 69700000 gnegband hs1 p31.1 p31.1 69700000 84900000 gpos100band hs1 p22.3 p22.3 84900000 88400000 gnegband hs1 p22.2 p22.2 88400000 92000000 gpos75.cytogenetic bands的名称例子:1p36.33 其命名规则是之前的数字、字母为染色体代号,一般是数字或者X,Y。而之后会有字母p或者q。p代表短臂,q代表长臂。而每个band都会有颜色深浅的不同,这里主要以gpos和gneg来区别。为了和真实值更接近,circos还定义了一系列的灰度。设置文件circos的设置文件可以分为多个文件,也可以只写在一个文件里。一般地,为了人们阅读方便,都会写在多个文件,每个文件描述不同的部分,最后由一个主文件来调用就可以了。这一节,需要设置三个方面,一,数据源,二如何画染色体,三如何画坐标,所以我们也将它分为三个文件,分别名为circos.conf, ideogram.conf,和ticks.conf。由circos.conf来定义数据源,并调用ideogram.conf和ticks.conf。circos.conf的容white = 255,255,255black = 0,0,0blue = 0,0,255 # specify the karyotype file herekaryotype = karyotype.human.hg19.txt chromosomes_units = 1000000chromosomes_display_default = yes 这里可以注意到它引入其它文件时使用的是的方式。注意,这里include会从circos所在的目录开始寻找,而不是当前目录。我们可以在circos的安装目录当中找到一个名为etc的目录,可以点击查看其中的colors.ucsc.conf,image.conf,以及housekeeping.conf的容。在circos当中使用karyotype=xxx语句来定义了karyotype的数据来源。chromosomes_units=1000000定义了基准单位。可以试着把这个值扩大10倍。接下来我们看ideogram.conf。在ideogram.conf文件中,定义了如何显示染色体组型。 default = 0.005rbreak = 5u #position configurationradius = 0.90rthickness = 100pfill = yesfill_color = blackstroke_thickness = 2stroke_color = black #label configurationshow_label = yeslabel_font = boldlabel_radius = dims(ideogram,radius) + 0.07rlabel_with_tag = yeslabel_size = 36label_parallel = no #band configurationshow_bands = yesfill_bands = yesband_stroke_thickness = 2band_stroke_color = whiteband_transparency = 0 在ticks.conf当中定义了如何来绘制刻度。show_ticks = yesshow_tick_labels = yes skip_first_label = noskip_last_label = noradius = dims(ideogram,radius_outer)tick_separation = 3plabel_separation = 1pmultiplier = 1e-6color = blackthickness = 4psize = 20p spacing = 1ushow_label = nothick
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号