安徽屯溪,哈尔滨的雪地,扬州的瘦西湖,想必知道我是谁了吧!!对,小金思密达
分类: 信息化
2014-11-07 10:21:31
文件格式说明见下表:
列数 |
说明 |
1 |
“seqid”序列的编号,编号的有效字符有[a-zA-Z0-9.:^x!+_?-|] |
2 |
“source”注释信息的来源,比如”Genescan”、”Genbank” 等,可以为空,为空用”.”点号代替 |
3 |
“type”注释信息的类型,比如Gene、cDNA、mRNA等,或者是SO对应的编号 |
4 |
“start”起始位置 |
5 |
“end”终止位置 |
6 |
“score”得分,数字,是注释信息可能性的说明,可以是序列相似性比对时的E-values值或者基因预测时的P-values值。”.”表示为空 |
7 |
“strand”序列的方向, +表示正义链, -反义链 , ?表示未知 |
8 |
“phase”仅对注释类型为 “CDS”有效,表示起始编码的位置,有效值为0、1、2。 |
9 |
“attributes”以多个键值对组成的注释信息描述,键与值之间用“=”,不同的键值用“;”隔开,一个键可以有多个值,不同值用“,”分割。注意如果描述中包括tab键以及“,=;”,要用URL转义规则进行转义,如tab键用 %09代替。键是区分大小写的,以大写字母开头的键是预先定义好的,在后面可能被其他注释信息所调用。 |