码迷,mamicode.com
首页 > 数据库 > 详细

Uniprot Accession的格式以及正则表达式

时间:2020-02-16 11:30:18      阅读:187      评论:0      收藏:0      [点我收藏+]

标签:pat   ref   正则表达式   att   目的   which   保留   正则表达   primary   

Uniprot Accession

Uniprot accession是稳定的标识符,用于引用UniProtKB条目。在每个条目的数据信息整合到UniProtKB之后,每个条目都被分配了一个唯一的登录号,这个编号叫做“主Accession号”。
UniProtKB的登录号由6个或10个字母数字字符组成,其格式有以下三种pattern,请点击这里查看
这三种模式可以组合成以下的正则表达式:
[OPQ][0-9][A-Z0-9]{3}[0-9]|[A-NR-Z][0-9]([A-Z][A-Z0-9]{2}[0-9]){1,2}
Examples: A2BC19, P12345, A0A022YWF9

条目可以有多个登录号。这可能是由于两个不同的原因造成的:
a)当两个或两个以上的条目合并时,保留所有条目的登录号。第一个登录号称为“主(可供引用的)登录号”,其他的称为“第二登录号”。这些是按字母数字顺序列出的。
b)如果一个现有的条目被分割成两个或多个条目(‘demerged’),新的‘primary’登录号归属于所有分割的条目,而所有原始登录号保留为‘secondary’登录号。
Example: P29358 which has been ‘demerged’ into P68250 and P68251.

建议,在任何引用和链接中都应该使用条目的主登录号,因为它是条目唯一稳定的标识符。

致谢:
参考翻译来源

Uniprot Accession的格式以及正则表达式

标签:pat   ref   正则表达式   att   目的   which   保留   正则表达   primary   

原文地址:https://www.cnblogs.com/songbiao/p/12316050.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!