糖及其GLYCAM力场中的命名约定

类别:    标签: gmx amber   阅读次数:   版权: (CC) BY-NC-SA

子曰:“必也正名乎!名不正,则言不顺;言不顺,则事不成。故君子名之必可言也,言之必可行也。”                 ——《论语·子路》

道可道非常道。名可名非常名。无名天地之始。有名万物之母。                 ——《老子·第一章》

【按】以下说明整理自维基百科 糖类, 并翻译自Amber 16手册以及GLYCAM网站说明.

糖(碳水化合物): 多羟基醛或多羟基酮及其缩聚物和某些衍生物的总称

半缩醛异构化: 呋喃糖(5元环)与吡喃糖(6元环)

葡萄糖

葡萄糖的α-与β-(后者)端基异构物。

注意结合在碳5上的CH2OH基团与端基异构碳上的羟基(红色或绿色)之间的空间关系:

两者异面为(α)型, 同面则为(β)型

葡聚糖

D-葡萄糖单体组成的多糖
α-葡聚糖 β-葡聚糖
结合类型 名称 主要存在场所 结合类型 名称 主要存在场所
α-1,4 直链淀粉 大米 β-1,4 纤维素
α-1,6 右旋糖酐 乳酸菌 β-1,3 酵母多糖 酵母
黑木耳多糖 黑木耳
金藻昆布多糖 金藻门
α-1,4/1,6 糖原 动物 β-1,3/1,6 海带多糖 海草、蕈类
支链淀粉 糯米 热凝胶多糖 细菌
普鲁兰多糖 酵母 愈伤葡聚糖 植物
  平菇多糖 平菇
  β-1,6:β-1,3 香菇多糖 香菇, 严格钝化
β-1,3/1,4 地衣多糖 地衣

纤维素

属于广义的糖类, D-葡萄糖以β-1,4-糖苷键组成的大分子多糖,分子量约50,000~2,500,000,相当于300~15,000个葡萄糖基


视图: 投影 正交
着色: 按链 按残基
模式: 飘带 骨架 管板 卡通
显示: 水分子 非键原子   名称
颜色: 氨基酸 形状 极性 酸性 彩虹
左键: 转动   滚轮: 缩放   双击: 自动旋转开关   Alt+左键: 移动

Fig.1

3.3 碳水化合物

GLYCAM06力场

使用孤对电子(额外点)的GLYCAM06EP力场

3.3.7 GLYCAM中的碳水化合物命名约定

为了将碳水化合物以标准方式添加到建模程序中, 也为了提供用于X射线和NMR pdb文件的标准, 我们已经发展了一套三字符的编码命名方法. 使用三字符是基于RCSB PDB Advisory Committee (<www.rcsb.org/pdb/pdbac.html></www.rcsb.org>)pdb文件标准, 实用原因在于, 所有的建模和实验软件都可以读入三字符编码, 主要是用于蛋白和核酸.

作为单糖三字符PDB编码的基础, 我们为单糖引入了单字符编码(表3.5). 如果可能, 字符取自单糖名称的第一个字母(A=Ara, F=Fuc, G=Glc, I=Ido, M=Man, P=Psi, Q=Qui, R=Rib, T=Tal, X=Xyl), 但出于其他考虑, L被用于Gal, 尽管它比Lyz更不常用. 考虑到单糖衍生物存在无限多种变体, 26个字母的限制无法保证单字母(或三字母)编码能够不重复. 因此我们首先将单字符用于所有的戊糖和己糖, 非衍生的单糖. 接下来, 根据出现频率或生物重要性来分配字母.

使用三字符(表3.6到3.8), 目前的GLYCAM残基名称编码了下列内容: 碳水化合物残基名称(Glc, Gal等), 环类型(吡喃p或呋喃f), 端基异构(α或β), 异构体类型(D或L)和出现的连接位置(2-, 2,3-, 2,4,6-等). 连接位置信息非常重要, 且不能由单糖名称获知, 不像氨基酸那样. 进一步, 三字符编码选择时与氨基酸目前使用的编码不重合.

纤维二糖的GLYCAM命名约定

表 3.4: GLYCAM目前支持的单糖. (a) 目前正在开发. (b) 只有一种对映体和环类型可用.
Carbohydrate
碳水化合物
Pyranose 吡喃(己)糖
α/β, D/L
Furanose 呋喃(戊)糖
α/β, D/L
Arabinose 树胶醛醣/阿拉伯糖/阿糖 yes yes
Lyxose 来苏糖 yes yes
Ribose 核糖 yes yes
Xylose 木糖 yes yes
Allose 阿洛糖 yes
Altrose 阿卓糖 yes
Galactose 半乳糖 yes a
Glucose 葡萄糖 yes a
Gulose 古罗糖 yes
Idose 艾杜糖 a
Mannose 甘露糖 yes
Talose 塔洛糖 yes
Fructose 果糖 yes yes
Psicose 阿卢糖 yes yes
Sorbose 山梨糖 yes yes
Tagatose 塔格糖 yes yes
Fucose 海藻糖 yes
Quinovose 奎诺糖/异万年青糖/鸡纳糖 yes
Rhamnose 鼠李糖 yes
Galacturonic Acid 半乳糖醛酸 yes
Glucuronic Acid 葡(萄)糖醛酸 yes
Iduronic Acid 艾杜糖醛酸 yes
N-Acetylgalactosamine N-乙酰半乳糖胺 yes
N-Acetylglucosamine N-乙酰葡糖胺 yes
N-Acetylmannosamine N-乙酰甘露糖胺 yes
Neu5Ac N-乙酰神经氨酸 yes, b yes, b
KDN 2-keto-3-deoxy-nonulosonate a,b a,b
KDO 2-keto-3-deoxy-octulosonate a,b a,b
表 3.5: 单糖GLYCAM残基名称的核心--单字母编码
编号 碳水化合物a 单字母编码b 常用简写
1 D-Arabinose A Ara
2 D-Lyxose D Lyx
3 D-Ribose R Rib
4 D-Xylose X Xyl
5 D-Allose N All
6 D-Altrose E Alt
7 D-Galactose L Gal
8 D-Glucose G Glc
9 D-Gulose K Gul
10 D-Idose I Ido
11 D-Mannose M Man
12 D-Talose T Tal
13 D-Fructose C Fru
14 D-Psicose P Psi
15 D-Sorbose Bd Sor
16 D-Tagatose J Tag
17 D-Fucose (6-deoxy D-galactose) F Fuc
18 D-Quinovose (6-deoxy D-glucose) Q Qui
19 D-Rhamnose (6-deoxy D-mannose) H Rha
20 D-Galacturonic Acid Od GalA
21 D-Glucuronic Acid Zd GlcA
22 D-Iduronic Acid Ud IdoA
23 D-N-Acetylgalactosamine Vd GalNac
24 D-N-Acetylglucosamine Yd GlcNAc
25 D-N-Acetylmannosamine Wd ManNAc
26 N-Acetyl-neuraminic Acid Sd NeuNAc, Neu5Ac
KDN KNc,d KDN
KDO KOc,d KDO
N-Glycolyl-neuraminic Acid SGc,d NeuNGc, Neu5Gc
a 残基对应的prep文件目前不可用, 可联系Woods课题组(www.glycam.org)获取结构和电荷参数.
b 小写字母表示L型糖, 因此L-Fucose应表示为f, 参见表3.8.
c 对于不能指定单字母编码的不常用残基, 其名称忽略了一些信息.
d 在将来, 这些残基的命名方法可能会改变. 请查看www.glycam.org网站的最新信息.
表 3.6: 基于GLYCAM单字母编码, D型吡喃戊糖和己糖的三字母编码中连接位置与端基异构构象的指定方法
α-D-Glcp β-D-Galp α-D-Arap β-D-Xylp
连接位置 残基名称 残基名称 残基名称 残基名称
末端b 0GAb 0LB 0AA 0XB
1-c 1GAc 1LB 1AA 1XB
2- 2GA 2LB 2AA 2XB
3- 3GA 3LB 3AA 3XB
4- 4GA 4LB 4AA 4XB
6- 6GA 6LB
2,3- ZGAd ZLB ZAA ZXB
2,4- YGA YLB YAA YXB
2,6- XGA XLB
3,4- WGA WLB WAA WXB
3,6- VGA VLB
4,6- UGA ULB
2,3,4- TGA TLB TAA TXB
2,3,6- SGA SLB
2,4,6- RGA RLB
3,4,6- QGA QLB
2,3,4,6- PGA PLB
a 在吡喃糖中, A表示α构象, B表示β构象.
b 以前称为GA, 前缀0表示没有氧原子能够成键, 即, 残基位于链的结束处.
c 引入以便能形成 1-1' 连接, 如α-D-Glc-1-1'-α-D-Glc {1GA 0GA}.
d 涉及多于一个的连接位置时, 有必要避免使用前缀字母, 以免导致形成的三字母编码与氨基酸所用的重复, 如ALA
表 3.7: 基于GLYCAM单字母编码, D型呋喃戊糖和己糖的三字母编码中连接位置与端基异构构象的指定方法. 在呋喃糖中 D(down) 表示α; U(up)表示β.
α-D-Glcf β-D-Manf α-D-Araf β-D-Xylf
连接位置 残基名称 残基名称 残基名称 残基名称
末端 0GD 0MU 0AD 0XU
1- 1GD 1MU 1AD 1XU
2- 2GD 2MU 2AD 2XU
3- 3GD 3MU 3AD 3XU
··· ··· ··· ··· ···
表 3.8: L型吡喃戊糖和己糖的三字母编码中连接位置与端基异构构象的指定方法.
α-L-Glcp β-L-Manp α-L-Arap β-L-Xylp
连接位置 残基名称 残基名称 残基名称 残基名称
末端 0gA 0mB 0aA 0xB
1- 1gA 1mB 1aA 1xB
2- 2gA 2mB 2aA 2xB
3- 3gA 3mB 3aA 3xB
··· ··· ··· ··· ···
◆本文地址: , 转载请注明◆
◆评论问题: https://jerkwin.herokuapp.com/category/3/博客, 欢迎留言◆


前一篇: 统计轨迹中分子速度大小沿某一方向的分布
后一篇: Amber构建寡糖的方法

访问人次(2015年7月 9日起): | 最后更新: 2024-04-16 06:38:20 UTC | 版权所有 © 2008 - 2024 Jerkwin