- 2017年03月31日 09:06:33
子曰:“必也正名乎!名不正,则言不顺;言不顺,则事不成。故君子名之必可言也,言之必可行也。” ——《论语·子路》
道可道非常道。名可名非常名。无名天地之始。有名万物之母。 ——《老子·第一章》
【按】以下说明整理自维基百科 糖类, 并翻译自Amber 16手册以及GLYCAM网站说明.
糖
糖(碳水化合物): 多羟基醛或多羟基酮及其缩聚物和某些衍生物的总称
- 单糖
- 羰基位置: 醛糖, 酮糖
- 碳原子数: 丙糖, 丁糖, 戊糖, 己糖
- 手性: D, L
- 双糖
- 低聚(寡)糖/多糖
半缩醛异构化: 呋喃糖(5元环)与吡喃糖(6元环)
葡萄糖
葡萄糖的α-与β-(后者)端基异构物。
注意结合在碳5上的CH2OH基团与端基异构碳上的羟基(红色或绿色)之间的空间关系:
两者异面为(α)型, 同面则为(β)型
葡聚糖
α-葡聚糖 | β-葡聚糖 | |||||
结合类型 | 名称 | 主要存在场所 | 结合类型 | 名称 | 主要存在场所 | |
---|---|---|---|---|---|---|
α-1,4 | 直链淀粉 | 大米 | β-1,4 | 纤维素 | 树 | |
α-1,6 | 右旋糖酐 | 乳酸菌 | β-1,3 | 酵母多糖 | 酵母 | |
黑木耳多糖 | 黑木耳 | |||||
金藻昆布多糖 | 金藻门 | |||||
α-1,4/1,6 | 糖原 | 动物 | β-1,3/1,6 | 海带多糖 | 海草、蕈类 | |
支链淀粉 | 糯米 | 热凝胶多糖 | 细菌 | |||
普鲁兰多糖 | 酵母 | 愈伤葡聚糖 | 植物 | |||
平菇多糖 | 平菇 | |||||
β-1,6:β-1,3 | 香菇多糖 | 香菇, 严格钝化 | ||||
β-1,3/1,4 | 地衣多糖 | 地衣 |
纤维素
属于广义的糖类, D-葡萄糖以β-1,4-糖苷键组成的大分子多糖,分子量约50,000~2,500,000,相当于300~15,000个葡萄糖基
3.3 碳水化合物
GLYCAM06力场
leaprc.GLYCAM_06j-1
: 使用GLYCAM06的LEaP配置文件, 可单独用于碳水化合物或与ff14SB力场联合使用GLYCAM_06j.dat
: 寡糖参数GLYCAM_06j-1.prep
: 糖基残基的结构和电荷GLYCAM_lipids_06h.prep
: 一些脂类残基的结构和电荷GLYCAM_amino_06j_12SB.lib
: 与ff14SB力场兼容的糖蛋白库文件GLYCAM_aminoct_06j_12SB.lib
GLYCAM_aminont_06j_12SB.lib
使用孤对电子(额外点)的GLYCAM06EP力场
GLYCAM_06EPb.dat
: 寡糖参数GLYCAM_06EPb.prep
: 糖残基结构和电荷leaprc.GLYCAM_06EPb
: 用于GLYCAM-06EP的LEaP配置文件
3.3.7 GLYCAM中的碳水化合物命名约定
为了将碳水化合物以标准方式添加到建模程序中, 也为了提供用于X射线和NMR pdb文件的标准, 我们已经发展了一套三字符的编码命名方法. 使用三字符是基于RCSB PDB Advisory Committee (<www.rcsb.org/pdb/pdbac.html></www.rcsb.org>)pdb文件标准, 实用原因在于, 所有的建模和实验软件都可以读入三字符编码, 主要是用于蛋白和核酸.
作为单糖三字符PDB编码的基础, 我们为单糖引入了单字符编码(表3.5). 如果可能, 字符取自单糖名称的第一个字母(A=Ara, F=Fuc, G=Glc, I=Ido, M=Man, P=Psi, Q=Qui, R=Rib, T=Tal, X=Xyl), 但出于其他考虑, L
被用于Gal, 尽管它比Lyz更不常用. 考虑到单糖衍生物存在无限多种变体, 26个字母的限制无法保证单字母(或三字母)编码能够不重复. 因此我们首先将单字符用于所有的戊糖和己糖, 非衍生的单糖. 接下来, 根据出现频率或生物重要性来分配字母.
使用三字符(表3.6到3.8), 目前的GLYCAM残基名称编码了下列内容: 碳水化合物残基名称(Glc, Gal等), 环类型(吡喃p或呋喃f), 端基异构(α或β), 异构体类型(D或L)和出现的连接位置(2-, 2,3-, 2,4,6-等). 连接位置信息非常重要, 且不能由单糖名称获知, 不像氨基酸那样. 进一步, 三字符编码选择时与氨基酸目前使用的编码不重合.
纤维二糖的GLYCAM命名约定
Carbohydrate 碳水化合物 |
Pyranose 吡喃(己)糖 α/β, D/L |
Furanose 呋喃(戊)糖 α/β, D/L |
---|---|---|
Arabinose 树胶醛醣/阿拉伯糖/阿糖 | yes | yes |
Lyxose 来苏糖 | yes | yes |
Ribose 核糖 | yes | yes |
Xylose 木糖 | yes | yes |
Allose 阿洛糖 | yes | |
Altrose 阿卓糖 | yes | |
Galactose 半乳糖 | yes | a |
Glucose 葡萄糖 | yes | a |
Gulose 古罗糖 | yes | |
Idose 艾杜糖 | a | |
Mannose 甘露糖 | yes | |
Talose 塔洛糖 | yes | |
Fructose 果糖 | yes | yes |
Psicose 阿卢糖 | yes | yes |
Sorbose 山梨糖 | yes | yes |
Tagatose 塔格糖 | yes | yes |
Fucose 海藻糖 | yes | |
Quinovose 奎诺糖/异万年青糖/鸡纳糖 | yes | |
Rhamnose 鼠李糖 | yes | |
Galacturonic Acid 半乳糖醛酸 | yes | |
Glucuronic Acid 葡(萄)糖醛酸 | yes | |
Iduronic Acid 艾杜糖醛酸 | yes | |
N-Acetylgalactosamine N-乙酰半乳糖胺 | yes | |
N-Acetylglucosamine N-乙酰葡糖胺 | yes | |
N-Acetylmannosamine N-乙酰甘露糖胺 | yes | |
Neu5Ac N-乙酰神经氨酸 | yes, b | yes, b |
KDN 2-keto-3-deoxy-nonulosonate | a,b | a,b |
KDO 2-keto-3-deoxy-octulosonate | a,b | a,b |
编号 | 碳水化合物a | 单字母编码b | 常用简写 |
---|---|---|---|
1 | D-Arabinose | A | Ara |
2 | D-Lyxose | D | Lyx |
3 | D-Ribose | R | Rib |
4 | D-Xylose | X | Xyl |
5 | D-Allose | N | All |
6 | D-Altrose | E | Alt |
7 | D-Galactose | L | Gal |
8 | D-Glucose | G | Glc |
9 | D-Gulose | K | Gul |
10 | D-Idose | I | Ido |
11 | D-Mannose | M | Man |
12 | D-Talose | T | Tal |
13 | D-Fructose | C | Fru |
14 | D-Psicose | P | Psi |
15 | D-Sorbose | Bd | Sor |
16 | D-Tagatose | J | Tag |
17 | D-Fucose (6-deoxy D-galactose) | F | Fuc |
18 | D-Quinovose (6-deoxy D-glucose) | Q | Qui |
19 | D-Rhamnose (6-deoxy D-mannose) | H | Rha |
20 | D-Galacturonic Acid | Od | GalA |
21 | D-Glucuronic Acid | Zd | GlcA |
22 | D-Iduronic Acid | Ud | IdoA |
23 | D-N-Acetylgalactosamine | Vd | GalNac |
24 | D-N-Acetylglucosamine | Yd | GlcNAc |
25 | D-N-Acetylmannosamine | Wd | ManNAc |
26 | N-Acetyl-neuraminic Acid | Sd | NeuNAc, Neu5Ac |
KDN | KNc,d | KDN | |
KDO | KOc,d | KDO | |
N-Glycolyl-neuraminic Acid | SGc,d | NeuNGc, Neu5Gc | |
a 残基对应的prep文件目前不可用, 可联系Woods课题组(www.glycam.org)获取结构和电荷参数. b 小写字母表示L型糖, 因此L-Fucose应表示为 f , 参见表3.8.c 对于不能指定单字母编码的不常用残基, 其名称忽略了一些信息. d 在将来, 这些残基的命名方法可能会改变. 请查看www.glycam.org网站的最新信息. |
α-D-Glcp | β-D-Galp | α-D-Arap | β-D-Xylp | |
---|---|---|---|---|
连接位置 | 残基名称 | 残基名称 | 残基名称 | 残基名称 |
末端b | 0GAb | 0LB | 0AA | 0XB |
1-c | 1GAc | 1LB | 1AA | 1XB |
2- | 2GA | 2LB | 2AA | 2XB |
3- | 3GA | 3LB | 3AA | 3XB |
4- | 4GA | 4LB | 4AA | 4XB |
6- | 6GA | 6LB | ||
2,3- | ZGAd | ZLB | ZAA | ZXB |
2,4- | YGA | YLB | YAA | YXB |
2,6- | XGA | XLB | ||
3,4- | WGA | WLB | WAA | WXB |
3,6- | VGA | VLB | ||
4,6- | UGA | ULB | ||
2,3,4- | TGA | TLB | TAA | TXB |
2,3,6- | SGA | SLB | ||
2,4,6- | RGA | RLB | ||
3,4,6- | QGA | QLB | ||
2,3,4,6- | PGA | PLB | ||
a 在吡喃糖中, A 表示α构象, B 表示β构象.b 以前称为 GA , 前缀0 表示没有氧原子能够成键, 即, 残基位于链的结束处.c 引入以便能形成 1-1' 连接, 如α-D-Glc-1-1'-α-D-Glc {1GA 0GA}. d 涉及多于一个的连接位置时, 有必要避免使用前缀字母, 以免导致形成的三字母编码与氨基酸所用的重复, 如ALA |
α-D-Glcf | β-D-Manf | α-D-Araf | β-D-Xylf | |
---|---|---|---|---|
连接位置 | 残基名称 | 残基名称 | 残基名称 | 残基名称 |
末端 | 0GD | 0MU | 0AD | 0XU |
1- | 1GD | 1MU | 1AD | 1XU |
2- | 2GD | 2MU | 2AD | 2XU |
3- | 3GD | 3MU | 3AD | 3XU |
··· | ··· | ··· | ··· | ··· |
α-L-Glcp | β-L-Manp | α-L-Arap | β-L-Xylp | |
---|---|---|---|---|
连接位置 | 残基名称 | 残基名称 | 残基名称 | 残基名称 |
末端 | 0gA | 0mB | 0aA | 0xB |
1- | 1gA | 1mB | 1aA | 1xB |
2- | 2gA | 2mB | 2aA | 2xB |
3- | 3gA | 3mB | 3aA | 3xB |
··· | ··· | ··· | ··· | ··· |