]> git.donarmstrong.com Git - paml.git/blob - dat/dayhoff.dat
import paml4.8
[paml.git] / dat / dayhoff.dat
1       \r
2  27                                                                         \r
3  98  32                                                                     \r
4 120   0 905                                                                 \r
5  36  23   0   0                                                             \r
6  89 246 103 134   0                                                         \r
7 198   1 148 1153  0 716                                                     \r
8 240   9 139 125  11  28  81                                                 \r
9  23 240 535  86  28 606  43  10                                             \r
10  65  64  77  24  44  18  61   0   7                                         \r
11  41  15  34   0   0  73  11   7  44 257                                     \r
12  26 464 318  71   0 153  83  27  26  46  18                                 \r
13  72  90   1   0   0 114  30  17   0 336 527 243                             \r
14  18  14  14   0   0   0   0  15  48 196 157   0  92                         \r
15 250 103  42  13  19 153  51  34  94  12  32  33  17  11                     \r
16 409 154 495  95 161  56  79 234  35  24  17  96  62  46 245                 \r
17 371  26 229  66  16  53  34  30  22 192  33 136 104  13  78 550             \r
18   0 201  23   0   0   0   0   0  27   0  46   0   0  76   0  75   0         \r
19  24   8  95   0  96   0  22   0 127  37  28  13   0 698   0  34  42  61     \r
20 208  24  15  18  49  35  37  54  44 889 175  10 258  12  48  30 157   0  28 \r
21 \r
22 0.087127 0.040904 0.040432 0.046872 0.033474 0.038255 0.049530\r
23 0.088612 0.033618 0.036886 0.085357 0.080482 0.014753 0.039772\r
24 0.050680 0.069577 0.058542 0.010494 0.029916 0.064718\r
25 \r
26 Ala Arg Asn Asp Cys Gln Glu Gly His Ile Leu Lys Met Phe Pro Ser Thr Trp Tyr Val\r
27 \r
28 S_ij = S_ji and PI_i for the Dayhoff model, with the rate Q_ij=S_ij*PI_j\r
29 The rest of the file is not used.\r
30 Prepared by Z. Yang, March 1995.\r
31 \r
32 \r
33 See the following reference for notation used here:\r
34 \r
35 Yang, Z., R. Nielsen and M. Hasegawa. 1998. Models of amino acid substitution and\r
36 applications to mitochondrial protein evolution. Mol. Biol. Evol. 15:1600-1611.\r
37 \r
38 \r
39 -----------------------------------------------------------------------\r
40 \r
41      \r
42  30                                                                        \r
43 109  17                                                                    \r
44 154   0 532                                                                \r
45  33  10   0   0                                                            \r
46  93 120  50  76   0                                                        \r
47 266   0  94 831   0 422                                                    \r
48 579  10 156 162  10  30 112                                                \r
49  21 103 226  43  10 243  23  10                                            \r
50  66  30  36  13  17   8  35   0   3                                        \r
51  95  17  37   0   0  75  15  17  40 253                                    \r
52  57 477 322  85   0 147 104  60  23  43  39                                \r
53  29  17   0   0   0  20   7   7   0  57 207  90                            \r
54  20   7   7   0   0   0   0  17  20  90 167   0  17                        \r
55 345  67  27  10  10  93  40  49  50   7  43  43   4   7                    \r
56 772 137 432  98 117  47  86 450  26  20  32 168  20  40 269                \r
57 590  20 169  57  10  37  31  50  14 129  52 200  28  10  73 696            \r
58   0  27   3   0   0   0   0   0   3   0  13   0   0  10   0  17  0         \r
59  20   3  36   0  30   0  10   0  40  13  23  10   0 260   0  22  23  6     \r
60 365  20  13  17  33  27  37  97  30 661 303  17  77  10  50  43 186  0  17  \r
61  A   R   N   D   C   Q   E   G   H   I   L   K   M   F   P   S   T   W   Y  V\r
62 Ala Arg Asn Asp Cys Gln Glu Gly His Ile Leu Lys Met Phe Pro Ser Thr Trp Tyr Val\r
63 \r
64 Accepted point mutations (x10) Figure 80 (Dayhoff 1978)\r
65 -------------------------------------------------------\r
66 \r
67 A 100 /* Ala */             A 0.087 /* Ala */\r
68 R  65 /* Arg */             R 0.041 /* Arg */\r
69 N 134 /* Asn */             N 0.040 /* Asn */\r
70 D 106 /* Asp */             D 0.047 /* Asp */\r
71 C  20 /* Cys */             C 0.033 /* Cys */\r
72 Q  93 /* Gln */             Q 0.038 /* Gln */\r
73 E 102 /* Glu */             E 0.050 /* Glu */\r
74 G  49 /* Gly */             G 0.089 /* Gly */\r
75 H  66 /* His */             H 0.034 /* His */\r
76 I  96 /* Ile */             I 0.037 /* Ile */\r
77 L  40 /* Leu */             L 0.085 /* Leu */\r
78 K  56 /* Lys */             K 0.081 /* Lys */\r
79 M  94 /* Met */             M 0.015 /* Met */\r
80 F  41 /* Phe */             F 0.040 /* Phe */\r
81 P  56 /* Pro */             P 0.051 /* Pro */\r
82 S 120 /* Ser */             S 0.070 /* Ser */\r
83 T  97 /* Thr */             T 0.058 /* Thr */\r
84 W  18 /* Trp */             W 0.010 /* Trp */\r
85 Y  41 /* Tyr */             Y 0.030 /* Tyr */\r
86 V  74 /* Val */             V 0.065 /* Val */\r
87 \r
88 scale factor = SUM_OF_PRODUCT = 75.246\r
89 \r
90 \r
91 Relative Mutability         The equilibrium freqs.\r
92 (Table 21)                  Table 22    \r
93 (Dayhoff 1978)              Dayhoff (1978)        \r
94 ----------------------------------------------------------------\r
95 \r
96 \r
97 \r
98 Some notes from 1995, for those technical people:\r
99 \r
100 I managed to find some notes I wrote in 1995.  The symbols are not\r
101 that comprehensible now, but you can get the basic idea, I think.  \r
102 \r
103 (1) Construction of P(0.01), for 1 PAM\r
104     p_ij(0.01) = m_i * A_{ij}/\sum_k{A_{ik}} / 7524.6\r
105 \r
106 (2) Eigensolution of P(0.01) = exp{Q*0.01}\r
107     P(0.01) = U diag{\lambda...} U^{-1}\r
108 \r
109     Then \r
110     Q = U diag{100*log{\lambda}...} U^{-1}\r
111 \r
112 \r
113 I did not use the PAM transition probabilities as rates assuming 0.01\r
114 is close to 0, but instead take them as P(0.01) to recover the rate\r
115 matrix, and as we expect, the rates are more different from each other\r
116 than the p_ij(0.01) are.\r
117 \r
118 I seem to recall that I thought some details in the Dayhoff paper and\r
119 the Kishino et al. (1990) paper were not entirely right.  I think I\r
120 thought that Q should be a symmetrical matrix, right-multiplied by a\r
121 diagonal matrix, while either Dayhoff or Kishino or both used\r
122 left-multiplication.\r
123 \r
124 As far as I know, codeml and protml give very similar (but not\r
125 identical, I think) results under the Dayhoff model.\r
126 \r
127 My jones.dat file is not based on the Jones et al. (1992) paper, but\r
128 is based on an updated data set sent to me by David Jones.  So codeml\r
129 and protml gave different results under JTT, but ranking of trees was\r
130 not affected for the data set I tested.\r
131 \r
132 Ziheng Yang\r