]> git.donarmstrong.com Git - paml.git/blob - examples/mtCDNA/README.txt
import paml4.8
[paml.git] / examples / mtCDNA / README.txt
1 readme.txt\r
2 May 2002\r
3 \r
4 Files included in the folder:\r
5 \r
6       mtCDNApri.nuc:  codon sequences from 7 apes (small data set in Yang et al. 1998)\r
7       mtCDNApri.trees: tree file for the data\r
8       OmegaAA.dat: file specifying different types of amino acid substitutions\r
9       codeml.ctl: control file \r
10 \r
11 Also the following two files are incldued (large data set in Yang et al. 1998)\r
12       mtCDNApri.nuc\r
13       mtCDNApri.trees\r
14 \r
15 This directory contains example files for estimating\r
16 nonsynonymous/synonymous substitution rate ratios for different types\r
17 of amino acid changes.  The data were used in Yang et al. (1998), so\r
18 you can use the data to duplicate results in that paper.\r
19 \r
20 (1) Table 5 and the section titled "Different types of amino acid\r
21 substitutions".  This model assumes different dn/ds (w) ratios for\r
22 different types of amino acid substitutions.  You specify how many\r
23 amino acid substitution types you would like to have and which amino\r
24 acid pairs (changes) should be in each type.  The data should be codon\r
25 sequences (seqtype = 1), and the model is specified by aaDist = 7\r
26 (AAClasses).  The details of amino acid substitution types are\r
27 specified in a file called OmegaAA.dat.  See that file for details.\r
28 The model can be used to fit different rates for "radical" and\r
29 "conserved" amino acid substitutions.\r
30 \r
31 Yang et al. (1998) implemented the model for codon sequences only\r
32 (seqtype = 1).  In theory the model should be applicable to amino acid\r
33 sequences as well (seqtype = 2), with one fewer parameter required.\r
34 However, such models (for amino acid sequences) are either not tested\r
35 properly or never made to work.  If you need to apply such models to \r
36 amino acid sequences, you can let me know and I'll try to check.\r
37 \r
38 \r
39 (2) Table 4.  Mechanistic models of codon substitution.  You should have\r
40 seqtype = 1, model = 0, NSsites = 0.  Then the models are specified\r
41 using aaDist as follows.  You need to copy files with names like\r
42 g1974c.dat, g1974p.dat, g1974v.dat, g1974a.dat, grantham.dat, or\r
43 miyata.dat into the current folder to run those models.\r
44 \r
45        aaDist = 1  * geometric relationship using Grantham\r
46        aaDist = 2  * geometric relationship using Miyata & Yasunaga\r
47        aaDist = 3  * geometric relationship using c (composition)\r
48        aaDist = 4  * geometric relationship using p (polarity)\r
49        aaDist = 5  * geometric relationship using v (volume)\r
50        aaDist = 6  * geometric relationship using a (aromaticity)\r
51 \r
52        aaDist = -1  * linear relationship using Grantham\r
53        aaDist = -2  * linear relationship using Miyata & Yasunaga\r
54        aaDist = -3  * linear relationship using c (composition)\r
55        aaDist = -4  * linear relationship using p (polarity)\r
56        aaDist = -5  * linear relationship using v (volume)\r
57        aaDist = -6  * linear relationship using a (aromaticity)\r
58 \r
59 \r
60 (3) Table 3.  Mechanistic models of amino acid substitution.  As above\r
61 for table 4, but you should have seqtype = 2, model = 6 (FromCodon),\r
62 NSsites = 0.  Note that with amino acid sequences only, we cannot\r
63 estimate synonymous rate, and the models have one fewer parameter than\r
64 when codon sequences are used.\r
65 \r
66 The models were implemented several years ago and not carefully\r
67 maintained since then.  So let me know you notice anything strange.\r
68 You should always run the example data set to duplicate the results in\r
69 the paper.\r
70 \r
71 Reference:\r
72 \r
73 Yang, Z., R. Nielsen, and M. Hasegawa, 1998.  Models of amino acid\r
74 substitution and applications to mitochondrial protein\r
75 evolution. Mol. Biol. Evol. 15: 1600-1611.\r
76 \r
77 Ziheng Yang\r