]> git.donarmstrong.com Git - paml.git/blob - examples/MouseLemurs/README.txt
import paml4.8
[paml.git] / examples / MouseLemurs / README.txt
1 README.txt\r
2 Ziheng Yang, 27 January 2003\r
3 \r
4 \r
5 This folder contains files for the local-clock likelihood analysis of Yoder \r
6 and Yang (2003).\r
7 \r
8 (A) \r
9 The clock models are re-written.  Note that the fossil calibration\r
10 points are specified using the symbol '@' in the tree file; the symbol\r
11 is used in the same way as the more familiar symbol ':' for branch\r
12 lengths.  TipDate models are implemented using @ in the sequence name\r
13 to specify the date of determination of the sequence.  Look at the\r
14 examples/TipDate folder for an example.  Local clock models are\r
15 specified by assigning rates to branches, using the symbol # to label\r
16 the branch/node.  The symbol $ is used as a clade label; $ stands\r
17 for the capital greek symbol \Delta, which looks somewhat like a clade.  \r
18 \r
19 Use clock = 2 for local clock models.  For models of multiple genes,\r
20 clock = 3 represents the "combined analysis" in Yang & Yoder (2003).\r
21 The program assumes the same set of species and the same phylogeny at\r
22 the mutliple loci.\r
23 \r
24       clock = 1: global clock, deals with TipDate with no or many fossils, \r
25                  ignores branch rates (#) in tree if any.\r
26             = 2: local clock models, as (1) above, but requires branch \r
27                  rates (#) tree.\r
28             = 3: as (2) above, but requires Mgene and option G in sequence \r
29                  file.\r
30 \r
31 \r
32 (B) \r
33 \r
34 The following describes specifications in baseml.ctl to duplicate the\r
35 ML results in tables 4 and 5 of Yang and Yoder (2003).  Note that the\r
36 ML analysis uses the ingroup sequences only, and the assumed ingroup\r
37 tree is rooted.  In the Bayes analysis of that paper, Thorne's program\r
38 (estbranches) requires an outgroup to root the ingroup tree.  The\r
39 "JeffNode" node numbering corresponds to the the node numbering by\r
40 Jeff Thorne's Bayes MCMC programs divtime5b and multidivtime, used in\r
41 our paper.  My output is correct only if you do what we did, that is,\r
42 only if you use the outgroup in Jeff's estbranches program and do not\r
43 use the outgroup sequences in the baseml ML analysis.  Note that the\r
44 node numbering in Tables 4 and 5 of that paper is according to Jeff's\r
45 programs divtime5b and multidivtime.\r
46 \r
47 \r
48 JC69 analysis in Tables 4 and 5\r
49 ===============================\r
50 \r
51 Columns b, c, d.  Use optoin GC on the first line of the sequence data file\r
52 MouseLemurs.nuc.  \r
53 \r
54         35 1818  GC\r
55 \r
56 The tree in the tree file has seven @ specifying seven calibration\r
57 dates.  Use Mgene = 1 for separate analysis.  Other options are\r
58 \r
59      model = 0 \r
60      Mgene = 1\r
61      fix_alpha = 1\r
62      alpha = 0\r
63      clock = 1\r
64 \r
65 These options should generate the three columns in one analysis.  The\r
66 option clock = 1 has precedence over the branch rate labels # in the\r
67 tree file.  So clock = 1 above means that the model is a global clock\r
68 and the rate labels # are ignored.  \r
69 \r
70 Columns b, c, d in table 5 (local clock analysis).  If you choose\r
71 clock = 2 in the above, you should recover results for the local clock\r
72 analysis.\r
73 \r
74 Column i in table 4 (combined global clock analysis under JC69) is\r
75 produced by the following options:\r
76 \r
77      model = 0 \r
78      Mgene = 0\r
79      fix_alpha = 1\r
80      alpha = 0\r
81      clock = 1\r
82 \r
83 Column i in table 5 (combined local clock analysis under JC69) is\r
84 produced by changing clock = 3 in the above.\r
85 \r
86 \r
87 \r
88 \r
89 F84G analysis in Tables 4 and 5\r
90 ===============================\r
91 \r
92 Use the following to specify the gamma model.  \r
93 \r
94      fix_alpha = 0\r
95      alpha = 0.5 (or any other initial value)\r
96      ncatG = 5\r
97 \r
98 Columns f, g, h in table 4 (global clock analysis).  Use optoin GC on\r
99 the first line of the sequence data file.  The tree in the tree file\r
100 has seven @ specifying seven calibration dates.  Use Mgene = 1 for\r
101 separate analysis.  Other options are\r
102 \r
103      model = 3\r
104      Mgene = 1\r
105      fix_alpha = 0\r
106      alpha = 0.5 (or any other initial value)\r
107      clock = 1\r
108 \r
109 Columns f, g, h in table 5 (F84G local clock analysis).  Change clock\r
110 = 2 in the above.\r
111 \r
112 Column j in table 4 (combined global clock analysis under F84G) is\r
113 produced by the following options:\r
114 \r
115      model = 3\r
116      Mgene = 4\r
117      fix_alpha = 0\r
118      alpha = 0.5\r
119      Malpha = 1\r
120      ncatG = 5\r
121      clock = 1\r
122 \r
123 Column j in table 5 (combined local clock analysis under F84G) is\r
124 produced by setting clock = 3 in the above.\r
125 \r
126 Good luck.\r
127 \r
128 //end of file\r