]> git.donarmstrong.com Git - mothur.git/blob - phylotree.h
filled out reference taxonomy with "unclassified" so that if a cutoff is used the...
[mothur.git] / phylotree.h
1 #ifndef DOTAXONOMY_H
2 #define DOTAXONOMY_H
3
4 /*
5  * phylotree.h
6  *  
7  *
8  *  Created by Pat Schloss on 6/17/09.
9  *  Copyright 2009 Patrick D. Schloss. All rights reserved.
10  *
11  */
12
13 #include "mothur.h"
14 #include "mothurout.h"
15
16 /**************************************************************************************************/
17
18 struct TaxNode {
19         vector<string> accessions;      //names of seqs in this branch of tree
20         map<string, int> children;  //childs name to index in tree
21         int parent, childNumber, level;
22         string name, heirarchyID;
23         
24         TaxNode(string n) : name(n), level(0), parent(-1) {             }
25         TaxNode(){}
26 };
27
28 /**************************************************************************************************/
29
30 class PhyloTree {
31
32 public:
33         PhyloTree();
34         PhyloTree(string);  //pass it a taxonomy file and it makes the tree
35         PhyloTree(ifstream&, string);  //pass it a taxonomy file and it makes the train.tree
36         ~PhyloTree() {};
37         int addSeqToTree(string, string);
38         void assignHeirarchyIDs(int);
39         void printTreeNodes(string); //used by bayesian to save time
40         vector<int> getGenusNodes();
41         vector<int> getGenusTotals();   
42         void setUp(string);  //used to create file needed for summary file if you use () constructor and add seqs manually instead of passing taxonomyfile
43                 
44         TaxNode get(int i)                              {       return tree[i];                                                 }
45         TaxNode get(string seqName)             {       return tree[name2Taxonomy[seqName]];    }
46         int getIndex(string seqName)    {       return name2Taxonomy[seqName];                  }
47         string getName(int i)                   {       return tree[i].name;                                    }
48         string getFullTaxonomy(string);  //pass a sequence name return taxonomy
49         int getMaxLevel()                               {       return maxLevel;                                                }
50         int getNumSeqs()  {  return numSeqs;  }
51         
52 private:
53         string getNextTaxon(string&);
54         void print(ofstream&, vector<TaxNode>&); //used to create static reference taxonomy file
55         void fillOutTree(int, vector<TaxNode>&); //used to create static reference taxonomy file
56         void binUnclassified(string);
57         
58         vector<TaxNode> tree;
59         vector<int> genusIndex; //holds the indexes in tree where the genus level taxonomies are stored
60         vector<int> totals; //holds the numSeqs at each genus level taxonomy
61         map<string, int> name2Taxonomy;  //maps name to index in tree
62         map<int, int> uniqueTaxonomies;  //map of unique taxonomies
63         map<int, int> leafNodes; //used to create static reference taxonomy file
64         //void print(int, ofstream&);
65         int numNodes;
66         int numSeqs;
67         int maxLevel;
68         bool calcTotals;
69         MothurOut* m;
70 };
71
72 /**************************************************************************************************/
73
74 #endif
75
76