]> git.donarmstrong.com Git - mothur.git/blob - calculator.h
started shared utilities, updates to venn and heatmap added tree.groups command
[mothur.git] / calculator.h
1 #ifndef CALCULATOR_H
2 #define CALCULATOR_H
3
4 using namespace std;
5
6 #include "mothur.h"
7 #include "sabundvector.hpp"
8 #include "sharedsabundvector.h"
9 #include "rabundvector.hpp"
10 #include "uvest.h"
11
12 /* The calculator class is the parent class for all the different estimators implemented in mothur except the tree calculators.
13 It has 2 pure functions EstOutput getValues(SAbundVector*), which works on a single group, and 
14 EstOutput getValues(SharedRAbundVector* shared1, SharedRAbundVector* shared2), which compares 2 groups. */ 
15
16
17 using namespace std;
18 typedef vector<double> EstOutput;
19
20 /***********************************************************************/
21
22 class Calculator {
23
24 public:
25         Calculator(){};
26         Calculator(string n, int c) : name(n), cols(c) {};
27         virtual EstOutput getValues(SAbundVector*) = 0; 
28         virtual EstOutput getValues(SharedRAbundVector* shared1, SharedRAbundVector* shared2) = 0;
29         virtual void print(ostream& f)  { f.setf(ios::fixed, ios::floatfield); f.setf(ios::showpoint);
30                                                                           f << data[0]; for(int i=1;i<data.size();i++){ f << '\t' << data[i];   }}
31         virtual string getName()                {       return name;    }
32         virtual int getCols()           {       return cols;    }
33 protected:
34         EstOutput data;
35         string name;
36         int cols;
37
38 };
39
40 /**************************************************************************************************/
41 /*This Class holds all of the methods that manipulate vectors.
42 These methods are used in the other classes.
43 This class must be included if any of the other classes are to be used.*/
44
45 class VecCalc
46 {
47         // The methods seen in the order here is how they are ordered throughout the class.
48         public:
49                 VecCalc(){};
50                 void printElements(vector<double>); //This prints the values of the vector on one line with a space between each value.
51                 void printElements(vector<string>); //This prints the values of the vector on one line with a space between each value.
52                 int findString(vector<string>, string);//This returns the index of the given string in the given <string> vector, if the string does not exist in the vector it returns -1.
53                 double mean(vector<double>); //This returns the mean value of the vector.
54                 double stError(vector<double>); //This returns the standard error of the vector.
55                 int sumElements(vector<int>, int);
56                 int sumElements(vector<int>);
57                 double sumElements(vector<double>); //This returns the sum of all the values in the vector.
58                 double sumElements(vector<double>, int); //This returns the sum of all the values in the vector excluding those whose index is before the given index.  
59                 double findMax(vector<double>); //This returns the maximum value in the vector.
60                 int numNZ(vector<int>); //This returns the number of non-zero values in the vector.
61                 double numNZ(vector<double>); //This returns the number of non-zero values in the vector.
62                 double numPos(vector<double>); //This returns the number of positive values in the vector.
63                 double findMaxDiff(vector<double>, vector<double>); //This returns the absolute value of the maximum difference between the two vectors.
64                 double findDStat(vector<double>, vector<double>, double); //This returns the D-Statistic of the two vectors with the given total number of species.
65                 vector<int> findQuartiles(vector<double>); //This returns a vector with the first element being the index of the lower quartile of the vector and the second element being the index of the upper quartile of the vector.
66                 vector<double> add(vector<double>, double); //This adds the given number to every element in the given vector and returns the new vector.
67                 vector<double> multiply(vector<double>, double); //This multiplies every element in the given vector by the given number and returns the new vector.
68                 vector<double> power(vector<double>, double); //This raises every element in the given vector to the given number and returns the new vector.
69                 vector<double> addVecs(vector<double>,vector<double>); //The given vectors must be the same size. This adds the ith element of the first given vector to the ith element of the second given vector and returns the new vector.
70                 vector<double> multVecs(vector<double>,vector<double>); //The given vectors must be the same size. This multiplies the ith element of the first given vector to the ith element of the second given vector and returns the new vector.
71                 vector<double> remDup(vector<double>); //This returns a vector that contains 1 of each unique element in the given vector. The order of the elements is not changed.
72                 vector<double> genCVec(vector<double>); //This returns a cumilative vector of the given vector. The ith element of the returned vector is the sum of all the elements in the given vector up to i.
73                 vector<double> genRelVec(vector<double>); //This finds the sum of all the elements in the given vector and then divides the ith element in the given vector by that sum and then puts the result into a new vector, which is returned after all of the elements in the given vector have been used.
74                 vector<double> genDiffVec(vector<double>, vector<double>);//This subtracts the ith element of the second given vector from the ith element of the first given vector and returns the new vector.
75                 vector<double> genCSVec(vector<double>);//This calculates the number of species that have the same number of individuals as the ith element of the given vector and then returns a cumulative vector.
76                 vector<double> genTotVec(vector<vector<double> >); //This adds up the ith element of all the columns and puts that value into a new vector. It those this for all the rows and then returns the new vector.
77                 vector<double> quicksort(vector<double>); //This sorts the given vector from highest to lowest and returns the sorted vector.
78                 vector<vector<double> > gen2DVec(vector<double>, int, int); //(vector, #rows/columns, 0 if the second parameter was rows, 1 if the second parameter was columns) Transforms a single vector that was formatted like a table into a 2D vector.
79                 vector<string> getSData(char[]);//This takes a file name as a parameter and reads all of the data in the file into a <string> vector.
80 };
81
82 /**************************************************************************************************/
83 /*This Class contains methods that return the B Diverstiy of two sets
84 of data. The four methods are the Whittaker's measure, the Marczewski-Stainhaus distance,
85 the Sorensen quantitative index, and the Morisita-Horn index.
86 The main method takes a number of columns of data and performs all 4 methods on each
87 combination of columns. It prints a table for every method that shows the B Diverstiy for 
88 each combination. It also calculates the overall diversity for Whittaker's measure and 
89 the Marczewski-Steinhaus distance.*/
90
91
92 /*class BDiversity
93 {
94         public:
95                 void doBD(vector<double>, double);//Main method
96                 double getWhitt(vector<double>,vector<double>);//Whittacker's measure
97                 double getMS(vector<double>, vector<double>);//Marczewski-Stainhaus distance
98                 double getSor(vector<double>, vector<double>);//Sorensen quantitative index
99                 double getMor(vector<double>, vector<double>);//Morisita-Horn index
100                 void printD(vector<vector<double> >, int);//This prints a table that represents the given 2D vector, the second paramter specifies which method is to be used (1 for Whitt, 2 for MS, 3 for Sor, and 4 for Mor)
101 };*/
102
103 /**************************************************************************************************/
104
105 /*This Class is similar to the GeometricSeries.h class. It calculates
106 the broken stick distribution of the table and prints the D-Statistic 
107 and the confidence limits for the Kolmogorov-Smirnov 1-Sample test
108 with a 95% confidence level.*/
109
110 class BrokenStick
111 {
112         public:
113                 void doBStick(vector<double>);
114 };
115
116 /**************************************************************************************************/
117 /*This Class calculates the geometric series distribution for the data.
118 It prints the D-Statistic and the critical values for the Kolmogorov-Smirnov
119 1-sample test at the 95% confidence interval.*/
120
121 /*class GeometricSeries
122 {
123         public:
124                 void doGeomTest(vector<double>);
125 };*/
126
127 /**************************************************************************************************/
128 //This Class calculates the jackknifed estimate of the data and
129 //prints it and the confidence limits at a chosen confidence level.
130
131 class Jackknifing
132 {
133         public:
134                 void doJK(vector<double>, double);
135 };
136 /**************************************************************************************************/
137 /*This Class stores calculates the Kolmogorov-Smirnov 2-Sample test between two samples.
138 It prints the D-Statistic and the critical value for the test at 
139 the 90% and 95% confidence interval.*/
140
141 class KS2SampleTest
142 {
143         public:
144                 void doKSTest(vector<double>, vector<double>);
145 };
146 /**************************************************************************************************/
147 /*This Class calculates the Log Series Distribution for the data.
148 It then generates a D-Statistic and prints the D-Statistic and
149 the critical values for the Kolmogorov-Smirnov 1 sample test.*/
150
151 /*class LogSD
152 {
153         public:
154                 void doLogSD(vector<double>, vector<double>);
155 };*/
156
157 /**************************************************************************************************/
158 //This Class calculates and prints the Q-Statistic for the data.
159 class QStatistic
160 {
161         public:
162                 void doQStat(vector<double>);
163 };
164 /**************************************************************************************************/
165 class SSBPDiversityIndices
166 {
167         public:
168                 void doSSBP(vector<double>);
169                 double getShan(vector<double> vec);//The Shannon Index
170                 double getSimp(vector<double> vec);//The Simpson Index
171                 double getBP(vector<double> vec);//The Berger-Parker Index
172 };
173 /**************************************************************************************************/
174 //This Class stores the table of the confidence limits of the Student-T distribution.
175 class TDTable
176 {
177         public:
178                 double getConfLimit(int,int);
179 };
180
181 /**************************************************************************************************/
182 //This Class stores the table of the confidence limits of the One-Sample Kolmogorov-Smirnov Test.
183 class KOSTable
184 {
185         public:
186                 double getConfLimit(int);
187 };
188
189 /**************************************************************************************************/
190 /*This Class calculates the truncated lognormal for the data.
191 It then prints the D-Statistic and the critical values for the
192 Kolmogorov-Smirnov 1-Sample test.*
193
194 class TrunLN
195 {
196         public:
197                 void doTrunLN(vector<double>, vector<double>);
198 };
199 /**************************************************************************************************/
200
201 #endif
202