]> git.donarmstrong.com Git - mothur.git/blobdiff - preclustercommand.h
finished added bygroup processing of chimeras in chimera.slayer and chimera.uchime...
[mothur.git] / preclustercommand.h
index de6a5727575a7f35d2605239968a37435faa388f..38bcd37cf1ffc33a8ee3572c6f24053e1372c1fc 100644 (file)
@@ -31,25 +31,39 @@ class PreClusterCommand : public Command {
        
 public:
        PreClusterCommand(string);
-       ~PreClusterCommand();
-       int execute();  
-       void help();
+       PreClusterCommand();
+       ~PreClusterCommand(){}
+       
+       vector<string> setParameters();
+       string getCommandName()                 { return "pre.cluster";                         }
+       string getCommandCategory()             { return "Sequence Processing";         }
+       string getHelpString(); 
+       string getCitation() { return "http://www.mothur.org/wiki/Pre.cluster"; }
+       string getDescription()         { return "implements a pseudo-single linkage algorithm with the goal of removing sequences that are likely due to pyrosequencing errors"; }
+
+       
+       int execute(); 
+       void help() { m->mothurOut(getHelpString()); }  
        
 private:
        int diffs, length;
-       bool abort;
-       string fastafile, namefile, outputDir;
+       bool abort, bygroup;
+       string fastafile, namefile, outputDir, groupfile;
        vector<seqPNode> alignSeqs; //maps the number of identical seqs to a sequence
        map<string, string> names; //represents the names file first column maps to second column
        map<string, int> sizes;  //this map a seq name to the number of identical seqs in the names file
        map<string, int>::iterator itSize; 
 //     map<string, bool> active; //maps sequence name to whether it has already been merged or not.
+       vector<string> outputNames;
+       map<string, vector<string> > outputTypes;
        
        int readFASTA();
        void readNameFile();
        //int readNamesFASTA();
        int calcMisMatches(string, string);
        void printData(string, string); //fasta filename, names file name
+       int process();
+       int loadSeqs(map<string, string>&, vector<Sequence>&);
 };
 
 /************************************************************/