]> git.donarmstrong.com Git - rsem.git/blobdiff - SingleQModel.h
Added posterior standard deviation of counts as output if either '--calc-pme' or...
[rsem.git] / SingleQModel.h
index 786d6476383ec41fb06606f74c49099786f693e7..ba43d9b608c934dd290ff5a9679b7f7d96e9586a 100644 (file)
@@ -8,8 +8,11 @@
 #include<string>
 #include<algorithm>
 #include<sstream>
+#include<iostream>
+#include<vector>
 
 #include "utils.h"
+#include "my_assert.h"
 #include "Orientation.h"
 #include "LenDist.h"
 #include "RSPD.h"
@@ -108,7 +111,14 @@ public:
                int readLen = read.getReadLength();
                int fpos = (dir == 0 ? pos : totLen - pos - readLen); // the aligned position reported in SAM file, should be a coordinate in forward strand
 
-               assert(fpos >= 0 && fpos + readLen <= totLen && readLen <= totLen);
+               general_assert(fpos >= 0, "The alignment of read " + read.getName() + " to transcript " + itos(sid) + " starts at " + itos(fpos) + \
+                               " from the forward direction, which should be a non-negative number! " + \
+                               "It is possible that the aligner you use gave different read lengths for a same read in SAM file.");
+               general_assert(fpos + readLen <= totLen,"Read " + read.getName() + " is hung over the end of transcript " + itos(sid) + "! " \
+                               + "It is possible that the aligner you use gave different read lengths for a same read in SAM file.");
+               general_assert(readLen <= totLen, "Read " + read.getName() + " has length " + itos(readLen) + ", but it is aligned to transcript " \
+                               + itos(sid) + ", whose length (" + itos(totLen) + ") is shorter than the read's length!");
+
                int seedPos = (dir == 0 ? pos : totLen - pos - seedLen); // the aligned position of the seed in forward strand coordinates
                if (seedPos >= fullLen || ref.getMask(seedPos)) return 0.0;
 
@@ -229,12 +239,12 @@ public:
 
        const LenDist& getGLD() { return *gld; }
 
-       void startSimulation(simul*, double*);
-       bool simulate(int, SingleReadQ&, int&);
+       void startSimulation(simul*, const std::vector<double>&);
+       bool simulate(READ_INT_TYPE, SingleReadQ&, int&);
        void finishSimulation();
 
        //Use it after function 'read' or 'estimateFromReads'
-       double* getMW() { 
+       const double* getMW() { 
          assert(mw != NULL);
          return mw;
        }
@@ -246,7 +256,7 @@ private:
        static const int read_type = 1;
 
        int M;
-       int N[3];
+        READ_INT_TYPE N[3];
        Refs *refs;
        double mean, sd;
        int seedLen;
@@ -281,7 +291,7 @@ void SingleQModel::estimateFromReads(const char* readFN) {
                        genReadFileNames(readFN, i, read_type, s, readFs);
                        ReadReader<SingleReadQ> reader(s, readFs, refs->hasPolyA(), seedLen); // allow calculation of calc_lq() function
 
-                       int cnt = 0;
+                       READ_INT_TYPE cnt = 0;
                        while (reader.next(read)) {
                                if (!read.isLowQuality()) {
                                        mld != NULL ? mld->update(read.getReadLength(), 1.0) : gld->update(read.getReadLength(), 1.0);
@@ -289,14 +299,14 @@ void SingleQModel::estimateFromReads(const char* readFN) {
                                        if (i == 0) { nqpro->updateC(read.getReadSeq(), read.getQScore()); }
                                }
                                else if (verbose && read.getReadLength() < seedLen) {
-                                       printf("Warning: Read %s is ignored due to read length %d < seed length %d!\n", read.getName().c_str(), read.getReadLength(), seedLen);
+                                       std::cout<< "Warning: Read "<< read.getName()<< " is ignored due to read length "<< read.getReadLength()<< " < seed length "<< seedLen<< "!"<< std::endl;
                                }
 
                                ++cnt;
-                               if (verbose && cnt % 1000000 == 0) { printf("%d READS PROCESSED\n", cnt); }
+                               if (verbose && cnt % 1000000 == 0) { std::cout<< cnt<< " READS PROCESSED"<< std::endl; }
                        }
 
-                       if (verbose) { printf("estimateFromReads, N%d finished.\n", i); }
+                       if (verbose) { std::cout<< "estimateFromReads, N"<< i<< " finished."<< std::endl; }
                }
 
        mld != NULL ? mld->finish() : gld->finish();
@@ -396,7 +406,7 @@ void SingleQModel::write(const char* outF) {
        fclose(fo);
 }
 
-void SingleQModel::startSimulation(simul* sampler, double* theta) {
+void SingleQModel::startSimulation(simul* sampler, const std::vector<double>& theta) {
        this->sampler = sampler;
 
        theta_cdf = new double[M + 1];
@@ -411,7 +421,7 @@ void SingleQModel::startSimulation(simul* sampler, double* theta) {
        nqpro->startSimulation();
 }
 
-bool SingleQModel::simulate(int rid, SingleReadQ& read, int& sid) {
+bool SingleQModel::simulate(READ_INT_TYPE rid, SingleReadQ& read, int& sid) {
        int dir, pos, readLen, fragLen;
        std::string name;
        std::string qual, readseq;