]> git.donarmstrong.com Git - biopieces.git/blobdiff - code_ruby/lib/maasha/seq/trim.rb
added patscan_trim method to Seq
[biopieces.git] / code_ruby / lib / maasha / seq / trim.rb
index 09dff899d3727251bbf2c6ff4f8da72971c296fd..2be3e56800a518a25ce5da5665053b0951d4de8e 100644 (file)
@@ -1,3 +1,4 @@
+# Copyright (C) 2007-2013 Martin A. Hansen.
 
 # This program is free software; you can redistribute it and/or
 # modify it under the terms of the GNU General Public License
 # >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>><<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<
 
 require 'inline'
+require 'maasha/seq/backtrack'
+
+include BackTrack
+
+# Error class for all exceptions to do with Trim.
+class TrimError < StandardError; end
 
 # Module containing methods for end trimming sequences with suboptimal quality
 # scores.
@@ -31,7 +38,7 @@ module Trim
   def quality_trim_right(min_qual, min_len = 1)
     check_trim_args(min_qual)
 
-    pos = trim_right_pos_c(self.qual, self.length, min_qual, min_len, SCORE_BASE)
+    pos = trim_right_pos_c(self.qual, self.length, min_qual, min_len, Seq::SCORE_BASE)
 
     self.subseq(0, pos)
   end
@@ -41,7 +48,7 @@ module Trim
   def quality_trim_right!(min_qual, min_len = 1)
     check_trim_args(min_qual)
 
-    pos = trim_right_pos_c(self.qual, self.length, min_qual, min_len, SCORE_BASE)
+    pos = trim_right_pos_c(self.qual, self.length, min_qual, min_len, Seq::SCORE_BASE)
 
     self.subseq!(0, pos)
   end
@@ -51,7 +58,7 @@ module Trim
   def quality_trim_left(min_qual, min_len = 1)
     check_trim_args(min_qual)
 
-    pos = trim_left_pos_c(self.qual, self.length, min_qual, min_len, SCORE_BASE)
+    pos = trim_left_pos_c(self.qual, self.length, min_qual, min_len, Seq::SCORE_BASE)
 
     self.subseq(pos)
   end
@@ -61,7 +68,7 @@ module Trim
   def quality_trim_left!(min_qual, min_len = 1)
     check_trim_args(min_qual)
 
-    pos = trim_left_pos_c(self.qual, self.length, min_qual, min_len, SCORE_BASE)
+    pos = trim_left_pos_c(self.qual, self.length, min_qual, min_len, Seq::SCORE_BASE)
 
     self.subseq!(pos)
   end
@@ -71,8 +78,8 @@ module Trim
   def quality_trim(min_qual, min_len = 1)
     check_trim_args(min_qual)
 
-    pos_right = trim_right_pos_c(self.qual, self.length, min_qual, min_len, SCORE_BASE)
-    pos_left  = trim_left_pos_c(self.qual, self.length, min_qual, min_len, SCORE_BASE)
+    pos_right = trim_right_pos_c(self.qual, self.length, min_qual, min_len, Seq::SCORE_BASE)
+    pos_left  = trim_left_pos_c(self.qual, self.length, min_qual, min_len, Seq::SCORE_BASE)
 
     pos_left = pos_right if pos_left > pos_right
 
@@ -84,23 +91,55 @@ module Trim
   def quality_trim!(min_qual, min_len = 1)
     check_trim_args(min_qual)
 
-    pos_right = trim_right_pos_c(self.qual, self.length, min_qual, min_len, SCORE_BASE)
-    pos_left  = trim_left_pos_c(self.qual, self.length, min_qual, min_len, SCORE_BASE)
+    pos_right = trim_right_pos_c(self.qual, self.length, min_qual, min_len, Seq::SCORE_BASE)
+    pos_left  = trim_left_pos_c(self.qual, self.length, min_qual, min_len, Seq::SCORE_BASE)
 
     pos_left = pos_right if pos_left > pos_right
 
     self.subseq!(pos_left, pos_right - pos_left)
   end
 
+  # Method to locate a pattern in a sequence and trim all sequence to the left
+  # including the pattern.
+  def patmatch_trim_left!(pattern, options = {})
+    match = self.patmatch(pattern, options)
+
+    if match
+      stop = self.length
+
+      self.seq  = self.seq[match.pos + match.length .. stop]
+      self.qual = self.qual[match.pos + match.length .. stop] if self.qual
+
+      return self
+    end
+
+    nil
+  end
+
+  # Method to locate a pattern in a sequence and trim all sequence to the right
+  # including the pattern.
+  def patmatch_trim_right!(pattern, options = {})
+    match = self.patmatch(pattern, options)
+
+    if match
+      self.seq  = self.seq[0 ... match.pos]
+      self.qual = self.qual[0 ... match.pos] if self.qual
+
+      return self
+    end
+
+    nil
+  end
+
   private
 
   # Method to check the arguments for trimming and raise on bad sequence, qualities,
   # and min_qual.
   def check_trim_args(min_qual)
-    raise SeqError, "no sequence"      if self.seq.nil?
-    raise SeqError, "no quality score" if self.qual.nil?
-    unless (SCORE_MIN .. SCORE_MAX).include? min_qual
-      raise SeqError, "minimum quality value: #{min_qual} out of range #{SCORE_MIN} .. #{SCORE_MAX}"
+    raise TrimError, "no sequence"      if self.seq.nil?
+    raise TrimError, "no quality score" if self.qual.nil?
+    unless (Seq::SCORE_MIN .. Seq::SCORE_MAX).include? min_qual
+      raise TrimError, "minimum quality value: #{min_qual} out of range #{Seq::SCORE_MIN} .. #{Seq::SCORE_MAX}"
     end
   end
 
@@ -129,7 +168,7 @@ module Trim
         {
           c = 0;
 
-          while ((c < min_len) && ((c + i) < len) && (qual[len - (c + i) - 1] - score_base > min_qual))
+          while ((c < min_len) && ((c + i) < len) && (qual[len - (c + i) - 1] - score_base >= min_qual))
             c++;
 
           if (c == min_len)
@@ -167,7 +206,7 @@ module Trim
         {
           c = 0;
 
-          while ((c < min_len) && ((c + i) < len) && (qual[c + i] - score_base > min_qual))
+          while ((c < min_len) && ((c + i) < len) && (qual[c + i] - score_base >= min_qual))
             c++;
 
           if (c == min_len)