]> git.donarmstrong.com Git - biopieces.git/blobdiff - code_ruby/lib/maasha/seq.rb
added remove_indels method
[biopieces.git] / code_ruby / lib / maasha / seq.rb
index 562bab91848cab683cef488e35122cf813a03ad0..f4abff7c36aafba918a04b76d5e6f3544345225c 100644 (file)
@@ -1,4 +1,4 @@
-# Copyright (C) 2007-2011 Martin A. Hansen.
+# Copyright (C) 2007-2012 Martin A. Hansen.
 
 # This program is free software; you can redistribute it and/or
 # modify it under the terms of the GNU General Public License
@@ -134,6 +134,28 @@ class Seq
     self.seq.scan(regex).size
   end
 
+  # Method to remove indels from seq and qual if qual.
+  def indels_remove
+    if self.qual.nil?
+      self.seq.delete!(Regexp.escape(INDELS.join('')))
+    else
+      na_seq  = NArray.to_na(self.seq, "byte")
+      na_qual = NArray.to_na(self.qual, "byte")
+      mask    = NArray.byte(self.length)
+
+      INDELS.each do |c|
+        mask += na_seq.eq(c.ord)
+      end
+
+      mask = mask.eq(0)
+
+      self.seq  = na_seq[mask].to_s
+      self.qual = na_qual[mask].to_s
+    end
+
+    self
+  end
+
   # Method that returns true is a given sequence type is DNA.
   def is_dna?
     self.type == 'dna'