]> git.donarmstrong.com Git - biopieces.git/blobdiff - bp_bin/read_fastq
added write_sam biopiece
[biopieces.git] / bp_bin / read_fastq
index acc68d653fccf1ed40e662df20840407d6fca3db..bbfbdd4cc00fc265f7e3fd49e1ee4157e8b1516c 100755 (executable)
@@ -1,6 +1,6 @@
 #!/usr/bin/env ruby
 
-# Copyright (C) 2007-2011 Martin A. Hansen.
+# Copyright (C) 2007-2013 Martin A. Hansen.
 
 # This program is free software; you can redistribute it and/or
 # modify it under the terms of the GNU General Public License
@@ -40,11 +40,12 @@ casts << {:long=>'encoding', :short=>'e', :type=>'string', :mandatory=>false, :d
 
 options = Biopieces.options_parse(ARGV, casts)
 
-num  = 0
-last = false
+num   = 0
+first = true
+last  = false
 
 Biopieces.open(options[:stream_in], options[:stream_out]) do |input, output|
-  unless options[:data_in].first == '-'
+  unless options[:data_in] and options[:data_in].first == '-'
     input.each_record do |record|
       output.puts record
     end
@@ -57,9 +58,9 @@ Biopieces.open(options[:stream_in], options[:stream_out]) do |input, output|
       Fastq.open(file, mode='r') do |fastq|
         fastq.each do |entry|
           if encoding == 'auto'
-            if entry.qual.match(/[!-:]/) # sanger or illumina18
+            if entry.qual_base33? # sanger or illumina18
               encoding = 'illumina18'
-            elsif entry.qual.match(/[K-h]/) # solexa or illumina13 or illumina15
+            elsif entry.qual_base64? # solexa or illumina13 or illumina15
               encoding = 'illumina13'
             else
               raise SeqError, "Could not auto-detect quality score encoding"
@@ -67,6 +68,12 @@ Biopieces.open(options[:stream_in], options[:stream_out]) do |input, output|
           end
 
           entry.convert_scores!(encoding, 'illumina13')
+
+          if first
+#            raise SeqError, "Quality score outside valid range" unless entry.qual_valid?('illumina13')
+            first = false
+          end
+
           output.puts entry.to_bp
           num += 1