]> git.donarmstrong.com Git - biopieces.git/commitdiff
added bowtie2 biopieces
authormartinahansen <martinahansen@74ccb610-7750-0410-82ae-013aeee3265d>
Fri, 11 Jan 2013 14:36:57 +0000 (14:36 +0000)
committermartinahansen <martinahansen@74ccb610-7750-0410-82ae-013aeee3265d>
Fri, 11 Jan 2013 14:36:57 +0000 (14:36 +0000)
git-svn-id: http://biopieces.googlecode.com/svn/trunk@2071 74ccb610-7750-0410-82ae-013aeee3265d

bp_bin/bowtie2_seq [new file with mode: 0755]
bp_bin/create_bowtie2_index [new file with mode: 0755]

diff --git a/bp_bin/bowtie2_seq b/bp_bin/bowtie2_seq
new file mode 100755 (executable)
index 0000000..5c661e0
--- /dev/null
@@ -0,0 +1,115 @@
+#!/usr/bin/env ruby
+
+# Copyright (C) 2007-2013 Martin A. Hansen.
+
+# This program is free software; you can redistribute it and/or
+# modify it under the terms of the GNU General Public License
+# as published by the Free Software Foundation; either version 2
+# of the License, or (at your option) any later version.
+
+# This program is distributed in the hope that it will be useful,
+# but WITHOUT ANY WARRANTY; without even the implied warranty of
+# MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
+# GNU General Public License for more details.
+
+# You should have received a copy of the GNU General Public License
+# along with this program; if not, write to the Free Software
+# Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301, USA.
+
+# http://www.gnu.org/copyleft/gpl.html
+
+# >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>><<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<
+
+# This program is part of the Biopieces framework (www.biopieces.org).
+
+# >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> DESCRIPTION <<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<
+
+# Run bowtie2 to map sequences in the stream.
+
+# >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>><<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<
+
+require 'maasha/biopieces'
+require 'maasha/fasta'
+require 'maasha/sam'
+
+casts = []
+casts << {:long=>'index_name', :short=>'i', :type=>'string', :mandatory=>true,  :default=>nil,      :allowed=>nil,             :disallowed=>nil}
+casts << {:long=>'type',       :short=>'t', :type=>'string', :mandatory=>false, :default=>"single", :allowed=>"single,paired", :disallowed=>nil}
+casts << {:long=>'cpus',       :short=>'c', :type=>'uint',   :mandatory=>false, :default=>1,        :allowed=>nil,             :disallowed=>"0"}
+
+options = Biopieces.options_parse(ARGV, casts)
+
+tmp_dir  = Biopieces.mktmpdir
+in_file  = File.join(tmp_dir, "in.fna")
+in1_file = File.join(tmp_dir, "in1.fna")
+in2_file = File.join(tmp_dir, "in2.fna")
+out_file = File.join(tmp_dir, "out.sam")
+
+Biopieces.open(options[:stream_in], options[:stream_out]) do |input, output|
+  if options[:type] == "single"
+    Fasta.open(in_file, 'w') do |fasta_io|
+      input.each_record do |record|
+        output.puts record
+
+        if record[:SEQ_NAME] and record[:SEQ]
+          fasta_io.puts Seq.new_bp(record).to_fasta
+        end
+      end
+    end
+  else
+    Fasta.open(in1_file, 'w') do |fasta1_io|
+      Fasta.open(in2_file, 'w') do |fasta2_io|
+        input.each_record do |record|
+          output.puts record
+
+          if record[:SEQ_NAME] and record[:SEQ]
+            case record[:SEQ_NAME]
+            when /\/1$/ then fasta1_io.puts Seq.new_bp(record).to_fasta
+            when / 1:/  then fasta1_io.puts Seq.new_bp(record).to_fasta
+            when /\/2$/ then fasta2_io.puts Seq.new_bp(record).to_fasta
+            when / 2:/  then fasta2_io.puts Seq.new_bp(record).to_fasta
+            else
+              raise "Error: could not identify paired read in: #{record[:SEQ_NAME]}"
+            end
+          end
+        end
+      end
+    end
+  end
+
+  cmd = []
+  cmd << "bowtie2"
+  cmd << "-f"
+  cmd << "--quiet" unless options[:verbose]
+  cmd << "--threads #{options[:cpus]}"
+  cmd << "-x #{options[:index_name]}"
+
+  if options[:type] == "single"
+    cmd << "-U #{in_file}"
+  else
+    cmd << "-1 #{in1_file}"
+    cmd << "-2 #{in2_file}"
+  end
+
+  cmd << "-S #{out_file}"
+
+  c = cmd.join(" ")
+
+  $stderr.puts c if options[:verbose]
+
+  system(c)
+
+  raise "Error: executing #{c}" unless $?.success?
+
+  Sam.open(out_file, 'r') do |sam_io|
+    sam_io.each do |entry|
+      output.puts Sam.to_bp(entry)
+    end
+  end
+end
+
+
+# >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>><<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<
+
+
+__END__
diff --git a/bp_bin/create_bowtie2_index b/bp_bin/create_bowtie2_index
new file mode 100755 (executable)
index 0000000..bce4f88
--- /dev/null
@@ -0,0 +1,78 @@
+#!/usr/bin/env ruby
+
+# Copyright (C) 2007-2013 Martin A. Hansen.
+
+# This program is free software; you can redistribute it and/or
+# modify it under the terms of the GNU General Public License
+# as published by the Free Software Foundation; either version 2
+# of the License, or (at your option) any later version.
+
+# This program is distributed in the hope that it will be useful,
+# but WITHOUT ANY WARRANTY; without even the implied warranty of
+# MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
+# GNU General Public License for more details.
+
+# You should have received a copy of the GNU General Public License
+# along with this program; if not, write to the Free Software
+# Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301, USA.
+
+# http://www.gnu.org/copyleft/gpl.html
+
+# >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>><<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<
+
+# This program is part of the Biopieces framework (www.biopieces.org).
+
+# >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> DESCRIPTION <<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<
+
+# Create bowtie2 index from sequences in the stream.
+
+# >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>><<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<
+
+require 'maasha/biopieces'
+require 'maasha/fasta'
+
+casts = []
+casts << {:long=>'no_stream',  :short=>'x', :type=>'flag',   :mandatory=>false, :default=>nil, :allowed=>nil, :disallowed=>nil}
+casts << {:long=>'directory',  :short=>'d', :type=>'dir',    :mandatory=>true,  :default=>nil, :allowed=>nil, :disallowed=>nil}
+casts << {:long=>'index_name', :short=>'i', :type=>'string', :mandatory=>true,  :default=>nil, :allowed=>nil, :disallowed=>nil}
+
+options = Biopieces.options_parse(ARGV, casts)
+
+unless File.directory? options[:directory]
+  Dir.mkdir options[:directory]
+end
+
+tmpdir  = Biopieces.mktmpdir
+tmpfile = File.join(tmpdir, "tmp.fna")
+
+Biopieces.open(options[:stream_in], options[:stream_out]) do |input, output|
+  Fasta.open(tmpfile, mode="w") do |fasta_io|
+    input.each_record do |record|
+      output.puts record unless options[:no_stream]
+
+      if record[:SEQ_NAME] and record[:SEQ]
+        fasta_io.puts Seq.new_bp(record).to_fasta
+      end
+    end
+  end
+end
+
+cmd = []
+cmd << "bowtie2-build"
+cmd << "-q" unless options[:verbose]
+cmd << tmpfile
+cmd << File.join(options[:directory], options[:index_name])
+
+c = cmd.join(" ")
+
+$stderr.puts c if options[:verbose]
+
+system(c)
+
+raise "Error: executing #{c}" unless $?.success?
+
+
+# >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>><<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<
+
+
+__END__