]> git.donarmstrong.com Git - biopieces.git/blob - bp_bin/extract_seq
migrated extract_seq
[biopieces.git] / bp_bin / extract_seq
1 #!/usr/bin/env perl -w
2
3 # Copyright (C) 2007-2009 Martin A. Hansen.
4
5 # This program is free software; you can redistribute it and/or
6 # modify it under the terms of the GNU General Public License
7 # as published by the Free Software Foundation; either version 2
8 # of the License, or (at your option) any later version.
9
10 # This program is distributed in the hope that it will be useful,
11 # but WITHOUT ANY WARRANTY; without even the implied warranty of
12 # MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
13 # GNU General Public License for more details.
14
15 # You should have received a copy of the GNU General Public License
16 # along with this program; if not, write to the Free Software
17 # Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301, USA.
18
19 # http://www.gnu.org/copyleft/gpl.html
20
21
22 # >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> DESCRIPTION <<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<
23
24 # Split the values of a key into new key/value pairs.
25
26 # >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>><<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<
27
28
29 use strict;
30 use Maasha::Biopieces;
31
32
33 # >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>><<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<
34
35
36 my ( $run_time_beg, $run_time_end, $options, $in, $out, $record, $beg, $end, $len );
37
38 $options = Maasha::Biopieces::parse_options(
39     [
40         { long => 'beg', short => 'b', type => 'uint', mandatory => 'no', default => undef, allowed => undef, disallowed => undef },
41         { long => 'end', short => 'e', type => 'uint', mandatory => 'no', default => undef, allowed => undef, disallowed => undef },
42         { long => 'len', short => 'l', type => 'uint', mandatory => 'no', default => undef, allowed => undef, disallowed => 0 },
43     ]   
44 );
45
46 $in  = Maasha::Biopieces::read_stream( $options->{ "stream_in" } );
47 $out = Maasha::Biopieces::write_stream( $options->{ "stream_out" } );
48
49 if ( not defined $options->{ "beg" } or $options->{ "beg" } < 0 ) {
50     $beg = 0;
51 } else {
52     $beg = $options->{ "beg" } - 1;   # correcting for start offset
53 }
54
55 if ( defined $options->{ "end" } and $options->{ "end" } - 1 < $beg ) {
56     $end = $beg - 1;
57 } elsif ( defined $options->{ "end" } ) {
58     $end = $options->{ "end" } - 1;   # correcting for start offset
59 }
60
61 $len = $options->{ "len" };
62
63 #    print "beg->$beg,  end->$end,  len->$len\n";
64
65 while ( $record = Maasha::Biopieces::get_record( $in ) ) 
66 {
67     if ( $record->{ "SEQ" } )
68     {
69         if ( defined $beg and defined $end )
70         {
71             if ( $end - $beg + 1 > length $record->{ "SEQ" } ) {
72                 $record->{ "SEQ" } = substr $record->{ "SEQ" }, $beg;
73             } else {
74                 $record->{ "SEQ" } = substr $record->{ "SEQ" }, $beg, $end - $beg + 1;
75             }
76         }
77         elsif ( defined $beg and defined $len )
78         {
79             if ( $len > length $record->{ "SEQ" } ) {
80                 $record->{ "SEQ" } = substr $record->{ "SEQ" }, $beg;
81             } else {
82                 $record->{ "SEQ" } = substr $record->{ "SEQ" }, $beg, $len;
83             }
84         }
85         elsif ( defined $beg )
86         {
87             $record->{ "SEQ" } = substr $record->{ "SEQ" }, $beg;
88         }
89
90         $record->{ "SEQ_LEN" } = length $record->{ "SEQ" };
91     }
92
93     Maasha::Biopieces::put_record( $record, $out );
94 }
95
96
97 # >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>><<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<
98
99
100 BEGIN
101 {
102     $run_time_beg = Maasha::Biopieces::run_time();
103
104     Maasha::Biopieces::log_biopiece();
105 }
106
107
108 END
109 {
110     Maasha::Biopieces::close_stream( $in );
111     Maasha::Biopieces::close_stream( $out );
112
113     $run_time_end = Maasha::Biopieces::run_time();
114
115     Maasha::Biopieces::run_time_print( $run_time_beg, $run_time_end, $options );
116 }
117
118
119 # >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>><<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<
120
121
122 __END__
123