]> git.donarmstrong.com Git - biopieces.git/blob - bp_bin/analyze_tags
fixed seq qual length check
[biopieces.git] / bp_bin / analyze_tags
1 #!/usr/bin/env perl
2
3 # Copyright (C) 2007-2009 Martin A. Hansen.
4
5 # This program is free software; you can redistribute it and/or
6 # modify it under the terms of the GNU General Public License
7 # as published by the Free Software Foundation; either version 2
8 # of the License, or (at your option) any later version.
9
10 # This program is distributed in the hope that it will be useful,
11 # but WITHOUT ANY WARRANTY; without even the implied warranty of
12 # MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
13 # GNU General Public License for more details.
14
15 # You should have received a copy of the GNU General Public License
16 # along with this program; if not, write to the Free Software
17 # Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301, USA.
18
19 # http://www.gnu.org/copyleft/gpl.html
20
21
22 # >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> DESCRIPTION <<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<
23
24 # Analyze sequence tags in sequence or BED records from the stream.
25
26 # >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>><<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<
27
28
29 use warnings;
30 use strict;
31 use Maasha::Biopieces;
32 use Maasha::Seq;
33
34
35 # >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>><<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<
36
37
38 my ( $options, $in, $out, $record, %len_hash, %clone_hash, $clones, $key, $tag_record );
39
40 $options = Maasha::Biopieces::parse_options();
41
42 $in  = Maasha::Biopieces::read_stream( $options->{ "stream_in" } );
43 $out = Maasha::Biopieces::write_stream( $options->{ "stream_out" } );
44
45 while ( $record = Maasha::Biopieces::get_record( $in ) ) 
46 {
47     if ( $record->{ "SEQ_NAME" } and $record->{ "SEQ" } )
48     {
49         if ( $record->{ "SEQ_NAME" } =~ /_(\d+)$/ )
50         {
51             $clones = $1;
52
53             $len_hash{ length( $record->{ "SEQ" } ) }++;
54             $clone_hash{ length( $record->{ "SEQ" } ) } += $clones;
55         }
56     }
57     elsif ( $record->{ "Q_ID" } and $record->{ "BED_LEN" } )
58     {
59         if ( $record->{ "Q_ID" } =~ /_(\d+)$/ )
60         {
61             $clones = $1;
62
63             $len_hash{ $record->{ "BED_LEN" } }++;
64             $clone_hash{ $record->{ "BED_LEN" } } += $clones;
65         }
66     }
67 }
68
69 foreach $key ( sort { $a <=> $b } keys %len_hash )
70 {
71     $tag_record->{ "TAG_LEN" }    = $key;
72     $tag_record->{ "TAG_COUNT" }  = $len_hash{ $key };
73     $tag_record->{ "TAG_CLONES" } = $clone_hash{ $key };
74
75     Maasha::Biopieces::put_record( $tag_record, $out );
76 }
77
78 Maasha::Biopieces::close_stream( $in );
79 Maasha::Biopieces::close_stream( $out );
80
81
82 # >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>><<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<
83
84
85 BEGIN
86 {
87     Maasha::Biopieces::status_set();
88 }
89
90
91 END
92 {
93     Maasha::Biopieces::status_log();
94 }
95
96
97 # >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>><<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<
98
99
100 __END__