]> git.donarmstrong.com Git - biopieces.git/blob - bp_bin/read_embl
fixed bug in read_embl
[biopieces.git] / bp_bin / read_embl
1 #!/usr/bin/env perl
2
3 # Copyright (C) 2007-2009 Martin A. Hansen.
4
5 # This program is free software; you can redistribute it and/or
6 # modify it under the terms of the GNU General Public License
7 # as published by the Free Software Foundation; either version 2
8 # of the License, or (at your option) any later version.
9
10 # This program is distributed in the hope that it will be useful,
11 # but WITHOUT ANY WARRANTY; without even the implied warranty of
12 # MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
13 # GNU General Public License for more details.
14
15 # You should have received a copy of the GNU General Public License
16 # along with this program; if not, write to the Free Software
17 # Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301, USA.
18
19 # http://www.gnu.org/copyleft/gpl.html
20
21
22 # >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> DESCRIPTION <<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<
23
24 # Read EMBL entries from one or more files.
25
26 # >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>><<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<
27
28
29 use warnings;
30 use strict;
31 use Storable qw( dclone );
32 use Maasha::Biopieces;
33 use Maasha::Filesys;
34 use Maasha::EMBL;
35
36
37 # >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>><<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<
38
39
40 my ( $options, $in, $out, %options2, $file, $data_in, $num, $entry, $record );
41
42 $options = Maasha::Biopieces::parse_options(
43     [
44         { long => 'data_in', short => 'i', type => 'files!', mandatory => 'no', default => undef, allowed => undef, disallowed => undef },
45         { long => 'num',     short => 'n', type => 'uint',   mandatory => 'no', default => undef, allowed => undef, disallowed => '0' },
46         { long => 'keys',    short => 'k', type => 'list',   mandatory => 'no', default => undef, allowed => undef, disallowed => undef },
47         { long => 'feats',   short => 'f', type => 'list',   mandatory => 'no', default => undef, allowed => undef, disallowed => undef },
48         { long => 'quals',   short => 'q', type => 'list',   mandatory => 'no', default => undef, allowed => undef, disallowed => undef },
49     ]   
50 );
51
52 $in  = Maasha::Biopieces::read_stream( $options->{ "stream_in" } );
53 $out = Maasha::Biopieces::write_stream( $options->{ "stream_out" } );
54
55 map { $options2{ "keys" }{ $_ } = 1 }  @{ $options->{ "keys" } };
56 map { $options2{ "feats" }{ $_ } = 1 } @{ $options->{ "feats" } };
57 map { $options2{ "quals" }{ $_ } = 1 } @{ $options->{ "quals" } };
58
59 while ( $record = Maasha::Biopieces::get_record( $in ) ) {
60     Maasha::Biopieces::put_record( $record, $out );
61 }
62
63 if ( $options->{ 'data_in' } )
64 {
65     $data_in = Maasha::Filesys::files_read_open( $options->{ 'data_in' } );
66
67     $num = 1;
68
69     while ( $entry = Maasha::EMBL::get_embl_entry( $data_in ) ) 
70     {
71         $record = Maasha::EMBL::parse_embl_entry( $entry, \%options2 );
72
73         my ( $feat, $feat2, $qual, $qual_val, $record_copy );
74
75         $record_copy = dclone $record;
76
77         delete $record_copy->{ "FT" };
78
79         Maasha::Biopieces::put_record( $record_copy, $out );
80
81         delete $record_copy->{ "SEQ" };
82
83         foreach $feat ( keys %{ $record->{ "FT" } } )
84         {
85             $record_copy->{ "FEAT_TYPE" } = $feat;
86
87             foreach $feat2 ( @{ $record->{ "FT" }->{ $feat } } )
88             {
89                 foreach $qual ( keys %{ $feat2 } )
90                 {
91                     $qual_val = join "; ", @{ $feat2->{ $qual } };
92
93                     $qual =~ s/^_//;
94                     $qual = uc $qual;
95
96                     $record_copy->{ $qual } = $qual_val;
97                 }
98
99                 Maasha::Biopieces::put_record( $record_copy, $out );
100             }
101         }
102
103         last if $options->{ "num" } and $num == $options->{ "num" };
104
105         $num++;
106     }
107
108     close $data_in;
109 }
110
111 Maasha::Biopieces::close_stream( $in );
112 Maasha::Biopieces::close_stream( $out );
113
114
115 # >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>><<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<
116
117
118 BEGIN
119 {
120     Maasha::Biopieces::status_set();
121 }
122
123
124 END
125 {
126     Maasha::Biopieces::status_log();
127 }
128
129
130 # >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>><<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<
131
132
133 __END__