]> git.donarmstrong.com Git - biopieces.git/blob - bp_bin/read_embl
changed shebang
[biopieces.git] / bp_bin / read_embl
1 #!/usr/bin/env perl
2
3 # Copyright (C) 2007-2009 Martin A. Hansen.
4
5 # This program is free software; you can redistribute it and/or
6 # modify it under the terms of the GNU General Public License
7 # as published by the Free Software Foundation; either version 2
8 # of the License, or (at your option) any later version.
9
10 # This program is distributed in the hope that it will be useful,
11 # but WITHOUT ANY WARRANTY; without even the implied warranty of
12 # MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
13 # GNU General Public License for more details.
14
15 # You should have received a copy of the GNU General Public License
16 # along with this program; if not, write to the Free Software
17 # Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301, USA.
18
19 # http://www.gnu.org/copyleft/gpl.html
20
21
22 # >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> DESCRIPTION <<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<
23
24 # Read EMBL entries from one or more files.
25
26 # >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>><<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<
27
28
29 use strict;
30 use Maasha::Biopieces;
31 use Maasha::Filesys;
32 use Maasha::EMBL;
33
34
35 # >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>><<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<
36
37
38 my ( $options, $in, $out, %options2, $file, $data_in, $num, $entry, $record );
39
40 $options = Maasha::Biopieces::parse_options(
41     [
42         { long => 'data_in', short => 'i', type => 'files!', mandatory => 'no', default => undef, allowed => undef, disallowed => undef },
43         { long => 'num',     short => 'n', type => 'uint',   mandatory => 'no', default => undef, allowed => undef, disallowed => '0' },
44         { long => 'keys',    short => 'k', type => 'list',   mandatory => 'no', default => undef, allowed => undef, disallowed => undef },
45         { long => 'feats',   short => 'f', type => 'list',   mandatory => 'no', default => undef, allowed => undef, disallowed => undef },
46         { long => 'quals',   short => 'q', type => 'list',   mandatory => 'no', default => undef, allowed => undef, disallowed => undef },
47     ]   
48 );
49
50 $in  = Maasha::Biopieces::read_stream( $options->{ "stream_in" } );
51 $out = Maasha::Biopieces::write_stream( $options->{ "stream_out" } );
52
53 map { $options2{ "keys" }{ $_ } = 1 }  @{ $options->{ "keys" } };
54 map { $options2{ "feats" }{ $_ } = 1 } @{ $options->{ "feats" } };
55 map { $options2{ "quals" }{ $_ } = 1 } @{ $options->{ "quals" } };
56
57 while ( $record = Maasha::Biopieces::get_record( $in ) ) {
58     Maasha::Biopieces::put_record( $record, $out );
59 }
60
61 if ( $options->{ 'data_in' } )
62 {
63     $data_in = Maasha::Filesys::files_read_open( $options->{ 'data_in' } );
64
65     $num = 1;
66
67     while ( $entry = Maasha::EMBL::get_embl_entry( $data_in ) ) 
68     {
69         $record = Maasha::EMBL::parse_embl_entry( $entry, \%options2 );
70
71         my ( $feat, $feat2, $qual, $qual_val, $record_copy );
72
73         $record_copy = dclone $record;
74
75         delete $record_copy->{ "FT" };
76
77         Maasha::Biopieces::put_record( $record_copy, $out );
78
79         delete $record_copy->{ "SEQ" };
80
81         foreach $feat ( keys %{ $record->{ "FT" } } )
82         {
83             $record_copy->{ "FEAT_TYPE" } = $feat;
84
85             foreach $feat2 ( @{ $record->{ "FT" }->{ $feat } } )
86             {
87                 foreach $qual ( keys %{ $feat2 } )
88                 {
89                     $qual_val = join "; ", @{ $feat2->{ $qual } };
90
91                     $qual =~ s/^_//;
92                     $qual = uc $qual;
93
94                     $record_copy->{ $qual } = $qual_val;
95                 }
96
97                 Maasha::Biopieces::put_record( $record_copy, $out );
98             }
99         }
100
101         last if $options->{ "num" } and $num == $options->{ "num" };
102
103         $num++;
104     }
105
106     close $data_in;
107 }
108
109 Maasha::Biopieces::close_stream( $in );
110 Maasha::Biopieces::close_stream( $out );
111
112
113 # >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>><<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<
114
115
116 BEGIN
117 {
118     Maasha::Biopieces::status_set();
119 }
120
121
122 END
123 {
124     Maasha::Biopieces::status_log();
125 }
126
127
128 # >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>><<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<
129
130
131 __END__