]> git.donarmstrong.com Git - imprinted_genes.git/blob - parse_parent_of_origin.pl
add code to calculate the imprinted genes of mouse
[imprinted_genes.git] / parse_parent_of_origin.pl
1 #!/usr/bin/perl
2 # parse_parent_of_origin.pl Parses output from the parent_of_origin website and returns a table of imprinted genes
3 # and is released under the terms of the GNU GPL version 3, or any
4 # later version, at your option. See the file README and COPYING for
5 # more information.
6 # Copyright 2014 by Don Armstrong <don@donarmstrong.com>.
7
8
9 use warnings;
10 use strict;
11
12 use Getopt::Long;
13 use Pod::Usage;
14
15 =head1 NAME
16
17 parse_parent_of_origin.pl - Parses output from the parent_of_origin website and returns a table of imprinted genes
18
19 =head1 SYNOPSIS
20
21 parse_parent_of_origin.pl [options]
22
23  Options:
24    --debug, -d debugging level (Default 0)
25    --help, -h display this help
26    --man, -m display manual
27
28 =head1 OPTIONS
29
30 =over
31
32 =item B<--debug, -d>
33
34 Debug verbosity. (Default 0)
35
36 =item B<--help, -h>
37
38 Display brief usage information.
39
40 =item B<--man, -m>
41
42 Display this manual.
43
44 =back
45
46 =head1 EXAMPLES
47
48 parse_parent_of_origin.pl parent_of_origin.html > parent_of_origin.txt
49
50 =cut
51
52
53 use vars qw($DEBUG);
54
55 use HTML::Tree;
56
57 my %options = (debug           => 0,
58                help            => 0,
59                man             => 0,
60                taxon           => 'Human',
61               );
62
63 GetOptions(\%options,
64            'taxon=s',
65            'debug|d+','help|h|?','man|m');
66
67 pod2usage() if $options{help};
68 pod2usage({verbose=>2}) if $options{man};
69
70 $DEBUG = $options{debug};
71
72 my @USAGE_ERRORS;
73 if (@ARGV != 1) {
74     push @USAGE_ERRORS,"You must provide a single html file";
75 }
76
77 pod2usage(join("\n",@USAGE_ERRORS)) if @USAGE_ERRORS;
78
79 my $t = HTML::Tree->new_from_file($ARGV[0]) or
80     die "Unable to parse $ARGV[0]";
81
82 my @imprinted_genes;
83 use Data::Printer;
84 # the table we want is currently the first table
85 for my $table ($t->look_down(_tag=>'table')) {
86     my @elements = map {$_->as_text()} $table->look_down(_tag => 'td');
87     my %row = map {s/:$//g if defined $_; $_;} @elements[0..7];
88     if (defined $row{Taxon} and
89         lc($row{'Taxon'}) eq lc($options{taxon})) {
90         push @imprinted_genes,\%row;
91     }
92 }
93
94 print "chromosome\tgene\ttaxon\n";
95 for my $gene (@imprinted_genes) {
96     print join("\t",map {$_ = defined $_?$_:''; s/[\x93"\x94]//g; $_}
97                @{$gene}{qw(Chromosome Gene Taxon)})."\n";
98 }
99
100
101
102
103
104
105 __END__