]> git.donarmstrong.com Git - bin.git/blob - pubmed_search
allow outputting pubmed ids only
[bin.git] / pubmed_search
1 #! /usr/bin/perl
2 # , and is released
3 # under the terms of the GPL version 2, or any later version, at your
4 # option. See the file README and COPYING for more information.
5 # Copyright 2011 by Don Armstrong <don@donarmstrong.com>.
6 # $Id: perl_script 1825 2011-01-02 01:53:43Z don $
7
8
9 use warnings;
10 use strict;
11
12 use Getopt::Long;
13 use Pod::Usage;
14
15 use Bio::DB::EUtilities;
16
17 use Encode qw(encode_utf8);
18 use Term::ANSIColor qw(:constants);
19 use Text::Wrap;
20
21
22 =head1 NAME
23
24 pubmed_search - Search for articles on pubmed
25
26 =head1 SYNOPSIS
27
28  pubmed_search [options] [searchterms]
29
30  Options:
31   --debug, -d debugging level (Default 0)
32   --help, -h display this help
33   --man, -m display manual
34
35 =head1 OPTIONS
36
37 =over
38
39 =item B<--debug, -d>
40
41 Debug verbosity. (Default 0)
42
43 =item B<--help, -h>
44
45 Display brief usage information.
46
47 =item B<--man, -m>
48
49 Display this manual.
50
51 =back
52
53 =head1 EXAMPLES
54
55
56 =cut
57
58
59 use vars qw($DEBUG);
60
61 my %options = (debug           => 0,
62                help            => 0,
63                man             => 0,
64                color           => 1,
65                org_mode        => 0,
66                );
67
68 GetOptions(\%options,
69            'color|c!',
70            'org_mode|org-mode',
71            'pmid_only|pmid-only',
72            'debug|d+','help|h|?','man|m');
73
74 pod2usage() if $options{help};
75 pod2usage({verbose=>2}) if $options{man};
76
77 $DEBUG = $options{debug};
78
79 my @USAGE_ERRORS;
80 if (not @ARGV) {
81     push @USAGE_ERRORS,"You must pass something";
82 }
83
84 pod2usage(join("\n",@USAGE_ERRORS)) if @USAGE_ERRORS;
85
86
87 my $search = Bio::DB::EUtilities->new(-eutil => 'esearch',
88                                       -email => 'don@donarmstrong.com',
89                                       -db    => 'pubmed',
90                                       -term => join(' ',@ARGV),
91                                       -retmax => 1000,
92                                      );
93 my @ids = $search->get_ids();
94 if ($options{org_mode}) {
95     print "* Pubmed search results for ".join(' ',@ARGV)." (".scalar(@ids).")\n";
96     print "  + ";
97 } elsif ($options{pmid_only}) {
98     print map{qq($_\n)} @ids;
99     exit 0;
100 }
101 print scalar(@ids)." results:\n";
102 exit 0 unless @ids;
103 my $esummary = Bio::DB::EUtilities->new(-eutil => 'efetch',
104                                         -email => 'don@donarmstrong.com',
105                                         -db    => 'pubmed',
106                                         -id  => \@ids
107                                        );
108 use XML::LibXML;
109 my $xml = XML::LibXML->load_xml(string => $esummary->get_Response()->content());
110 for my $article ($xml->findnodes('PubmedArticleSet/PubmedArticle/MedlineCitation')) {
111     # print $article->toString;
112     my ($pmid) = $article->findnodes('./PMID');
113     my ($title) = $article->findnodes('./Article/ArticleTitle');
114     my ($abstract) = $article->findnodes('./Article/Abstract');
115     if ($options{org_mode}) {
116         print "** PMID: ";
117     }
118     print BOLD GREEN if $options{color};
119     print $pmid->textContent();
120     print ": ";
121     print RESET if $options{color};
122     print BOLD CYAN if $options{color};
123     print encode_utf8($title->textContent())."\n";
124     print RESET if $options{color};
125     print BOLD MAGENTA if $options{color};
126     if (defined $abstract) {
127         if ($options{org_mode}) {
128             print "*** Abstract\n";
129         }
130         $abstract = $abstract->textContent();
131         $abstract =~ s/^\s*//mg;
132         $abstract =~ s/(.{,80})\s/$1\n/g;
133         $abstract = encode_utf8($abstract);
134         print wrap('','',$abstract);
135         print "\n\n";
136         print RESET if $options{color};
137     }
138 }
139
140 __END__