]> git.donarmstrong.com Git - debbugs.git/blobdiff - scripts/gen-indices.in
don't use ::Usertags ::Status et al. in soap.cgi anymore
[debbugs.git] / scripts / gen-indices.in
index b96b99b29da4711af685e03bb05e2bec0e7bc3f7..73243b8e5119b0d6cc9ee3a6432c36d88abe6157 100755 (executable)
@@ -4,15 +4,17 @@
 # Copyright (c) 2005/08/03 Anthony Towns
 # GPL v2
 
-#use strict;
-
 use DB_File;
+use MLDBM qw(DB_FILE Storable);
 use Fcntl qw/O_RDWR O_CREAT O_TRUNC/;
 use File::Copy;
 
 use Getopt::Long;
 use Pod::Usage;
 
+use warnings;
+use strict;
+
 use File::stat;
 use List::Util qw(min);
 
@@ -25,6 +27,7 @@ gen-indices - Generates index files for the cgi scripts
  gen-indices [options]
 
  Options:
+  --index-path path to index location
   --quick update changed bugs
   --debug, -d debugging level (Default 0)
   --help, -h display this help
@@ -57,37 +60,57 @@ Display this manual.
 
 =cut
 
+# Use portable Storable images
+$MLDBM::DumpMeth=q(portable);
+
 
 my %options = (debug           => 0,
               help            => 0,
               man             => 0,
               quick           => 0,
+              index_path      => undef,
               );
 
-GetOptions(\%options,'quick!','debug|d+','help|h|?','man|m') or pod2usage(2);
-
+GetOptions(\%options,'quick!','index_path|index-path=s','debug|d+','help|h|?','man|m') or pod2usage(2);
+pod2usage(1) if $options{help};
+pod2usage(-verbose=>2) if $options{man};
 
-require '/etc/debbugs/config';
-require '/org/bugs.debian.org/scripts/errorlib';
+use Debbugs::Config qw(:config);
+use Debbugs::Common qw(getparsedaddrs getbugcomponent);
+use Debbugs::Status qw(readbug);
 
-chdir('/org/bugs.debian.org/spool') or die "chdir spool: $!\n";
+chdir($config{spool_dir}) or die "chdir $config{spool_dir} failed: $!";
 
 my $verbose = $options{debug};
-my $indexdest = "/org/bugs.debian.org/spool";
+my $indexdest = $options{index_path} || $config{spool_dir};
 
 my $initialdir = "db-h";
 my $suffix = "";
 
-if ($ARGV[0] eq "archive") {
+if (defined $ARGV[0] and $ARGV[0] eq "archive") {
     $initialdir = "archive";
     $suffix = "-arc";
 }
 
-my @indexes = ('package', 'tag', 'severity', 'submitter-email');
-my %index = ();
+# NB: The reverse index is special; it's used to clean up during updates to bugs
+my @indexes = ('package', 'tag', 'severity','owner','submitter-email','reverse');
+my $indexes;
+my %slow_index = ();
+my %fast_index = ();
+if (not $options{quick}) {
+     # We'll trade memory for speed here if we're not doing a quick rebuild
+     for my $indexes (@indexes) {
+         $fast_index{$indexes} = {};
+     }
+     $indexes = \%fast_index;
+}
+else {
+     $indexes = \%slow_index;
+}
 my $time = undef;
+my $start_time = time;
 for my $i (@indexes) {
-       %{$index{$i}} = {};
+       $slow_index{$i} = {};
        if ($options{quick}) {
             if (-e "$indexdest/by-$i${suffix}.idx") {
                  system('cp','-a',"$indexdest/by-$i${suffix}.idx","$indexdest/by-$i${suffix}.idx.new") == 0
@@ -95,12 +118,12 @@ for my $i (@indexes) {
                  my $stat = stat("$indexdest/by-$i${suffix}.idx") or die "Unable to stat $indexdest/by-$i${suffix}.idx";
                  $time = defined $time ? min($time,$stat->mtime) : $stat->mtime;
             }
-            tie %{$index{$i}}, DB_File => "$indexdest/by-$i$suffix.idx.new",
+            tie %{$slow_index{$i}}, MLDBM => "$indexdest/by-$i$suffix.idx.new",
                  O_RDWR|O_CREAT, 0666
                       or die "$0: can't create by-$i$suffix-idx.new: $!";
        }
        else {
-            tie %{$index{$i}}, DB_File => "$indexdest/by-$i$suffix.idx.new",
+            tie %{$slow_index{$i}}, MLDBM => "$indexdest/by-$i$suffix.idx.new",
                  O_RDWR|O_CREAT|O_TRUNC, 0666
                       or die "$0: can't create by-$i$suffix-idx.new: $!";
 
@@ -109,16 +132,26 @@ for my $i (@indexes) {
 }
 
 sub addbugtoindex {
-       my ($i, $k, $bug) = @_;
-
-       my $cnt = 0;
-       if (exists $index{$i}->{"count $k"}) {
-               $cnt = unpack 'N', $index{$i}->{"count $k"};
-       }
-       $index{$i}->{"count $k"} = (pack 'N', 1+$cnt);
-       my $which = $cnt - ($cnt % 100);
-       $index{$i}->{"$which $k"} = '' unless defined $index{$i}->{"$which $k"};
-       $index{$i}->{"$which $k"} .= (pack 'N', $bug);
+     my ($index, $bug, @values) = @_;
+
+     if (exists $indexes->{reverse}{"$index $bug"}) {
+         # We do this insanity to work around a "feature" in MLDBM
+         for my $key (@{$indexes->{reverse}{"$index $bug"}}) {
+              my $temp = $indexes->{$index}{$key};
+              delete $temp->{$bug};
+              $indexes->{$index}{$key} = $temp;
+              $indexes->{$index}{"count $key"}--;
+         }
+         delete $indexes->{reverse}{"$index $bug"};
+     }
+     for my $key (@values) {
+         $indexes->{$index}->{"count $key"}++;
+         # We do this insanity to work around a "feature" in MLDBM
+         my $temp = $indexes->{$index}->{$key};
+         $temp->{$bug} = 1;
+         $indexes->{$index}->{$key} = $temp;
+     }
+     $indexes->{reverse}{"$index $bug"} = [@values];
 }
 
 sub emailfromrfc822 {
@@ -128,37 +161,53 @@ sub emailfromrfc822 {
        return $email;
 }
 
-#my $cnt = 0;
+my $cnt = 0;
 
 my @dirs = ($initialdir);
 while (my $dir = shift @dirs) {
        printf "Doing dir %s ...\n", $dir if $verbose;
 
-       opendir(DIR, "$dir/.") or die "opendir $dir: $!\n";
+       opendir(DIR, "$dir/.") or die "opendir $dir: $!";
        my @subdirs = readdir(DIR);
        closedir(DIR);
 
        my @list = map { m/^(\d+)\.summary$/?($1):() } @subdirs;
        push @dirs, map { m/^(\d+)$/ && -d "$dir/$1"?("$dir/$1"):() } @subdirs;
 
-       for my $f (@list) {
+       for my $bug (@list) {
                print "Up to $cnt bugs...\n" if (++$cnt % 100 == 0 && $verbose);
-               my $stat = stat(getbugcomponent($f,'summary');
-               next if $stat->mtime < $time;
-               my $fdata = readbug($f, $initialdir);
-               for my $p (split /[\s,]+/, $fdata->{"package"}) {
-                 addbugtoindex("package", $p, $f);
-               }
-               for my $t (split /[\s,]+/, $fdata->{"keywords"}) {
-                 addbugtoindex("tag", $t, $f);
+               my $stat = stat(getbugcomponent($bug,'summary',$initialdir));
+               if (not defined $stat) {
+                    print STDERR "Unable to stat $bug $!\n";
+                    next;
                }
-               addbugtoindex('submitter-email', 
-                       emailfromrfc822($fdata->{"originator"}), $f);
-               addbugtoindex("severity", $fdata->{"severity"}, $f);
+               next if $stat->mtime < $time;
+               my $fdata = readbug($bug, $initialdir);
+               addbugtoindex("package", $bug, split /[\s,]+/, $fdata->{"package"});
+               addbugtoindex("tag", $bug, split /[\s,]+/, $fdata->{"keywords"});
+               addbugtoindex('submitter-email', $bug,
+                             map {lc($_->address)} getparsedaddrs($fdata->{originator}));
+               addbugtoindex("severity", $bug, $fdata->{"severity"});
+               addbugtoindex("owner", $bug,
+                             map {lc($_->address)} getparsedaddrs($fdata->{"owner"}));
        }
 }
 
+if (not $options{quick}) {
+     # put the fast index into the slow index
+     for my $key1 (keys %fast_index) {
+         for my $key2 (keys %{$fast_index{$key1}}) {
+              $slow_index{$key1}{$key2} = $fast_index{$key1}{$key2};
+         }
+         print "Dealt with index $key1\n" if $verbose;
+     }
+}
+
+
 for my $i (@indexes) {
-       untie %{$indexes{$i}};
+       untie %{$slow_index{$i}};
        move("$indexdest/by-$i$suffix.idx.new", "$indexdest/by-$i$suffix.idx");
+       # We do this, because old versions of touch don't support -d '@epoch'
+       system('touch','-d',"1/1/1970 UTC + ${start_time}secs","$indexdest/by-$i$suffix.idx");
 }
+