]> git.donarmstrong.com Git - deb_pkgs/scowl.git/blobdiff - r/special/README
new upstream release of scowl
[deb_pkgs/scowl.git] / r / special / README
index 0c1ebb322346198dfcb5522267e52d1ada1fa09b..5c362e5be5c3c9bd9b3c9b069a56dd908a01e0a5 100644 (file)
@@ -11,7 +11,7 @@ abbreviations-also:
 Some additional abbreviations which I did not want to include at the
 lower word list sizes.
 
-frequent.lst:
+frequent:
 
 A combination of the two top 1000 lists found in the mwords package.
 I carefully went though and weeded out words which where an artifact
@@ -52,10 +52,42 @@ roman-numerals:
 A list of roman numerous originally extracted from the ispell word
 lists.
 
-signature:
+signature.35:
 
 A small list of words that I thought really out to be at the 35 level.
 
+signature.??:
+
+Additional words to add at the respective level.
+
+marco-alan.??:
+
+Words Marco A.G.Pinto proposed to add that Alan Beale also thought
+should be added.  Words with 3 stars or more (see
+app.aspell.net:/lookup-freq) are added at the 60 and others at the 70
+level.
+
+mozilla-alan.60:
+
+Words found in the Mozilla dictionary than Alan also approved of.
+
+extra.60:
+
+Non-signature words suggested for inclusion by others that are
+recognized by most dictionaries but not all that common.
+
+macro-alan-manual.70:
+
+Words Marco A.G.Pinto and Alan Beale though should be added that I
+(Kevin Atkinson) for one reason or another didn't want to add at the
+60 level.  The most likely reasons are that the word is too similar to
+a more common word or a compound word that is normally spelled as two
+words or with a hyphen.
+
+macro.80:
+
+Words that are Macro added to en_GB not in one of the above lists.
+
 unix-terms:
 
 A list of commonly used unix terms often used as regular english words
@@ -66,9 +98,48 @@ variant:
 A list of words which the 12dicts package does not consider variants
 but I do.
 
+not-upper:
+
+Normal words that just happen to start with an uppercase words and 
+have no relation to a proper name, for example OK AWOL
+
+2800-ptr:
+
+Words from "2800 Personality Trait Descriptors" (1967), see
+https://sourceforge.net/p/wordlist/issues/60/
+
+exclude.??:
+
+Words to exclude up to the specified level (and hence bump them to the
+next level.)  Used mostly for obscure words that are very similar to a
+far more common word and hence could mask the misspelling of the more
+common word.
+
+hacker-exclude:
+
+List of words found in the hacker category that are not found anywhere
+in Google Book's corpus (1980-2008) and thus should in all likelihood
+not be included considering "words" such as FTPing, grepped, etc. are
+in the corpus.
+
+prefixes:
+
+Common prefixes that are often followed used with a dash.  For example
+"multi-".  Note "pre" is left out as it is too close to "per" which is more
+common.
 
+phrase-parts:
 
+Parts of common (generally Latin) phrases that are not normal words
+themselfs.
 
+australian.35:
 
+A list of extra Australian words added at the 35 level to the
+"australian" spelling category.
 
+chinese-names:
+chinese-names.also:
 
+A list of Chinese names from https://github.com/en-wl/wordlist/issues/203.
+The ".also" file contains two word names I have not decided how to process.