]> git.donarmstrong.com Git - deb_pkgs/scowl.git/blob - r/special/README
New upstream version 2018.04.16
[deb_pkgs/scowl.git] / r / special / README
1 This directory contains numerous special word list which I have
2 created myself.
3
4 abbreviations:
5
6 A list of commonly used abbreviations and acronyms, especially in
7 conversational text such as email.
8
9 abbreviations-also:
10
11 Some additional abbreviations which I did not want to include at the
12 lower word list sizes.
13
14 frequent:
15
16 A combination of the two top 1000 lists found in the mwords package.
17 I carefully went though and weeded out words which where an artifact
18 of the corpus used.
19
20 letters:
21
22 A list of single letters and there inflected forms
23
24 names.from_alan_beale:
25
26 A list of names (version 5.2) sent to be by Alan Beale <biljir@pobox.com>:
27
28   I have a large list of proper names, whose origins are in the
29   linux-words proper names, but which both removes a lot of (what I
30   considered to be) junk entries, and adds a lot of names of various
31   sorts, notably names of commercial products and noteworthy
32   historical personages.
33
34 never-abbreviations:
35
36 A list of words that I do not consider abbreviations.
37
38 never-variant:
39
40 A list of words I do not consider variants.
41
42 not-possessive:
43
44 A list of nouns which should not take a possessive form with "'s".
45
46 proper-names:
47
48 A list of additional proper names.
49
50 roman-numerals:
51
52 A list of roman numerous originally extracted from the ispell word
53 lists.
54
55 signature.35:
56
57 A small list of words that I thought really out to be at the 35 level.
58
59 signature.??:
60
61 Additional words to add at the respective level.
62
63 marco-alan.??:
64
65 Words Marco A.G.Pinto proposed to add that Alan Beale also thought
66 should be added.  Words with 3 stars or more (see
67 app.aspell.net:/lookup-freq) are added at the 60 and others at the 70
68 level.
69
70 mozilla-alan.60:
71
72 Words found in the Mozilla dictionary than Alan also approved of.
73
74 extra.60:
75
76 Non-signature words suggested for inclusion by others that are
77 recognized by most dictionaries but not all that common.
78
79 macro-alan-manual.70:
80
81 Words Marco A.G.Pinto and Alan Beale though should be added that I
82 (Kevin Atkinson) for one reason or another didn't want to add at the
83 60 level.  The most likely reasons are that the word is too similar to
84 a more common word or a compound word that is normally spelled as two
85 words or with a hyphen.
86
87 macro.80:
88
89 Words that are Macro added to en_GB not in one of the above lists.
90
91 unix-terms:
92
93 A list of commonly used unix terms often used as regular english words
94 by geeks.
95
96 variant:
97
98 A list of words which the 12dicts package does not consider variants
99 but I do.
100
101 not-upper:
102
103 Normal words that just happen to start with an uppercase words and 
104 have no relation to a proper name, for example OK AWOL
105
106 2800-ptr:
107
108 Words from "2800 Personality Trait Descriptors" (1967), see
109 https://sourceforge.net/p/wordlist/issues/60/
110
111 exclude.??:
112
113 Words to exclude up to the specified level (and hence bump them to the
114 next level.)  Used mostly for obscure words that are very similar to a
115 far more common word and hence could mask the misspelling of the more
116 common word.
117
118 hacker-exclude:
119
120 List of words found in the hacker category that are not found anywhere
121 in Google Book's corpus (1980-2008) and thus should in all likelihood
122 not be included considering "words" such as FTPing, grepped, etc. are
123 in the corpus.
124
125 prefixes:
126
127 Common prefixes that are often followed used with a dash.  For example
128 "multi-".  Note "pre" is left out as it is too close to "per" which is more
129 common.
130
131 phrase-parts:
132
133 Parts of common (generally Latin) phrases that are not normal words
134 themselfs.
135
136 australian.35:
137
138 A list of extra Australian words added at the 35 level to the
139 "australian" spelling category.
140
141 chinese-names:
142 chinese-names.also:
143
144 A list of Chinese names from https://github.com/en-wl/wordlist/issues/203.
145 The ".also" file contains two word names I have not decided how to process.