]> git.donarmstrong.com Git - deb_pkgs/scowl.git/blob - r/special/README
Imported Upstream version 2015.08.24
[deb_pkgs/scowl.git] / r / special / README
1 This directory contains numerous special word list which I have
2 created myself.
3
4 abbreviations:
5
6 A list of commonly used abbreviations and acronyms, especially in
7 conversational text such as email.
8
9 abbreviations-also:
10
11 Some additional abbreviations which I did not want to include at the
12 lower word list sizes.
13
14 frequent:
15
16 A combination of the two top 1000 lists found in the mwords package.
17 I carefully went though and weeded out words which where an artifact
18 of the corpus used.
19
20 letters:
21
22 A list of single letters and there inflected forms
23
24 names.from_alan_beale:
25
26 A list of names (version 5.2) sent to be by Alan Beale <biljir@pobox.com>:
27
28   I have a large list of proper names, whose origins are in the
29   linux-words proper names, but which both removes a lot of (what I
30   considered to be) junk entries, and adds a lot of names of various
31   sorts, notably names of commercial products and noteworthy
32   historical personages.
33
34 never-abbreviations:
35
36 A list of words that I do not consider abbreviations.
37
38 never-variant:
39
40 A list of words I do not consider variants.
41
42 not-possessive:
43
44 A list of nouns which should not take a possessive form with "'s".
45
46 proper-names:
47
48 A list of additional proper names.
49
50 roman-numerals:
51
52 A list of roman numerous originally extracted from the ispell word
53 lists.
54
55 signature.35:
56
57 A small list of words that I thought really out to be at the 35 level.
58
59 signature.??:
60
61 Additional words to add at the respective level.
62
63 marco-alan.??:
64
65 Words Marco A.G.Pinto proposed to add that Alan Beale also thought
66 should be added.  Words with 3 stars or more (see
67 app.aspell.net:/lookup-freq) are added at the 60 and others at the 70
68 level.
69
70 extra.60:
71
72 Non-signature words suggested for inclusion by others that are
73 recognized by most dictionaries but not all that common.
74
75 macro-alan-manual.70:
76
77 Words Marco A.G.Pinto and Alan Beale though should be added that I
78 (Kevin Atkinson) for one reason or another didn't want to add at the
79 60 level.  The most likely reasons are that the word is too similar to
80 a more common word or a compound word that is normally spelled as two
81 words or with a hyphen.
82
83 macro.80:
84
85 Words that are Macro added to en_GB not in one of the above lists.
86
87 unix-terms:
88
89 A list of commonly used unix terms often used as regular english words
90 by geeks.
91
92 variant:
93
94 A list of words which the 12dicts package does not consider variants
95 but I do.
96
97 not-upper:
98
99 Normal words that just happen to start with an uppercase words and 
100 have no relation to a proper name, for example OK AWOL
101
102 2800-ptr:
103
104 Words from "2800 Personality Trait Descriptors" (1967), see
105 https://sourceforge.net/p/wordlist/issues/60/
106
107 neol2015.txt:
108
109 Draft version of Alan Beale's latest neologism list.  See
110 http://wordlist.aspell.net/12dicts-readme-r5/ for more details on the
111 format of the list.
112
113 neol2015.poss:
114
115 Possessive forms for words in neol2015.txt.
116
117 exclude.??:
118
119 Words to exclude up to the specified level (and hence bump them to the
120 next level.)  Used mostly for obscure words that are very similar to a
121 far more common word and hence could mask the misspelling of the more
122 common word.
123
124 hacker-exclude:
125
126 List of words found in the hacker category that are not found anywhere
127 in Google Book's corpus (1980-2008) and thus should in all likelihood
128 not be included considering "words" such as FTPing, grepped, etc. are
129 in the corpus.
130
131 prefixes:
132
133 Common prefixes that are often followed used with a dash.  For example
134 "multi-".  Note "pre" is left out as it is too close to "per" which is more
135 common.
136