]> git.donarmstrong.com Git - lilypond.git/blob - lily/source-file.cc
Nitpick run.
[lilypond.git] / lily / source-file.cc
1 /*
2   source-file.cc -- implement Source_file
3
4   source file of the GNU LilyPond music typesetter
5
6   (c) 1997--2005 Jan Nieuwenhuizen <janneke@gnu.org>
7   Han-Wen Nienhuys <hanwen@cs.uu.nl>
8 */
9
10 #include "source-file.hh"
11
12 #include "config.hh"
13
14 #if HAVE_UTF8_WCHAR_H
15 #include <utf8/wchar.h>  /* mbrtowc */
16 #else
17 #include <wchar.h> /* mbrtowc */
18 #endif
19
20 #include <cstdio>
21
22 #if HAVE_SSTREAM
23 #include <sstream>
24 #else
25 #include <strstream>
26 #define istringstream(x) istrstream (x, length ())
27 #endif
28
29 #include "warn.hh"
30 #include "file-name-map.hh"
31
32 void
33 Source_file::load_stdin ()
34 {
35   length_ = 0;
36
37   int c;
38   Array<char> chs;              // ugh.
39   while ((c = fgetc (stdin)) != EOF)
40     chs.push (c);
41
42   chs.push (0);
43   length_ = chs.size ();
44   contents_str0_ = chs.remove_array ();
45 }
46
47 char *
48 gulp_file (String filename, int *filesize)
49 {
50   /* "b" must ensure to open literally, avoiding text (CR/LF)
51      conversions.  */
52   FILE *f = fopen (filename.to_str0 (), "rb");
53   if (!f)
54     {
55       warning (_f ("can't open file: `%s'", filename.to_str0 ()));
56       return 0;
57     }
58
59   fseek (f, 0, SEEK_END);
60   *filesize = ftell (f);
61   rewind (f);
62
63   char *str = new char[*filesize + 1];
64   str[*filesize] = 0;
65
66   int bytes_read = fread (str, sizeof (char), *filesize, f);
67   if (bytes_read != *filesize)
68     warning (_f ("expected to read %d characters, got %d", bytes_read,
69                  *filesize));
70   fclose (f);
71
72   return str;
73 }
74
75 Source_file::Source_file (String filename, String data)
76 {
77   name_ = filename;
78   istream_ = 0;
79   contents_str0_ = data.get_copy_str0 ();
80   length_ = data.length ();
81   pos_str0_ = to_str0 ();
82   init_port ();
83
84   for (int i = 0; i < length_; i++)
85     if (contents_str0_[i] == '\n')
86       newline_locations_.push (contents_str0_ + i);
87 }
88
89 Source_file::Source_file (String filename_string)
90 {
91   name_ = filename_string;
92   istream_ = 0;
93   contents_str0_ = 0;
94
95   if (filename_string == "-")
96     load_stdin ();
97   else
98     contents_str0_ = gulp_file (filename_string, &length_);
99
100   pos_str0_ = to_str0 ();
101
102   init_port ();
103
104   for (int i = 0; i < length_; i++)
105     if (contents_str0_[i] == '\n')
106       newline_locations_.push (contents_str0_ + i);
107 }
108
109 void
110 Source_file::init_port ()
111 {
112   SCM str = scm_makfrom0str (contents_str0_);
113   str_port_ = scm_mkstrport (SCM_INUM0, str, SCM_OPN | SCM_RDNG, __FUNCTION__);
114   scm_set_port_filename_x (str_port_, scm_makfrom0str (name_.get_str0 ()));
115 }
116
117 int
118 Source_file::tell () const
119 {
120   return pos_str0_ - contents_str0_;
121 }
122
123 std::istream *
124 Source_file::get_istream ()
125 {
126   if (!istream_)
127     {
128       if (length ()) // can-t this be done without such a hack?
129         istream_ = new std::istringstream (to_str0 ());
130       else
131         {
132           istream_ = new std::istringstream ("");
133           istream_->setstate (std::ios::eofbit);
134           //      istream_->set (ios::eofbit);
135         }
136     }
137   return istream_;
138 }
139
140 String
141 Source_file::file_line_column_string (char const *context_str0) const
142 {
143   if (!to_str0 ())
144     return " (" + _ ("position unknown") + ")";
145   else
146     {
147       int l, ch, col;
148       get_counts (context_str0, &l, &ch, &col);
149
150       return name_string () + ":" + to_string (l)
151         + ":" + to_string (col);
152     }
153 }
154
155 String
156 Source_file::quote_input (char const *pos_str0) const
157 {
158   if (!contains (pos_str0))
159     return " (" + _ ("position unknown") + ")";
160
161   int l, ch, col;
162   get_counts (pos_str0, &l, &ch, &col);
163   String line = line_string (pos_str0);
164   String context = line.left_string (ch)
165     + to_string ('\n')
166     + to_string (' ', col)
167     + line.cut_string (ch, INT_MAX);
168   return context;
169 }
170
171 String
172 Source_file::name_string () const
173 {
174   return map_file_name (name_);
175 }
176
177 Source_file::~Source_file ()
178 {
179   delete istream_;
180   istream_ = 0;
181   delete[] contents_str0_;
182 }
183
184 Slice
185 Source_file::line_slice (char const *pos_str0) const
186 {
187   if (!contains (pos_str0))
188     return Slice (0, 0);
189
190   char const *data_str0 = to_str0 ();
191   char const *eof_C_ = data_str0 + length ();
192
193   if (pos_str0 == eof_C_)
194     pos_str0--;
195   char const *begin_str0 = pos_str0;
196   while (begin_str0 > data_str0)
197     if (*--begin_str0 == '\n')
198       {
199         begin_str0++;
200         break;
201       }
202
203   char const *end_str0 = pos_str0;
204   while (end_str0 < eof_C_)
205     if (*end_str0++ == '\n')
206       {
207         end_str0--;
208         break;
209       }
210
211   return Slice (begin_str0 - data_str0, end_str0 - data_str0);
212 }
213
214 String
215 Source_file::line_string (char const *pos_str0) const
216 {
217   if (!contains (pos_str0))
218     return "";
219
220   Slice line = line_slice (pos_str0);
221   char const *data_str0 = to_str0 ();
222   return String ((Byte const *)data_str0 + line[LEFT], line.length ());
223 }
224
225 void
226 Source_file::get_counts (char const *pos_str0,
227                          int *line_number,
228                          int *line_char,
229                          int *column) const
230 {
231   if (!contains (pos_str0))
232     return;
233
234   *line_number = get_line (pos_str0);
235
236   Slice line = line_slice (pos_str0);
237   char const *data = to_str0 ();
238   Byte const *line_start = (Byte const *)data + line[LEFT];
239
240   int left = (Byte const *) pos_str0 - line_start;
241   String line_begin (line_start, left);
242   char const *line_chars = line_begin.to_str0 ();
243
244   *column = 0;
245   *line_char = 0;
246
247   mbstate_t state;
248
249   /* Initialize the state.  */
250   memset (&state, '\0', sizeof (state));
251
252   while (left > 0)
253     {
254       wchar_t multibyte[2];
255
256       /*
257         FIXME, this is apparently locale dependent.
258       */
259       size_t thislen = mbrtowc (multibyte, line_chars, left, &state);
260
261       /* Stop converting at invalid character;
262          this can mean we have read just the first part
263          of a valid character.  */
264       if (thislen == (size_t) -1)
265         break;
266
267       /* We want to handle embedded NUL bytes
268          but the return value is 0.  Correct this.  */
269       if (thislen == 0)
270         thislen = 1;
271
272       if (thislen == 1 && line_chars[0] == '\t')
273         (*column) = (*column / 8 + 1) * 8;
274       else
275         (*column)++;
276
277       (*line_char)++;
278       /* Advance past this character. */
279       line_chars += thislen;
280       left -= thislen;
281     }
282 }
283
284 bool
285 Source_file::contains (char const *pos_str0) const
286 {
287   return (pos_str0 && (pos_str0 >= to_str0 ()) && (pos_str0 <= to_str0 () + length ()));
288 }
289
290 int
291 Source_file::get_line (char const *pos_str0) const
292 {
293   if (!contains (pos_str0))
294     return 0;
295
296   if (!newline_locations_.size ())
297     return 1;
298
299   int lo = 0;
300   int hi = newline_locations_.size ();
301
302   if (newline_locations_[lo] > pos_str0)
303     return 1;
304
305   if (newline_locations_[hi - 1] < pos_str0)
306     return hi;
307
308   binary_search_bounds (newline_locations_,
309                         pos_str0,
310                         Link_array<char>::default_compare,
311                         &lo, &hi);
312
313   if (*pos_str0 == '\n')
314     lo--;
315   return lo + 2;
316 }
317
318 int
319 Source_file::length () const
320 {
321   return length_;
322 }
323
324 char const *
325 Source_file::to_str0 () const
326 {
327   return contents_str0_;
328 }
329
330 void
331 Source_file::set_pos (char const *pos_str0)
332 {
333   if (contains (pos_str0))
334     pos_str0_ = pos_str0;
335   else
336     error (quote_input (pos_str0) + "invalid pos");
337 }
338
339 char const *
340 Source_file::seek_str0 (int n)
341 {
342   char const *new_str0 = to_str0 () + n;
343   if (n < 0)
344     new_str0 += length ();
345   if (contains (new_str0))
346     pos_str0_ = new_str0;
347   else
348     error (quote_input (new_str0) + "seek past eof");
349
350   return pos_str0_;
351 }
352
353 char const *
354 Source_file::forward_str0 (int n)
355 {
356   char const *old_pos = pos_str0_;
357   char const *new_str0 = pos_str0_ + n;
358   if (contains (new_str0))
359     pos_str0_ = new_str0;
360   else
361     error (quote_input (new_str0) + "forward past eof");
362
363   return old_pos;
364 }
365
366 String
367 Source_file::get_string (int n)
368 {
369   String str = String ((Byte const *)forward_str0 (n), n);
370   return str;
371 }
372
373 SCM
374 Source_file::get_port () const
375 {
376   return str_port_;
377 }