]> git.donarmstrong.com Git - lilypond.git/blobdiff - lily/lexer.ll
Merge branch 'jneeman' of git+ssh://jneem@git.sv.gnu.org/srv/git/lilypond into jneeman
[lilypond.git] / lily / lexer.ll
index abd0c101de8293f12f001f706d85ae46eb4f0b52..9cb2cac0c667baae3b1f24a893ab34acaaf3032b 100644 (file)
@@ -41,8 +41,9 @@ using namespace std;
 #include "interval.hh"
 #include "lily-guile.hh"
 #include "lily-lexer.hh"
-#include "lilypond-input-version.hh"
+#include "lilypond-version.hh"
 #include "main.hh"
+#include "music.hh"
 #include "music-function.hh"
 #include "parse-scm.hh"
 #include "parser.hh"
@@ -57,21 +58,20 @@ RH 7 fix (?)
 */
 #define isatty HORRIBLEKLUDGE
 
-void strip_trailing_white (std::string&);
-void strip_leading_white (std::string&);
-std::string lyric_fudge (std::string s);
-int music_function_type (SCM);
-SCM lookup_markup_command (std::string s);
-bool is_valid_version (std::string s);
+void strip_trailing_white (string&);
+void strip_leading_white (string&);
+string lyric_fudge (string s);
+SCM lookup_markup_command (string s);
+bool is_valid_version (string s);
 
 
 #define start_quote()  \
        yy_push_state (quote);\
-       yylval.string = new std::string
+       yylval.string = new string
 
 #define start_lyric_quote()    \
        yy_push_state (lyric_quote);\
-       yylval.string = new std::string
+       yylval.string = new string
 
 #define yylval \
        (*(YYSTYPE*)lexval)
@@ -80,14 +80,9 @@ bool is_valid_version (std::string s);
        (*(YYLTYPE*)lexloc)
 
 #define YY_USER_ACTION add_lexed_char (YYLeng ());
-/*
-
-LYRICS         ({AA}|{TEX})[^0-9 \t\n\f]*
-
-*/
 
 
-SCM scan_fraction (std::string);
+SCM scan_fraction (string);
 SCM (* scm_parse_error_handler) (void *);
 
 
@@ -103,6 +98,7 @@ SCM (* scm_parse_error_handler) (void *);
 %option never-interactive 
 %option warn
 
+%x extratoken
 %x chords
 %x figures
 %x incl
@@ -112,20 +108,25 @@ SCM (* scm_parse_error_handler) (void *);
 %x markup
 %x notes
 %x quote
+%x sourcefileline
 %x sourcefilename
 %x version
 
-A              [a-zA-Z]
+A              [a-zA-Z\200-\377]
 AA             {A}|_
 N              [0-9]
 AN             {AA}|{N}
+ANY_CHAR       (.|\n)
 PUNCT          [?!:'`]
 ACCENT         \\[`'"^]
-NATIONAL       [\001-\006\021-\027\031\036\200-\377]
+NATIONAL       [\001-\006\021-\027\031\036]
 TEX            {AA}|-|{PUNCT}|{ACCENT}|{NATIONAL}
 WORD           {A}{AN}*
 DASHED_WORD            {A}({AN}|-)*
 DASHED_KEY_WORD                \\{DASHED_WORD}
+
+
+
 ALPHAWORD      {A}+
 DIGIT          {N}
 UNSIGNED       {N}+
@@ -145,6 +146,7 @@ ESCAPED             [nt\\'"]
 EXTENDER       __
 HYPHEN         --
 BOM_UTF8       \357\273\277
+
 %%
 
 
@@ -152,6 +154,22 @@ BOM_UTF8   \357\273\277
        // windows-suck-suck-suck
 }
 
+<extratoken>{ANY_CHAR} {
+  /* Generate a token without swallowing anything */
+
+  /* First unswallow the eaten character */
+  add_lexed_char (-YYLeng ());
+  yyless (0);
+
+  /* produce requested token */
+  int type = extra_token_types_.back ();
+  extra_token_types_.pop_back ();
+  if (extra_token_types_.empty ())
+    yy_pop_state ();
+
+  return type;
+}
+
 <INITIAL,chords,lyrics,figures,notes>{BOM_UTF8} {
   if (this->lexloc->line_number () != 1 || this->lexloc->column_number () != 0)
     {
@@ -179,26 +197,37 @@ BOM_UTF8  \357\273\277
   }
 }
 
+<INITIAL,notes,figures,chords,markup>{
+       \"              {
+               start_quote ();
+       }
+}
+
 <INITIAL,chords,lyrics,notes,figures>\\version{WHITE}* {
        yy_push_state (version);
 }
 <INITIAL,chords,lyrics,notes,figures>\\sourcefilename{WHITE}*  {
        yy_push_state (sourcefilename);
 }
+<INITIAL,chords,lyrics,notes,figures>\\sourcefileline{WHITE}*  {
+       yy_push_state (sourcefileline);
+}
 <version>\"[^"]*\"     { /* got the version number */
-       std::string s (YYText () + 1);
+       string s (YYText () + 1);
        s = s.substr (0, s.rfind ('\"'));
 
        yy_pop_state ();
+
+       SCM top_scope = scm_car (scm_last_pair (scopes_));
+       scm_module_define (top_scope, ly_symbol2scm ("version-seen"), SCM_BOOL_T);
+
        if (!is_valid_version (s))
                return INVALID;
 
-       SCM top_scope = scm_car (scm_last_pair (scopes_));
-       scm_module_define (top_scope, ly_symbol2scm ("version-seen?"), SCM_BOOL_T);
 
 }
 <sourcefilename>\"[^"]*\"     {
-       std::string s (YYText () + 1);
+       string s (YYText () + 1);
        s = s.substr (0, s.rfind ('\"'));
 
        yy_pop_state ();
@@ -210,6 +239,15 @@ BOM_UTF8   \357\273\277
                     scm_makfrom0str (s.c_str ()));
 
 }
+
+<sourcefileline>{INT}  {
+       int i;
+       sscanf (YYText (), "%d", &i);
+
+       yy_pop_state ();
+       this->here_input ().get_source_file ()->set_line (here_input ().start (), i);
+}
+
 <version>.     {
        LexerError (_ ("quoted string expected after \\version").c_str ());
        yy_pop_state ();
@@ -218,6 +256,10 @@ BOM_UTF8   \357\273\277
        LexerError (_ ("quoted string expected after \\sourcefilename").c_str ());
        yy_pop_state ();
 }
+<sourcefileline>.      {
+       LexerError (_ ("integer expected after \\sourcefileline").c_str ());
+       yy_pop_state ();
+}
 <longcomment>{
        [^\%]*          {
        }
@@ -250,14 +292,14 @@ BOM_UTF8  \357\273\277
        yy_push_state (incl);
 }
 <incl>\"[^"]*\"   { /* got the include file name */
-       std::string s (YYText ()+1);
+       string s (YYText ()+1);
        s = s.substr (0, s.rfind ('"'));
 
        new_input (s, sources_);
        yy_pop_state ();
 }
 <incl>\\{BLACK}*{WHITE} { /* got the include identifier */
-       std::string s = YYText () + 1;
+       string s = YYText () + 1;
        strip_trailing_white (s);
        if (s.length () && (s[s.length () - 1] == ';'))
          s = s.substr (0, s.length () - 1);
@@ -267,7 +309,7 @@ BOM_UTF8    \357\273\277
                new_input (ly_scm2string (sid), sources_);
                yy_pop_state ();
        } else { 
-           std::string msg (_f ("wrong or undefined identifier: `%s'", s ));
+           string msg (_f ("wrong or undefined identifier: `%s'", s ));
 
            LexerError (msg.c_str ());
            SCM err = scm_current_error_port ();
@@ -313,16 +355,26 @@ BOM_UTF8  \357\273\277
        }
                
        yylval.scm = sval;
-       return SCM_T;
+       return SCM_TOKEN;
 }
 <INITIAL,notes,lyrics>{ 
-       \<\<   {
+       \<\<    {
                return DOUBLE_ANGLE_OPEN;
        }
-       \>\>   {
+       \>\>    {
                return DOUBLE_ANGLE_CLOSE;
        }
 }
+
+<INITIAL,notes>{
+       \<      {
+               return ANGLE_OPEN;
+       }
+       \>      {
+               return ANGLE_CLOSE;
+       }
+}
+
 <figures>{
        _       {
                return FIGURE_SPACE;
@@ -349,26 +401,20 @@ BOM_UTF8  \357\273\277
        }
 
        {DIGIT}         {
-               yylval.i = String_convert::dec2int (std::string (YYText ()));
+               yylval.i = String_convert::dec2int (string (YYText ()));
                return DIGIT;
        }
        {UNSIGNED}              {
-               yylval.i = String_convert::dec2int (std::string (YYText ()));
+               yylval.i = String_convert::dec2int (string (YYText ()));
                return UNSIGNED;
        }
        {E_UNSIGNED}    {
-               yylval.i = String_convert::dec2int (std::string (YYText () +1));
+               yylval.i = String_convert::dec2int (string (YYText () +1));
                return E_UNSIGNED;
        }
-       \" {
-               start_quote ();
-       }
 }
 
-\"             {
-       start_quote ();
-}
-<quote>{
+<quote,lyric_quote>{
        \\{ESCAPED}     {
                *yylval.string += to_string (escaped_char (YYText ()[1]));
        }
@@ -380,31 +426,10 @@ BOM_UTF8  \357\273\277
                yy_pop_state ();
 
                /* yylval is union. Must remember STRING before setting SCM*/
-               std::string *sp = yylval.string;
+               string *sp = yylval.string;
                yylval.scm = scm_makfrom0str (sp->c_str ());
                delete sp;
-               return STRING;
-       }
-       .       {
-               *yylval.string += YYText ();
-       }
-}
-<lyric_quote>{
-       \\{ESCAPED}     {
-               *yylval.string += to_string (escaped_char (YYText ()[1]));
-       }
-       [^\\"]+ {
-               *yylval.string += YYText ();
-       }
-       \"      {
-
-               yy_pop_state ();
-
-               /* yylval is union. Must remember STRING before setting SCM*/
-               std::string *sp = yylval.string;
-               yylval.scm = scm_makfrom0str (sp->c_str ());
-               delete sp;
-               return LYRICS_STRING;
+               return is_lyric_state () ? LYRICS_STRING : STRING;
        }
        .       {
                *yylval.string += YYText ();
@@ -420,7 +445,7 @@ BOM_UTF8    \357\273\277
                return FRACTION;
        }
        {UNSIGNED}              {
-               yylval.i = String_convert::dec2int (std::string (YYText ()));
+               yylval.i = String_convert::dec2int (string (YYText ()));
                return UNSIGNED;
        }
        {NOTECOMMAND}   {
@@ -428,7 +453,7 @@ BOM_UTF8    \357\273\277
        }
        {LYRICS} {
                /* ugr. This sux. */
-               std::string s (YYText ()); 
+               string s (YYText ()); 
                if (s == "__")
                        return yylval.i = EXTENDER;
                if (s == "--")
@@ -460,12 +485,9 @@ BOM_UTF8   \357\273\277
                return FRACTION;
        }
        {UNSIGNED}              {
-               yylval.i = String_convert::dec2int (std::string (YYText ()));
+               yylval.i = String_convert::dec2int (string (YYText ()));
                return UNSIGNED;
        }
-       \" {
-               start_quote ();
-       }
        -  {
                return CHORD_MINUS;
        }
@@ -488,14 +510,11 @@ BOM_UTF8  \357\273\277
 
 
 <markup>{
-       \" {
-               start_quote ();
-       }
        \\score {
                return SCORE;
        }
        {MARKUPCOMMAND} {
-               std::string str (YYText () + 1);
+               string str (YYText () + 1);
                SCM s = lookup_markup_command (str);
 
                if (scm_is_pair (s) && scm_is_symbol (scm_cdr (s)) ) {
@@ -531,7 +550,7 @@ BOM_UTF8    \357\273\277
                return YYText ()[0];
        }
        [^#{}"\\ \t\n\r\f]+ {
-               std::string s (YYText ()); 
+               string s (YYText ()); 
 
                char c = s[s.length () - 1];
                /* brace open is for not confusing dumb tools.  */
@@ -548,7 +567,7 @@ BOM_UTF8    \357\273\277
        }
 }
 
-<<EOF>> {
+<*><<EOF>> {
        if (is_main_input_)
        {
                is_main_input_ = false;
@@ -587,7 +606,7 @@ BOM_UTF8    \357\273\277
 }
 
 {UNSIGNED}     {
-       yylval.i = String_convert::dec2int (std::string (YYText ()));
+       yylval.i = String_convert::dec2int (string (YYText ()));
        return UNSIGNED;
 }
 
@@ -637,13 +656,27 @@ BOM_UTF8  \357\273\277
 }
 
 <*>.           {
-       std::string msg = _f ("invalid character: `%c'", YYText ()[0]);
+       string msg = _f ("invalid character: `%c'", YYText ()[0]);
        LexerError (msg.c_str ());
        return YYText ()[0];
 }
 
 %%
 
+/* Make the lexer generate a token of the given type as the next token. 
+ TODO: make it possible to define a value for the token as well */
+void
+Lily_lexer::push_extra_token (int token_type)
+{
+       if (extra_token_types_.empty ())
+       {
+               if (YY_START != extratoken)
+                       hidden_state_ = YY_START;
+               yy_push_state (extratoken);
+       }
+       extra_token_types_.push_back (token_type);
+}
+
 void
 Lily_lexer::push_chord_state (SCM tab)
 {
@@ -687,6 +720,7 @@ Lily_lexer::pop_state ()
 {
        if (YYSTATE == notes || YYSTATE == chords)
                pitchname_tab_stack_ = scm_cdr (pitchname_tab_stack_);
+
        yy_pop_state ();
 }
 
@@ -699,7 +733,7 @@ Lily_lexer::identifier_type (SCM sid)
 
 
 int
-Lily_lexer::scan_escaped_word (std::string str)
+Lily_lexer::scan_escaped_word (string str)
 {
        // use more SCM for this.
 
@@ -715,7 +749,20 @@ Lily_lexer::scan_escaped_word (std::string str)
        if (is_music_function (sid))
        {
                yylval.scm = get_music_function_transform (sid);
-               return music_function_type (yylval.scm);
+
+               SCM s = scm_object_property (yylval.scm, ly_symbol2scm ("music-function-signature"));
+               push_extra_token (EXPECT_NO_MORE_ARGS);
+               for (; scm_is_pair (s); s = scm_cdr (s))
+               {
+                       if (scm_car (s) == ly_music_p_proc)
+                               push_extra_token (EXPECT_MUSIC);
+                       else if (scm_car (s) == ly_lily_module_constant ("markup?"))
+                               push_extra_token (EXPECT_MARKUP);
+                       else if (ly_is_procedure (scm_car (s)))
+                               push_extra_token (EXPECT_SCM);
+                       else programming_error ("Function parameter without type-checking predicate");
+               }
+               return MUSIC_FUNCTION;
        }
 
        if (sid != SCM_UNDEFINED)
@@ -724,7 +771,7 @@ Lily_lexer::scan_escaped_word (std::string str)
                return identifier_type (sid);
        }
 
-       std::string msg (_f ("unknown escaped string: `\\%s'", str));   
+       string msg (_f ("unknown escaped string: `\\%s'", str));        
        LexerError (msg.c_str ());
 
        yylval.scm = scm_makfrom0str (str.c_str ());
@@ -733,7 +780,7 @@ Lily_lexer::scan_escaped_word (std::string str)
 }
 
 int
-Lily_lexer::scan_bare_word (std::string str)
+Lily_lexer::scan_bare_word (string str)
 {
        SCM sym = ly_symbol2scm (str.c_str ());
        if ((YYSTATE == notes) || (YYSTATE == chords)) {
@@ -759,36 +806,45 @@ Lily_lexer::scan_bare_word (std::string str)
        return STRING;
 }
 
+int
+Lily_lexer::get_state () const
+{
+       if (YY_START == extratoken)
+               return hidden_state_;
+       else
+               return YY_START;
+}
+
 bool
 Lily_lexer::is_note_state () const
 {
-       return YY_START == notes;
+       return get_state () == notes;
 }
 
 bool
 Lily_lexer::is_chord_state () const
 {
-       return YY_START == chords;
+       return get_state () == chords;
 }
 
 bool
 Lily_lexer::is_lyric_state () const
 {
-       return YY_START == lyrics;
+       return get_state () == lyrics;
 }
 
 bool
 Lily_lexer::is_figure_state () const
 {
-       return YY_START == figures;
+       return get_state () == figures;
 }
 
 /*
- urg, belong to std::string (_convert)
+ urg, belong to string (_convert)
  and should be generalised 
  */
 void
-strip_leading_white (std::string&s)
+strip_leading_white (string&s)
 {
        ssize i = 0;
        for (;  i < s.length (); i++)
@@ -799,7 +855,7 @@ strip_leading_white (std::string&s)
 }
 
 void
-strip_trailing_white (std::string&s)
+strip_trailing_white (string&s)
 {
        ssize i = s.length ();  
        while (i--) 
@@ -811,21 +867,26 @@ strip_trailing_white (std::string&s)
 
 
 
-/* 2.1.2x something -> \property -> \set. */ 
-Lilypond_version oldest_version ("2.3.22");
+Lilypond_version oldest_version ("2.7.38");
 
 
 bool
-is_valid_version (std::string s)
+is_valid_version (string s)
 {
   Lilypond_version current ( MAJOR_VERSION "." MINOR_VERSION "." PATCH_LEVEL );
   Lilypond_version ver (s);
-  if (! ((ver >= oldest_version) && (ver <= current)))
+  if (int (ver) < oldest_version)
        {       
-               non_fatal_error (_f ("Incorrect lilypond version: %s (%s, %s)", ver.to_string (), oldest_version.to_string (), current.to_string ()));
-               non_fatal_error (_ ("Consider updating the input with the convert-ly script")); 
+               non_fatal_error (_f ("file too old: %s (oldest supported: %s)", ver.to_string (), oldest_version.to_string ()));
+               non_fatal_error (_ ("consider updating the input with the convert-ly script"));
                return false;
-    }
+       }
+
+  if (ver > current)
+       {
+               non_fatal_error (_f ("program too old: %s (file requires: %s)",  current.to_string (), ver.to_string ()));
+               return false;
+       }
   return true;
 }
        
@@ -833,8 +894,8 @@ is_valid_version (std::string s)
 /*
   substitute _ and \,
 */
-std::string
-lyric_fudge (std::string s)
+string
+lyric_fudge (string s)
 {
   char *chars = string_copy (s);
 
@@ -844,7 +905,7 @@ lyric_fudge (std::string s)
        *p = ' ';
     }
   
-  s = std::string (chars);
+  s = string (chars);
   delete[] chars;
 
   ssize i = 0; 
@@ -861,11 +922,11 @@ lyric_fudge (std::string s)
 Convert "NUM/DEN" into a '(NUM . DEN) cons.
 */
 SCM
-scan_fraction (std::string frac)
+scan_fraction (string frac)
 {
        ssize i = frac.find ('/');
-       std::string left = frac.substr (0, i);
-       std::string right = frac.substr (i + 1, (frac.length () - i + 1));
+       string left = frac.substr (0, i);
+       string right = frac.substr (i + 1, (frac.length () - i + 1));
 
        int n = String_convert::dec2int (left);
        int d = String_convert::dec2int (right);
@@ -873,82 +934,12 @@ scan_fraction (std::string frac)
 }
 
 SCM
-lookup_markup_command (std::string s)
+lookup_markup_command (string s)
 {
        SCM proc = ly_lily_module_constant ("lookup-markup-command");
        return scm_call_1 (proc, scm_makfrom0str (s.c_str ()));
 }
 
-
-int
-music_function_type (SCM func)
-{
-       SCM type = scm_object_property (func, ly_symbol2scm ("music-function-signature-keyword"));
-       if (type == ly_symbol2scm ("scm"))
-       {
-               return MUSIC_FUNCTION_SCM;
-       }
-       else if (type == ly_symbol2scm ("music"))
-       {
-               return MUSIC_FUNCTION_MUSIC;
-       }
-       else if (type == ly_symbol2scm ("scm-music"))
-       {
-               return MUSIC_FUNCTION_SCM_MUSIC;
-       }
-       else if (type == ly_symbol2scm ("scm-scm"))
-       {
-               return MUSIC_FUNCTION_SCM_SCM;
-       }
-       else if (type == ly_symbol2scm ("music-music"))
-       {
-               return MUSIC_FUNCTION_MUSIC_MUSIC;
-       }
-       else if (type == ly_symbol2scm ("scm-music-music"))
-       {
-               return MUSIC_FUNCTION_SCM_MUSIC_MUSIC;
-       }
-       else if (type == ly_symbol2scm ("scm-scm-music"))
-       {
-               return MUSIC_FUNCTION_SCM_SCM_MUSIC;
-       }
-       else if (type == ly_symbol2scm ("scm-scm-scm"))
-       {
-               return MUSIC_FUNCTION_SCM_SCM_SCM;
-       }
-       else if (type == ly_symbol2scm ("markup"))
-       {
-               return MUSIC_FUNCTION_MARKUP;
-       }
-       else if (type == ly_symbol2scm ("markup-music"))
-       {
-               return MUSIC_FUNCTION_MARKUP_MUSIC;
-       }
-       else if (type == ly_symbol2scm ("markup-markup"))
-       {
-               return MUSIC_FUNCTION_MARKUP_MARKUP;
-       }
-       else if (type == ly_symbol2scm ("markup-music-music"))
-       {
-               return MUSIC_FUNCTION_MARKUP_MUSIC_MUSIC;
-       }
-       else if (type == ly_symbol2scm ("markup-markup-music"))
-       {
-               return MUSIC_FUNCTION_MARKUP_MARKUP_MUSIC;
-       }
-       else if (type == ly_symbol2scm ("noarg"))
-       {
-               return MUSIC_FUNCTION;
-       }
-       else
-               {
-               /* TODO: print location */
-               error (_ ("can't find signature for music function"));
-               }
-
-       return MUSIC_FUNCTION_SCM;
-}
-
 /* Shut up lexer warnings.  */
 #if YY_STACK_USED