From c0f9012bed2e0646d15d454cffb971f4b7368edf Mon Sep 17 00:00:00 2001
From: Andrew Kelley <superjoe30@gmail.com>
Date: Fri, 16 Jun 2017 14:34:38 -0400
Subject: parseh: fix not recognizing integer suffixes on hex numbers

---
 src/c_tokenizer.cpp | 159 +++++++++++++++++++++++++++++++---------------------
 1 file changed, 96 insertions(+), 63 deletions(-)

(limited to 'src/c_tokenizer.cpp')

diff --git a/src/c_tokenizer.cpp b/src/c_tokenizer.cpp
index 3532e7db91..920bcacf90 100644
--- a/src/c_tokenizer.cpp
+++ b/src/c_tokenizer.cpp
@@ -107,8 +107,11 @@ static void begin_token(CTokenize *ctok, CTokId id) {
             memset(&ctok->cur_tok->data.symbol, 0, sizeof(Buf));
             buf_resize(&ctok->cur_tok->data.symbol, 0);
             break;
-        case CTokIdCharLit:
         case CTokIdNumLitInt:
+            ctok->cur_tok->data.num_lit_int.x = 0;
+            ctok->cur_tok->data.num_lit_int.suffix = CNumLitSuffixNone;
+            break;
+        case CTokIdCharLit:
         case CTokIdNumLitFloat:
         case CTokIdMinus:
             break;
@@ -138,9 +141,9 @@ static void add_char(CTokenize *ctok, uint8_t c) {
 
 static void hex_digit(CTokenize *ctok, uint8_t value) {
     // TODO @mul_with_overflow
-    ctok->cur_tok->data.num_lit_int *= 16;
+    ctok->cur_tok->data.num_lit_int.x *= 16;
     // TODO @add_with_overflow
-    ctok->cur_tok->data.num_lit_int += value;
+    ctok->cur_tok->data.num_lit_int.x += value;
 
     static const uint8_t hex_digit[] = "0123456789abcdef";
     buf_append_char(&ctok->buf, hex_digit[value]);
@@ -194,19 +197,15 @@ void tokenize_c_macro(CTokenize *ctok, const uint8_t *c) {
                         break;
                     case DIGIT_NON_ZERO:
                         ctok->state = CTokStateDecimal;
-                        ctok->unsigned_suffix = false;
-                        ctok->long_suffix = false;
                         begin_token(ctok, CTokIdNumLitInt);
-                        ctok->cur_tok->data.num_lit_int = *c - '0';
+                        ctok->cur_tok->data.num_lit_int.x = *c - '0';
                         buf_resize(&ctok->buf, 0);
                         buf_append_char(&ctok->buf, *c);
                         break;
                     case '0':
                         ctok->state = CTokStateGotZero;
-                        ctok->unsigned_suffix = false;
-                        ctok->long_suffix = false;
                         begin_token(ctok, CTokIdNumLitInt);
-                        ctok->cur_tok->data.num_lit_int = 0;
+                        ctok->cur_tok->data.num_lit_int.x = 0;
                         buf_resize(&ctok->buf, 0);
                         buf_append_char(&ctok->buf, '0');
                         break;
@@ -289,21 +288,21 @@ void tokenize_c_macro(CTokenize *ctok, const uint8_t *c) {
                         buf_append_char(&ctok->buf, *c);
 
                         // TODO @mul_with_overflow
-                        ctok->cur_tok->data.num_lit_int *= 10;
+                        ctok->cur_tok->data.num_lit_int.x *= 10;
                         // TODO @add_with_overflow
-                        ctok->cur_tok->data.num_lit_int += *c - '0';
+                        ctok->cur_tok->data.num_lit_int.x += *c - '0';
                         break;
                     case '\'':
                         break;
                     case 'u':
                     case 'U':
-                        ctok->unsigned_suffix = true;
-                        ctok->state = CTokStateIntSuffix;
+                        ctok->state = CTokStateNumLitIntSuffixU;
+                        ctok->cur_tok->data.num_lit_int.suffix = CNumLitSuffixU;
                         break;
                     case 'l':
                     case 'L':
-                        ctok->long_suffix = true;
-                        ctok->state = CTokStateIntSuffixLong;
+                        ctok->state = CTokStateNumLitIntSuffixL;
+                        ctok->cur_tok->data.num_lit_int.suffix = CNumLitSuffixL;
                         break;
                     case '.':
                         buf_append_char(&ctok->buf, '.');
@@ -317,50 +316,6 @@ void tokenize_c_macro(CTokenize *ctok, const uint8_t *c) {
                         continue;
                 }
                 break;
-            case CTokStateIntSuffix:
-                switch (*c) {
-                    case 'l':
-                    case 'L':
-                        if (ctok->long_suffix) {
-                            return mark_error(ctok);
-                        }
-                        ctok->long_suffix = true;
-                        ctok->state = CTokStateIntSuffixLong;
-                        break;
-                    case 'u':
-                    case 'U':
-                        if (ctok->unsigned_suffix) {
-                            return mark_error(ctok);
-                        }
-                        ctok->unsigned_suffix = true;
-                        break;
-                    default:
-                        c -= 1;
-                        end_token(ctok);
-                        ctok->state = CTokStateStart;
-                        continue;
-                }
-                break;
-            case CTokStateIntSuffixLong:
-                switch (*c) {
-                    case 'l':
-                    case 'L':
-                        ctok->state = CTokStateIntSuffix;
-                        break;
-                    case 'u':
-                    case 'U':
-                        if (ctok->unsigned_suffix) {
-                            return mark_error(ctok);
-                        }
-                        ctok->unsigned_suffix = true;
-                        break;
-                    default:
-                        c -= 1;
-                        end_token(ctok);
-                        ctok->state = CTokStateStart;
-                        continue;
-                }
-                break;
             case CTokStateGotZero:
                 switch (*c) {
                     case 'x':
@@ -389,9 +344,9 @@ void tokenize_c_macro(CTokenize *ctok, const uint8_t *c) {
                     case '6':
                     case '7':
                         // TODO @mul_with_overflow
-                        ctok->cur_tok->data.num_lit_int *= 8;
+                        ctok->cur_tok->data.num_lit_int.x *= 8;
                         // TODO @add_with_overflow
-                        ctok->cur_tok->data.num_lit_int += *c - '0';
+                        ctok->cur_tok->data.num_lit_int.x += *c - '0';
                         break;
                     case '8':
                     case '9':
@@ -466,6 +421,82 @@ void tokenize_c_macro(CTokenize *ctok, const uint8_t *c) {
                         ctok->cur_tok->id = CTokIdNumLitFloat;
                         ctok->state = CTokStateExpSign;
                         break;
+                    case 'u':
+                    case 'U':
+                        // marks the number literal as unsigned
+                        ctok->state = CTokStateNumLitIntSuffixU;
+                        ctok->cur_tok->data.num_lit_int.suffix = CNumLitSuffixU;
+                        break;
+                    case 'l':
+                    case 'L':
+                        // marks the number literal as long
+                        ctok->state = CTokStateNumLitIntSuffixL;
+                        ctok->cur_tok->data.num_lit_int.suffix = CNumLitSuffixL;
+                        break;
+                    default:
+                        c -= 1;
+                        end_token(ctok);
+                        ctok->state = CTokStateStart;
+                        continue;
+                }
+                break;
+            case CTokStateNumLitIntSuffixU:
+                switch (*c) {
+                    case 'l':
+                    case 'L':
+                        ctok->cur_tok->data.num_lit_int.suffix = CNumLitSuffixLU;
+                        ctok->state = CTokStateNumLitIntSuffixUL;
+                        break;
+                    default:
+                        c -= 1;
+                        end_token(ctok);
+                        ctok->state = CTokStateStart;
+                        continue;
+                }
+                break;
+            case CTokStateNumLitIntSuffixL:
+                switch (*c) {
+                    case 'l':
+                    case 'L':
+                        ctok->cur_tok->data.num_lit_int.suffix = CNumLitSuffixLL;
+                        ctok->state = CTokStateNumLitIntSuffixLL;
+                        break;
+                    case 'u':
+                    case 'U':
+                        ctok->cur_tok->data.num_lit_int.suffix = CNumLitSuffixLU;
+                        end_token(ctok);
+                        ctok->state = CTokStateStart;
+                        break;
+                    default:
+                        c -= 1;
+                        end_token(ctok);
+                        ctok->state = CTokStateStart;
+                        continue;
+                }
+                break;
+            case CTokStateNumLitIntSuffixLL:
+                switch (*c) {
+                    case 'u':
+                    case 'U':
+                        ctok->cur_tok->data.num_lit_int.suffix = CNumLitSuffixLLU;
+                        end_token(ctok);
+                        ctok->state = CTokStateStart;
+                        break;
+                    default:
+                        c -= 1;
+                        end_token(ctok);
+                        ctok->state = CTokStateStart;
+                        continue;
+                }
+                break;
+            case CTokStateNumLitIntSuffixUL:
+                switch (*c) {
+                    case 'l':
+                    case 'L':
+                        ctok->cur_tok->data.num_lit_int.suffix = CNumLitSuffixLLU;
+                        end_token(ctok);
+                        ctok->state = CTokStateStart;
+                        break;
                     default:
                         c -= 1;
                         end_token(ctok);
@@ -681,8 +712,10 @@ found_end_of_macro:
         case CTokStateHex:
         case CTokStateOctal:
         case CTokStateGotZero:
-        case CTokStateIntSuffix:
-        case CTokStateIntSuffixLong:
+        case CTokStateNumLitIntSuffixU:
+        case CTokStateNumLitIntSuffixL:
+        case CTokStateNumLitIntSuffixUL:
+        case CTokStateNumLitIntSuffixLL:
             end_token(ctok);
             break;
         case CTokStateFloat:
-- 
cgit v1.2.3