ast2firm: Factorise code to convert a value to its storage type.
[cparser] / token.c
1 /*
2  * This file is part of cparser.
3  * Copyright (C) 2007-2009 Matthias Braun <matze@braunis.de>
4  *
5  * This program is free software; you can redistribute it and/or
6  * modify it under the terms of the GNU General Public License
7  * as published by the Free Software Foundation; either version 2
8  * of the License, or (at your option) any later version.
9  *
10  * This program is distributed in the hope that it will be useful,
11  * but WITHOUT ANY WARRANTY; without even the implied warranty of
12  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
13  * GNU General Public License for more details.
14  *
15  * You should have received a copy of the GNU General Public License
16  * along with this program; if not, write to the Free Software
17  * Foundation, Inc., 59 Temple Place - Suite 330, Boston, MA
18  * 02111-1307, USA.
19  */
20 #include <config.h>
21
22 #include "token_t.h"
23 #include "symbol_t.h"
24
25 #include <assert.h>
26 #include <stdio.h>
27 #include <stdbool.h>
28
29 #include "symbol.h"
30 #include "lang_features.h"
31 #include "adt/array.h"
32 #include "adt/error.h"
33 #include "adt/util.h"
34
35 symbol_t *token_symbols[T_LAST_TOKEN];
36
37 const position_t builtin_position = { "<built-in>", 0, 0, true };
38
39 static token_kind_t last_id;
40
41 static symbol_t *intern_register_token(token_kind_t id, const char *string)
42 {
43         assert(id < T_LAST_TOKEN);
44         symbol_t *symbol = symbol_table_insert(string);
45         if (token_symbols[id] == NULL)
46                 token_symbols[id] = symbol;
47         return symbol;
48 }
49
50 static void register_token(unsigned mode, token_kind_t id, const char *string)
51 {
52         if (id > 255) {
53                 assert(id >= last_id);
54                 last_id = id;
55         }
56         if (c_mode & mode) {
57                 symbol_t *symbol = intern_register_token(id, string);
58                 symbol->ID = id;
59         }
60 }
61
62 static void register_pp_token(pp_token_kind_t const id, char const *const string)
63 {
64         assert(id < TP_LAST_TOKEN);
65         symbol_t *const symbol = symbol_table_insert(string);
66         symbol->pp_ID = id;
67 }
68
69 void init_tokens(void)
70 {
71         static bool tokens_initialized = false;
72         if (tokens_initialized)
73                 return;
74         tokens_initialized = true;
75
76         memset(token_symbols, 0, T_LAST_TOKEN * sizeof(token_symbols[0]));
77
78 #define T(mode,x,str,val)  register_token(mode, x, str);
79 #include "tokens.inc"
80 #undef T
81
82 #define T(token) register_pp_token(TP_##token, #token);
83 #include "tokens_preprocessor.inc"
84 #undef T
85 }
86
87 void exit_tokens(void)
88 {
89 }
90
91 void print_token_kind(FILE *f, token_kind_t token_kind)
92 {
93         if (token_kind >= lengthof(token_symbols)) {
94                 fputs("invalid token", f);
95                 return;
96         }
97
98         fputs(token_symbols[token_kind]->string, f);
99 }
100
101 char const *get_string_encoding_prefix(string_encoding_t const enc)
102 {
103         switch (enc) {
104         case STRING_ENCODING_CHAR:   return "";
105         case STRING_ENCODING_CHAR16: return "u";
106         case STRING_ENCODING_CHAR32: return "U";
107         case STRING_ENCODING_UTF8:   return "u8";
108         case STRING_ENCODING_WIDE:   return "L";
109         }
110         panic("invalid string encoding");
111 }
112
113 void print_token(FILE *f, const token_t *token)
114 {
115         char        delim = '\'';
116         char const *enc   = "";
117         char const *val;
118         switch (token->kind) {
119         case T_IDENTIFIER:
120         case T_MACRO_PARAMETER:
121         case T_UNKNOWN_CHAR:
122                 val = token->base.symbol->string;
123                 break;
124
125         case T_STRING_LITERAL:
126                 delim = '"';
127                 /* FALLTHROUGH */
128         case T_CHARACTER_CONSTANT:
129                 enc = get_string_encoding_prefix(token->literal.string.encoding);
130                 /* FALLTHROUGH */
131         case T_NUMBER:
132                 val = token->literal.string.begin;
133                 break;
134
135         default: {
136                 char const *kind  = (token->base.symbol ? token->base.symbol : token_symbols[token->kind])->string;
137                 fprintf(f, "'%s'", kind);
138                 return;
139         }
140         }
141         fprintf(f, "%s %s%c%s%c", token_symbols[token->kind]->string, enc, delim, val, delim);
142 }
143
144 bool tokens_would_paste(token_kind_t token1, token_kind_t token2)
145 {
146         char const c = token_symbols[token2]->string[0];
147
148         switch (token1) {
149         case '>': return c == '>' || c == '=';
150         case '<': return c == '<' || c == '=' || c == '%' || c == ':';
151         case '+': return c == '+' || c == '=';
152         case '-': return c == '-' || c == '>';
153         case '/': return c == '/' || c == '=' || c == '*';
154         case '%': return c == ':' || c == '=' || c == '>';
155         case '&': return c == '&' || c == '=';
156         case '|': return c == '|' || c == '=';
157         case ':': return c == ':' || c == '>';
158         case '*': return c == '*' || c == '=';
159         case '.': return c == '.' || c == '%' || token2 == T_NUMBER;
160         case '#': return c == '#' || c == '%';
161         case T_GREATERGREATER: return c == '=';
162         case T_LESSLESS:       return c == '=';
163         case '^':              return c == '=';
164         case '!':              return c == '=';
165
166         case T_IDENTIFIER:
167                 return token2 == T_CHARACTER_CONSTANT ||
168                        token2 == T_IDENTIFIER         ||
169                        token2 == T_NUMBER             ||
170                        token2 == T_STRING_LITERAL; /* L */
171
172         case T_NUMBER:
173                 return token2 == T_IDENTIFIER || token2 == T_NUMBER ||
174                        token2 == '.' || token2 == '+' || token2 == '-';
175
176         default:
177                 return false;
178         }
179 }