X-Git-Url: http://nsz.repo.hu/git/?a=blobdiff_plain;f=lexer.c;h=247083c399645429fd1efbcd897c27c2865cff10;hb=979fce13621246b706781035786b5d11a8e2f608;hp=a25d827f0a3dc3b5b39315a9d7aa33f4553a2209;hpb=79a9582080d432506d1226c573a23ed9d7b9c4d8;p=cparser

diff --git a/lexer.c b/lexer.c
index a25d827..247083c 100644
--- a/lexer.c
+++ b/lexer.c
@@ -1,6 +1,6 @@
 /*
  * This file is part of cparser.
- * Copyright (C) 2007-2008 Matthias Braun <matze@braunis.de>
+ * Copyright (C) 2007-2009 Matthias Braun <matze@braunis.de>
  *
  * This program is free software; you can redistribute it and/or
  * modify it under the terms of the GNU General Public License
@@ -50,8 +50,7 @@
 
 #if defined(_WIN32) || defined(__CYGWIN__)
 /* No strtold on windows and no replacement yet */
-#define strtold(s, e)     strtod(s, e)
-#define strcasecmp(a, b)  stricmp(a, b)
+#define strtold(s, e) strtod(s, e)
 #endif
 
 typedef unsigned int utf32;
@@ -257,6 +256,54 @@ realign:
 	} while (bufpos == bufend);
 }
 
+static void decode_windows_1252(void)
+{
+	unsigned char read_buf[BUF_SIZE];
+	size_t const s = read_block(read_buf, sizeof(read_buf));
+	if (s == 0)
+		return;
+
+	unsigned char const *src = read_buf;
+	unsigned char const *end = read_buf + s;
+	utf32               *dst = buf + MAX_PUTBACK;
+	while (src != end) {
+		utf32 tc = *src++;
+		switch (tc) {
+			case 0x80: tc = 0x20AC; break; // â¬
+			case 0x82: tc = 0x201A; break; // â
+			case 0x83: tc = 0x0192; break; // Æ
+			case 0x84: tc = 0x201E; break; // â
+			case 0x85: tc = 0x2026; break; // â¦
+			case 0x86: tc = 0x2020; break; // â 
+			case 0x87: tc = 0x2021; break; // â¡
+			case 0x88: tc = 0x02C6; break; // Ë
+			case 0x89: tc = 0x2030; break; // â°
+			case 0x8A: tc = 0x0160; break; // Å 
+			case 0x8B: tc = 0x2039; break; // â¹
+			case 0x8C: tc = 0x0152; break; // Å
+			case 0x8E: tc = 0x017D; break; // Å½
+			case 0x91: tc = 0x2018; break; // â
+			case 0x92: tc = 0x2019; break; // â
+			case 0x93: tc = 0x201C; break; // â
+			case 0x94: tc = 0x201D; break; // â
+			case 0x95: tc = 0x2022; break; // â¢
+			case 0x96: tc = 0x2013; break; // â
+			case 0x97: tc = 0x2014; break; // â
+			case 0x98: tc = 0x02DC; break; // Ë
+			case 0x99: tc = 0x2122; break; // â¢
+			case 0x9A: tc = 0x0161; break; // Å¡
+			case 0x9B: tc = 0x203A; break; // âº
+			case 0x9C: tc = 0x0153; break; // Å
+			case 0x9E: tc = 0x017E; break; // Å¾
+			case 0x9F: tc = 0x0178; break; // Å¸
+		}
+		*dst++ = tc;
+	}
+
+	bufpos = buf + MAX_PUTBACK;
+	bufend = dst;
+}
+
 typedef void (*decoder_t)(void);
 
 static decoder_t decoder = decode_utf8;
@@ -267,23 +314,25 @@ typedef struct named_decoder_t {
 } named_decoder_t;
 
 static named_decoder_t const decoders[] = {
-	{ "CP819",           decode_iso_8859_1  }, // offical alias
-	{ "IBM819",          decode_iso_8859_1  }, // offical alias
-	{ "ISO-8859-1",      decode_iso_8859_1  }, // offical alias
-	{ "ISO-8859-15",     decode_iso_8859_15 }, // offical name
-	{ "ISO8859-1",       decode_iso_8859_1  },
-	{ "ISO8859-15",      decode_iso_8859_15 },
-	{ "ISO_8859-1",      decode_iso_8859_1  }, // offical alias
-	{ "ISO_8859-15",     decode_iso_8859_15 }, // offical alias
-	{ "ISO_8859-1:1987", decode_iso_8859_1  }, // offical name
-	{ "Latin-9",         decode_iso_8859_15 }, // offical alias
-	{ "UTF-8",           decode_utf8        }, // offical name
-	{ "csISOLatin1",     decode_iso_8859_1  }, // offical alias
-	{ "iso-ir-100",      decode_iso_8859_1  }, // offical alias
-	{ "l1",              decode_iso_8859_1  }, // offical alias
-	{ "latin1",          decode_iso_8859_1  }, // offical alias
-
-	{ NULL,              NULL               }
+	{ "CP819",           decode_iso_8859_1   }, // offical alias
+	{ "IBM819",          decode_iso_8859_1   }, // offical alias
+	{ "ISO-8859-1",      decode_iso_8859_1   }, // offical alias
+	{ "ISO-8859-15",     decode_iso_8859_15  }, // offical name
+	{ "ISO8859-1",       decode_iso_8859_1   },
+	{ "ISO8859-15",      decode_iso_8859_15  },
+	{ "ISO_8859-1",      decode_iso_8859_1   }, // offical alias
+	{ "ISO_8859-15",     decode_iso_8859_15  }, // offical alias
+	{ "ISO_8859-1:1987", decode_iso_8859_1   }, // offical name
+	{ "Latin-9",         decode_iso_8859_15  }, // offical alias
+	{ "UTF-8",           decode_utf8         }, // offical name
+	{ "csISOLatin1",     decode_iso_8859_1   }, // offical alias
+	{ "cp1252",          decode_windows_1252 },
+	{ "iso-ir-100",      decode_iso_8859_1   }, // offical alias
+	{ "l1",              decode_iso_8859_1   }, // offical alias
+	{ "latin1",          decode_iso_8859_1   }, // offical alias
+	{ "windows-1252",    decode_windows_1252 }, // official name
+
+	{ NULL,              NULL                }
 };
 
 void select_input_encoding(char const* const encoding)
@@ -1717,6 +1766,16 @@ static void parse_preprocessor_directive(void)
 					lexer_token.type = set_type;           \
 					return;
 
+/* must use this as last thing */
+#define MAYBE_MODE(ch, set_type, mode)                     \
+				case ch:                                   \
+					if (c_mode & mode) {                   \
+						next_char();                       \
+						lexer_token.type = set_type;       \
+						return;                            \
+					}                                      \
+					/* fallthrough */
+
 #define ELSE_CODE(code)                                    \
 				default:                                   \
 					code                                   \
@@ -1747,12 +1806,10 @@ void lexer_next_preprocessing_token(void)
 		SYMBOL_CHARS
 			parse_symbol();
 			/* might be a wide string ( L"string" ) */
-			if(lexer_token.type == T_IDENTIFIER &&
-			    lexer_token.v.symbol == symbol_L) {
-			    if(c == '"') {
-					parse_wide_string_literal();
-				} else if(c == '\'') {
-					parse_wide_character_constant();
+			if (lexer_token.v.symbol == symbol_L) {
+				switch (c) {
+					case '"':  parse_wide_string_literal();     break;
+					case '\'': parse_wide_character_constant(); break;
 				}
 			}
 			return;
@@ -1872,6 +1929,7 @@ void lexer_next_preprocessing_token(void)
 		case ':':
 			MAYBE_PROLOG
 			MAYBE('>', ']')
+			MAYBE_MODE(':', T_COLONCOLON, _CXX)
 			ELSE(':')
 		case '=':
 			MAYBE_PROLOG