fixed mode handling
[libfirm] / ir / be / ia32 / ia32_emitter.c
1 /**
2  * This file implements the node emitter.
3  *
4  * $Id$
5  */
6
7 #ifdef HAVE_CONFIG_H
8 #include "config.h"
9 #endif
10
11 #include <limits.h>
12
13 #include "xmalloc.h"
14 #include "tv.h"
15 #include "iredges.h"
16 #include "debug.h"
17 #include "irgwalk.h"
18 #include "irprintf.h"
19 #include "irop_t.h"
20 #include "irargs_t.h"
21 #include "irprog_t.h"
22 #include "iredges_t.h"
23
24 #include "../besched_t.h"
25 #include "../benode_t.h"
26
27 #include "ia32_emitter.h"
28 #include "gen_ia32_emitter.h"
29 #include "gen_ia32_regalloc_if.h"
30 #include "ia32_nodes_attr.h"
31 #include "ia32_new_nodes.h"
32 #include "ia32_map_regs.h"
33
34 #ifdef obstack_chunk_alloc
35 # undef obstack_chunk_alloc
36 # define obstack_chunk_alloc xmalloc
37 #else
38 # define obstack_chunk_alloc xmalloc
39 # define obstack_chunk_free free
40 #endif
41
42 #define BLOCK_PREFIX(x) ".L" x
43
44 extern int obstack_printf(struct obstack *obst, char *fmt, ...);
45
46 #define SNPRINTF_BUF_LEN 128
47
48 /* global arch_env for lc_printf functions */
49 static const arch_env_t *arch_env = NULL;
50
51 /* indicates whether blocks are scheduled or not
52    (this variable is set automatically) */
53 static int have_block_sched       = 0;
54
55 /*************************************************************
56  *             _       _    __   _          _
57  *            (_)     | |  / _| | |        | |
58  *  _ __  _ __ _ _ __ | |_| |_  | |__   ___| |_ __   ___ _ __
59  * | '_ \| '__| | '_ \| __|  _| | '_ \ / _ \ | '_ \ / _ \ '__|
60  * | |_) | |  | | | | | |_| |   | | | |  __/ | |_) |  __/ |
61  * | .__/|_|  |_|_| |_|\__|_|   |_| |_|\___|_| .__/ \___|_|
62  * | |                                       | |
63  * |_|                                       |_|
64  *************************************************************/
65
66 /* We always pass the ir_node which is a pointer. */
67 static int ia32_get_arg_type(const lc_arg_occ_t *occ) {
68         return lc_arg_type_ptr;
69 }
70
71
72 /**
73  * Returns the register at in position pos.
74  */
75 static const arch_register_t *get_in_reg(const ir_node *irn, int pos) {
76         ir_node                *op;
77         const arch_register_t  *reg = NULL;
78
79         assert(get_irn_arity(irn) > pos && "Invalid IN position");
80
81         /* The out register of the operator at position pos is the
82            in register we need. */
83         op = get_irn_n(irn, pos);
84
85         reg = arch_get_irn_register(arch_env, op);
86
87         assert(reg && "no in register found");
88         return reg;
89 }
90
91 /**
92  * Returns the register at out position pos.
93  */
94 static const arch_register_t *get_out_reg(const ir_node *irn, int pos) {
95         ir_node                *proj;
96         const arch_register_t  *reg = NULL;
97
98         /* 1st case: irn is not of mode_T, so it has only                 */
99         /*           one OUT register -> good                             */
100         /* 2nd case: irn is of mode_T -> collect all Projs and ask the    */
101         /*           Proj with the corresponding projnum for the register */
102
103         if (get_irn_mode(irn) != mode_T) {
104                 reg = arch_get_irn_register(arch_env, irn);
105         }
106         else if (is_ia32_irn(irn)) {
107                 reg = get_ia32_out_reg(irn, pos);
108         }
109         else {
110                 const ir_edge_t *edge;
111
112                 foreach_out_edge(irn, edge) {
113                         proj = get_edge_src_irn(edge);
114                         assert(is_Proj(proj) && "non-Proj from mode_T node");
115                         if (get_Proj_proj(proj) == pos) {
116                                 reg = arch_get_irn_register(arch_env, proj);
117                                 break;
118                         }
119                 }
120         }
121
122         assert(reg && "no out register found");
123         return reg;
124 }
125
126 enum io_direction {
127   IN_REG,
128   OUT_REG
129 };
130
131 /**
132  * Returns the name of the in register at position pos.
133  */
134 static const char *get_ia32_reg_name(ir_node *irn, int pos, enum io_direction in_out) {
135         const arch_register_t *reg;
136         const char            *name;
137         static char           *buf = NULL;
138         int                    len;
139
140         if (in_out == IN_REG) {
141                 reg = get_in_reg(irn, pos);
142         }
143         else {
144                 /* destination address mode nodes don't have outputs */
145                 if (is_ia32_irn(irn) && get_ia32_op_type(irn) == ia32_AddrModeD) {
146                         return "MEM";
147                 }
148
149                 reg = get_out_reg(irn, pos);
150         }
151
152         name = arch_register_get_name(reg);
153
154         if (buf) {
155                 free(buf);
156         }
157
158         len = strlen(name) + 2;
159         buf = xcalloc(1, len);
160
161         snprintf(buf, len, "%%%s", name);
162
163         return buf;
164 }
165
166 /**
167  * Get the register name for a node.
168  */
169 static int ia32_get_reg_name(lc_appendable_t *app,
170     const lc_arg_occ_t *occ, const lc_arg_value_t *arg)
171 {
172         const char *buf;
173         ir_node    *X  = arg->v_ptr;
174         int         nr = occ->width - 1;
175
176         if (!X)
177                 return lc_appendable_snadd(app, "(null)", 6);
178
179         buf = get_ia32_reg_name(X, nr, occ->conversion == 'S' ? IN_REG : OUT_REG);
180
181         return lc_appendable_snadd(app, buf, strlen(buf));
182 }
183
184 /**
185  * Returns the tarval, offset or scale of an ia32 as a string.
186  */
187 static int ia32_const_to_str(lc_appendable_t *app,
188     const lc_arg_occ_t *occ, const lc_arg_value_t *arg)
189 {
190         const char *buf;
191         ir_node    *X = arg->v_ptr;
192
193         if (!X)
194                 return lc_arg_append(app, occ, "(null)", 6);
195
196         if (occ->conversion == 'C') {
197                 buf = get_ia32_cnst(X);
198         }
199         else { /* 'O' */
200                 buf = get_ia32_am_offs(X);
201         }
202
203         return buf ? lc_appendable_snadd(app, buf, strlen(buf)) : 0;
204 }
205
206 /**
207  * Determines the SSE suffix depending on the mode.
208  */
209 static int ia32_get_mode_suffix(lc_appendable_t *app,
210     const lc_arg_occ_t *occ, const lc_arg_value_t *arg)
211 {
212         ir_node *X    = arg->v_ptr;
213         ir_mode *mode = get_irn_mode(X);
214
215         if (mode == mode_T) {
216                 mode = is_ia32_AddrModeS(X) || is_ia32_AddrModeD(X) ? get_ia32_ls_mode(X) : get_ia32_res_mode(X);
217         }
218
219         if (!X)
220                 return lc_arg_append(app, occ, "(null)", 6);
221
222         if (mode_is_float(mode)) {
223                 return lc_appendable_chadd(app, get_mode_size_bits(mode) == 32 ? 's' : 'd');
224         }
225         else {
226                 return lc_appendable_chadd(app, mode_is_signed(mode) ? 's' : 'z');
227         }
228 }
229
230 /**
231  * Return the ia32 printf arg environment.
232  * We use the firm environment with some additional handlers.
233  */
234 const lc_arg_env_t *ia32_get_arg_env(void) {
235         static lc_arg_env_t *env = NULL;
236
237         static const lc_arg_handler_t ia32_reg_handler   = { ia32_get_arg_type, ia32_get_reg_name };
238         static const lc_arg_handler_t ia32_const_handler = { ia32_get_arg_type, ia32_const_to_str };
239         static const lc_arg_handler_t ia32_mode_handler  = { ia32_get_arg_type, ia32_get_mode_suffix };
240
241         if(env == NULL) {
242                 /* extend the firm printer */
243                 env = firm_get_arg_env();
244
245                 lc_arg_register(env, "ia32:sreg", 'S', &ia32_reg_handler);
246                 lc_arg_register(env, "ia32:dreg", 'D', &ia32_reg_handler);
247                 lc_arg_register(env, "ia32:cnst", 'C', &ia32_const_handler);
248                 lc_arg_register(env, "ia32:offs", 'O', &ia32_const_handler);
249                 lc_arg_register(env, "ia32:mode", 'M', &ia32_mode_handler);
250         }
251
252         return env;
253 }
254
255 static char *ia32_get_reg_name_for_mode(ia32_emit_env_t *env, ir_mode *mode, const arch_register_t *reg) {
256         switch(get_mode_size_bits(mode)) {
257                 case 8:
258                         return ia32_get_mapped_reg_name(env->isa->regs_8bit, reg);
259                 case 16:
260                         return ia32_get_mapped_reg_name(env->isa->regs_16bit, reg);
261                 default:
262                         return (char *)arch_register_get_name(reg);
263         }
264 }
265
266 /**
267  * Emits registers and/or address mode of a binary operation.
268  */
269 char *ia32_emit_binop(const ir_node *n, ia32_emit_env_t *env) {
270         static char *buf = NULL;
271
272         /* verify that this function is never called on non-AM supporting operations */
273         //assert(get_ia32_am_support(n) != ia32_am_None && "emit binop expects addressmode support");
274
275 #define PRODUCES_RESULT(n)   \
276         (!(is_ia32_St(n)      || \
277         is_ia32_Store8Bit(n)  || \
278         is_ia32_CondJmp(n)    || \
279         is_ia32_fCondJmp(n)   || \
280         is_ia32_SwitchJmp(n)))
281
282         if (! buf) {
283                 buf = xcalloc(1, SNPRINTF_BUF_LEN);
284         }
285         else {
286                 memset(buf, 0, SNPRINTF_BUF_LEN);
287         }
288
289         switch(get_ia32_op_type(n)) {
290                 case ia32_Normal:
291                         if (get_ia32_cnst(n)) {
292                                 lc_esnprintf(ia32_get_arg_env(), buf, SNPRINTF_BUF_LEN, "%3S, %s", n, get_ia32_cnst(n));
293                         }
294                         else {
295                                 const arch_register_t *in1 = get_in_reg(n, 2);
296                                 const arch_register_t *in2 = get_in_reg(n, 3);
297                                 const arch_register_t *out = PRODUCES_RESULT(n) ? get_out_reg(n, 0) : NULL;
298                                 const arch_register_t *in;
299
300                                 in  = out ? (REGS_ARE_EQUAL(out, in2) ? in1 : in2) : in2;
301                                 out = out ? out : in1;
302
303                                 snprintf(buf, SNPRINTF_BUF_LEN, "%%%s, %%%s", \
304                                         arch_register_get_name(out), arch_register_get_name(in));
305                         }
306                         break;
307                 case ia32_AddrModeS:
308                         lc_esnprintf(ia32_get_arg_env(), buf, SNPRINTF_BUF_LEN, "%4S, %s", n, ia32_emit_am(n, env));
309                         break;
310                 case ia32_AddrModeD:
311                         if (get_ia32_cnst(n)) {
312                                 lc_esnprintf(ia32_get_arg_env(), buf, SNPRINTF_BUF_LEN, "%s,%s%s",
313                                         ia32_emit_am(n, env),
314                                         get_ia32_sc(n) ? " OFFSET FLAT:" : " ",    /* In case of a symconst we must add OFFSET to */
315                                         get_ia32_cnst(n));                         /* tell the assembler to store it's address.   */
316                         }
317                         else {
318                                 const arch_register_t *in1 = get_in_reg(n, 2);
319                                 ir_mode              *mode = get_ia32_res_mode(n);
320
321                                 mode = mode ? mode : get_ia32_ls_mode(n);
322                                 lc_esnprintf(ia32_get_arg_env(), buf, SNPRINTF_BUF_LEN, "%s, %%%s",
323                                         ia32_emit_am(n, env), ia32_get_reg_name_for_mode(env, mode, in1));
324                         }
325                         break;
326                 default:
327                         assert(0 && "unsupported op type");
328         }
329
330 #undef PRODUCES_RESULT
331
332         return buf;
333 }
334
335 /**
336  * Emits registers and/or address mode of a unary operation.
337  */
338 char *ia32_emit_unop(const ir_node *n, ia32_emit_env_t *env) {
339         static char *buf = NULL;
340
341         if (! buf) {
342                 buf = xcalloc(1, SNPRINTF_BUF_LEN);
343         }
344         else {
345                 memset(buf, 0, SNPRINTF_BUF_LEN);
346         }
347
348         switch(get_ia32_op_type(n)) {
349                 case ia32_Normal:
350                         lc_esnprintf(ia32_get_arg_env(), buf, SNPRINTF_BUF_LEN, "%1D", n);
351                         break;
352                 case ia32_am_Dest:
353                         snprintf(buf, SNPRINTF_BUF_LEN, ia32_emit_am(n, env));
354                         break;
355                 default:
356                         assert(0 && "unsupported op type");
357         }
358
359         return buf;
360 }
361
362 /**
363  * Emits address mode.
364  */
365 char *ia32_emit_am(const ir_node *n, ia32_emit_env_t *env) {
366         ia32_am_flavour_t am_flav    = get_ia32_am_flavour(n);
367         int               had_output = 0;
368         char             *s;
369         int               size;
370         static struct obstack *obst  = NULL;
371         ir_mode *mode = get_ia32_ls_mode(n);
372
373         if (! is_ia32_Lea(n))
374                 assert(mode && "AM node must have ls_mode attribute set.");
375
376         if (! obst) {
377                 obst = xcalloc(1, sizeof(*obst));
378         }
379         else {
380                 obstack_free(obst, NULL);
381         }
382
383         /* obstack_free with NULL results in an uninitialized obstack */
384         obstack_init(obst);
385
386         if (mode) {
387                 switch (get_mode_size_bits(mode)) {
388                         case 8:
389                                 obstack_printf(obst, "BYTE PTR ");
390                                 break;
391                         case 16:
392                                 obstack_printf(obst, "WORD PTR ");
393                                 break;
394                         case 32:
395                                 obstack_printf(obst, "DWORD PTR ");
396                                 break;
397                         default:
398                                 break;
399                 }
400         }
401
402         obstack_printf(obst, "[");
403
404         if (am_flav & ia32_B) {
405                 lc_eoprintf(ia32_get_arg_env(), obst, "%1S", n);
406                 had_output = 1;
407         }
408
409         if (am_flav & ia32_I) {
410                 if (had_output) {
411                         obstack_printf(obst, "+");
412                 }
413
414                 lc_eoprintf(ia32_get_arg_env(), obst, "%2S", n);
415
416                 if (am_flav & ia32_S) {
417                         obstack_printf(obst, "*%d", 1 << get_ia32_am_scale(n));
418                 }
419
420                 had_output = 1;
421         }
422
423         if (am_flav & ia32_O) {
424                 obstack_printf(obst, get_ia32_am_offs(n));
425         }
426
427         obstack_printf(obst, "] ");
428
429         size        = obstack_object_size(obst);
430         s           = obstack_finish(obst);
431         s[size - 1] = '\0';
432
433         return s;
434 }
435
436
437
438 /**
439  * Formated print of commands and comments.
440  */
441 static void ia32_fprintf_format(FILE *F, char *cmd_buf, char *cmnt_buf) {
442         fprintf(F, "\t%-35s %-60s\n", cmd_buf, cmnt_buf);
443 }
444
445
446
447 /**
448  * Add a number to a prefix. This number will not be used a second time.
449  */
450 static char *get_unique_label(char *buf, size_t buflen, const char *prefix) {
451         static unsigned long id = 0;
452         snprintf(buf, buflen, "%s%lu", prefix, ++id);
453         return buf;
454 }
455
456
457
458 /*************************************************
459  *                 _ _                         _
460  *                (_) |                       | |
461  *   ___ _ __ ___  _| |_    ___ ___  _ __   __| |
462  *  / _ \ '_ ` _ \| | __|  / __/ _ \| '_ \ / _` |
463  * |  __/ | | | | | | |_  | (_| (_) | | | | (_| |
464  *  \___|_| |_| |_|_|\__|  \___\___/|_| |_|\__,_|
465  *
466  *************************************************/
467
468 #undef IA32_DO_EMIT
469 #define IA32_DO_EMIT ia32_fprintf_format(F, cmd_buf, cmnt_buf)
470
471 /*
472  * coding of conditions
473  */
474 struct cmp2conditon_t {
475         const char *name;
476         pn_Cmp      num;
477 };
478
479 /*
480  * positive conditions for signed compares
481  */
482 static const struct cmp2conditon_t cmp2condition_s[] = {
483   { NULL,              pn_Cmp_False },  /* always false */
484   { "e",               pn_Cmp_Eq },     /* == */
485   { "l",               pn_Cmp_Lt },     /* < */
486   { "le",              pn_Cmp_Le },     /* <= */
487   { "g",               pn_Cmp_Gt },     /* > */
488   { "ge",              pn_Cmp_Ge },     /* >= */
489   { "ne",              pn_Cmp_Lg },     /* != */
490   { "ordered",         pn_Cmp_Leg },    /* Floating point: ordered */
491   { "unordered",       pn_Cmp_Uo },     /* FLoting point: unordered */
492   { "unordered or ==", pn_Cmp_Ue },     /* Floating point: unordered or == */
493   { "unordered or <",  pn_Cmp_Ul },     /* Floating point: unordered or < */
494   { "unordered or <=", pn_Cmp_Ule },    /* Floating point: unordered or <= */
495   { "unordered or >",  pn_Cmp_Ug },     /* Floating point: unordered or > */
496   { "unordered or >=", pn_Cmp_Uge },    /* Floating point: unordered or >= */
497   { "unordered or !=", pn_Cmp_Ne },     /* Floating point: unordered or != */
498   { NULL,              pn_Cmp_True },   /* always true */
499 };
500
501 /*
502  * positive conditions for unsigned compares
503  */
504 static const struct cmp2conditon_t cmp2condition_u[] = {
505         { NULL,              pn_Cmp_False },  /* always false */
506         { "e",               pn_Cmp_Eq },     /* == */
507         { "b",               pn_Cmp_Lt },     /* < */
508         {       "be",              pn_Cmp_Le },     /* <= */
509         { "a",               pn_Cmp_Gt },     /* > */
510         { "ae",              pn_Cmp_Ge },     /* >= */
511         { "ne",              pn_Cmp_Lg },     /* != */
512         { "ordered",         pn_Cmp_Leg },    /* Floating point: ordered */
513         { "unordered",       pn_Cmp_Uo },     /* FLoting point: unordered */
514         { "unordered or ==", pn_Cmp_Ue },     /* Floating point: unordered or == */
515         { "unordered or <",  pn_Cmp_Ul },     /* Floating point: unordered or < */
516         { "unordered or <=", pn_Cmp_Ule },    /* Floating point: unordered or <= */
517         { "unordered or >",  pn_Cmp_Ug },     /* Floating point: unordered or > */
518         { "unordered or >=", pn_Cmp_Uge },    /* Floating point: unordered or >= */
519         { "unordered or !=", pn_Cmp_Ne },     /* Floating point: unordered or != */
520         { NULL,              pn_Cmp_True },   /* always true */
521 };
522
523 /*
524  * returns the condition code
525  */
526 static const char *get_cmp_suffix(int cmp_code, int unsigned_cmp)
527 {
528         assert(cmp2condition_s[cmp_code].num == cmp_code);
529         assert(cmp2condition_u[cmp_code].num == cmp_code);
530
531         return unsigned_cmp ? cmp2condition_u[cmp_code & 7].name : cmp2condition_s[cmp_code & 7].name;
532 }
533
534 /**
535  * Returns the target block for a control flow node.
536  */
537 static ir_node *get_cfop_target_block(const ir_node *irn) {
538         return get_irn_link(irn);
539 }
540
541 /**
542  * Returns the target label for a control flow node.
543  */
544 static char *get_cfop_target(const ir_node *irn, char *buf) {
545         ir_node *bl = get_cfop_target_block(irn);
546
547         snprintf(buf, SNPRINTF_BUF_LEN, BLOCK_PREFIX("%ld"), get_irn_node_nr(bl));
548         return buf;
549 }
550
551 /** Return the next block in Block schedule */
552 static ir_node *next_blk_sched(const ir_node *block) {
553         return have_block_sched ? get_irn_link(block) : NULL;
554 }
555
556 /**
557  * Emits the jump sequence for a conditional jump (cmp + jmp_true + jmp_false)
558  */
559 static void finish_CondJmp(FILE *F, const ir_node *irn, ir_mode *mode) {
560         const ir_node   *proj1, *proj2 = NULL;
561         const ir_node   *block, *next_bl = NULL;
562         const ir_edge_t *edge;
563         char buf[SNPRINTF_BUF_LEN];
564         char cmd_buf[SNPRINTF_BUF_LEN];
565         char cmnt_buf[SNPRINTF_BUF_LEN];
566
567         /* get both Proj's */
568         edge = get_irn_out_edge_first(irn);
569         proj1 = get_edge_src_irn(edge);
570         assert(is_Proj(proj1) && "CondJmp with a non-Proj");
571
572         edge = get_irn_out_edge_next(irn, edge);
573         if (edge) {
574                 proj2 = get_edge_src_irn(edge);
575                 assert(is_Proj(proj2) && "CondJmp with a non-Proj");
576         }
577
578         /* for now, the code works for scheduled and non-schedules blocks */
579         block = get_nodes_block(irn);
580         if (proj2) {
581                 /* we have a block schedule */
582                 next_bl = next_blk_sched(block);
583
584                 if (get_cfop_target_block(proj1) == next_bl) {
585                         /* exchange both proj's so the second one can be omitted */
586                         const ir_node *t = proj1;
587                         proj1 = proj2;
588                         proj2 = t;
589                 }
590         }
591
592         /* the first Proj must always be created */
593         if (get_Proj_proj(proj1) == pn_Cond_true) {
594                 snprintf(cmd_buf, SNPRINTF_BUF_LEN, "j%s %s",
595                                         get_cmp_suffix(get_ia32_pncode(irn), !mode_is_signed(get_irn_mode(get_irn_n(irn, 0)))),
596                                         get_cfop_target(proj1, buf));
597                 snprintf(cmnt_buf, SNPRINTF_BUF_LEN, "/* cmp(a, b) == TRUE */");
598         }
599         else  {
600                 snprintf(cmd_buf, SNPRINTF_BUF_LEN, "j%s %s",
601                                         get_cmp_suffix(get_negated_pnc(get_ia32_pncode(irn), mode),
602                                         !mode_is_signed(get_irn_mode(get_irn_n(irn, 0)))),
603                                         get_cfop_target(proj1, buf));
604                 snprintf(cmnt_buf, SNPRINTF_BUF_LEN, "/* cmp(a, b) == FALSE */");
605         }
606         IA32_DO_EMIT;
607
608         /* the second Proj might be a fallthrough */
609         if (proj2) {
610                 if (get_cfop_target_block(proj2) != next_bl) {
611                         snprintf(cmd_buf, SNPRINTF_BUF_LEN, "jmp %s", get_cfop_target(proj2, buf));
612                         snprintf(cmnt_buf, SNPRINTF_BUF_LEN, "/* otherwise */");
613                 }
614                 else {
615                         cmd_buf[0] = '\0';
616                         snprintf(cmnt_buf, SNPRINTF_BUF_LEN, "/* fallthrogh %s */", get_cfop_target(proj2, buf));
617                 }
618                 IA32_DO_EMIT;
619         }
620 }
621
622 /**
623  * Emits code for conditional jump.
624  */
625 static void CondJmp_emitter(const ir_node *irn, ia32_emit_env_t *env) {
626         FILE *F = env->out;
627         char cmd_buf[SNPRINTF_BUF_LEN];
628         char cmnt_buf[SNPRINTF_BUF_LEN];
629
630         snprintf(cmd_buf, SNPRINTF_BUF_LEN, "cmp %s", ia32_emit_binop(irn, env));
631         lc_esnprintf(ia32_get_arg_env(), cmnt_buf, SNPRINTF_BUF_LEN, "/* %+F */", irn);
632         IA32_DO_EMIT;
633         finish_CondJmp(F, irn, get_irn_mode(get_irn_n(irn, 2)));
634 }
635
636 /**
637  * Emits code for conditional jump with two variables.
638  */
639 static void emit_ia32_CondJmp(const ir_node *irn, ia32_emit_env_t *env) {
640         CondJmp_emitter(irn, env);
641 }
642
643 /**
644  * Emits code for conditional jump with immediate.
645  */
646 void emit_ia32_CondJmp_i(const ir_node *irn, ia32_emit_env_t *env) {
647         CondJmp_emitter(irn, env);
648 }
649
650 /**
651  * Emits code for conditional test and jump.
652  */
653 static void TestJmp_emitter(const ir_node *irn, ia32_emit_env_t *env) {
654         FILE       *F   = env->out;
655         const char *op1 = arch_register_get_name(get_in_reg(irn, 0));
656         const char *op2 = get_ia32_cnst(irn);
657         char        cmd_buf[SNPRINTF_BUF_LEN];
658         char        cmnt_buf[SNPRINTF_BUF_LEN];
659
660         if (! op2)
661                 op2 = arch_register_get_name(get_in_reg(irn, 1));
662
663         snprintf(cmd_buf, SNPRINTF_BUF_LEN, "test %%%s,%s%s ", op1, get_ia32_cnst(irn) ? " " : " %", op2);
664         lc_esnprintf(ia32_get_arg_env(), cmnt_buf, SNPRINTF_BUF_LEN, "/* %+F */", irn);
665
666         IA32_DO_EMIT;
667         finish_CondJmp(F, irn, get_irn_mode(get_irn_n(irn, 0)));
668 }
669
670 /**
671  * Emits code for conditional test and jump with two variables.
672  */
673 static void emit_ia32_TestJmp(const ir_node *irn, ia32_emit_env_t *env) {
674         TestJmp_emitter(irn, env);
675 }
676
677 static void emit_ia32_CJmp(const ir_node *irn, ia32_emit_env_t *env) {
678         FILE *F = env->out;
679         char cmd_buf[SNPRINTF_BUF_LEN];
680         char cmnt_buf[SNPRINTF_BUF_LEN];
681
682         snprintf(cmd_buf, SNPRINTF_BUF_LEN, " ");
683         lc_esnprintf(ia32_get_arg_env(), cmnt_buf, SNPRINTF_BUF_LEN, "/* %+F omitted redundant test/cmp */", irn);
684         IA32_DO_EMIT;
685         finish_CondJmp(F, irn, get_irn_mode(get_irn_n(irn, 0)));
686 }
687
688 static void emit_ia32_CJmpAM(const ir_node *irn, ia32_emit_env_t *env) {
689         FILE *F = env->out;
690         char cmd_buf[SNPRINTF_BUF_LEN];
691         char cmnt_buf[SNPRINTF_BUF_LEN];
692
693         snprintf(cmd_buf, SNPRINTF_BUF_LEN, " ");
694         lc_esnprintf(ia32_get_arg_env(), cmnt_buf, SNPRINTF_BUF_LEN, "/* %+F omitted redundant test/cmp */", irn);
695         IA32_DO_EMIT;
696         finish_CondJmp(F, irn, get_irn_mode(get_irn_n(irn, 2)));
697 }
698
699 /*********************************************************
700  *                 _ _       _
701  *                (_) |     (_)
702  *   ___ _ __ ___  _| |_     _ _   _ _ __ ___  _ __  ___
703  *  / _ \ '_ ` _ \| | __|   | | | | | '_ ` _ \| '_ \/ __|
704  * |  __/ | | | | | | |_    | | |_| | | | | | | |_) \__ \
705  *  \___|_| |_| |_|_|\__|   | |\__,_|_| |_| |_| .__/|___/
706  *                         _/ |               | |
707  *                        |__/                |_|
708  *********************************************************/
709
710 /* jump table entry (target and corresponding number) */
711 typedef struct _branch_t {
712         ir_node *target;
713         int      value;
714 } branch_t;
715
716 /* jump table for switch generation */
717 typedef struct _jmp_tbl_t {
718         ir_node  *defProj;         /**< default target */
719         int       min_value;       /**< smallest switch case */
720         int       max_value;       /**< largest switch case */
721         int       num_branches;    /**< number of jumps */
722         char     *label;           /**< label of the jump table */
723         branch_t *branches;        /**< jump array */
724 } jmp_tbl_t;
725
726 /**
727  * Compare two variables of type branch_t. Used to sort all switch cases
728  */
729 static int ia32_cmp_branch_t(const void *a, const void *b) {
730         branch_t *b1 = (branch_t *)a;
731         branch_t *b2 = (branch_t *)b;
732
733         if (b1->value <= b2->value)
734                 return -1;
735         else
736                 return 1;
737 }
738
739 /**
740  * Emits code for a SwitchJmp (creates a jump table if
741  * possible otherwise a cmp-jmp cascade). Port from
742  * cggg ia32 backend
743  */
744 void emit_ia32_SwitchJmp(const ir_node *irn, ia32_emit_env_t *emit_env) {
745         unsigned long       interval;
746         char                buf[SNPRINTF_BUF_LEN];
747         int                 last_value, i, pn, do_jmp_tbl = 1;
748         jmp_tbl_t           tbl;
749         ir_node            *proj;
750         const ir_edge_t    *edge;
751         const lc_arg_env_t *env = ia32_get_arg_env();
752         FILE               *F   = emit_env->out;
753         char cmd_buf[SNPRINTF_BUF_LEN], cmnt_buf[SNPRINTF_BUF_LEN];
754
755         /* fill the table structure */
756         tbl.label        = xmalloc(SNPRINTF_BUF_LEN);
757         tbl.label        = get_unique_label(tbl.label, SNPRINTF_BUF_LEN, "JMPTBL_");
758         tbl.defProj      = NULL;
759         tbl.num_branches = get_irn_n_edges(irn);
760         tbl.branches     = xcalloc(tbl.num_branches, sizeof(tbl.branches[0]));
761         tbl.min_value    = INT_MAX;
762         tbl.max_value    = INT_MIN;
763
764         i = 0;
765         /* go over all proj's and collect them */
766         foreach_out_edge(irn, edge) {
767                 proj = get_edge_src_irn(edge);
768                 assert(is_Proj(proj) && "Only proj allowed at SwitchJmp");
769
770                 pn = get_Proj_proj(proj);
771
772                 /* create branch entry */
773                 tbl.branches[i].target = proj;
774                 tbl.branches[i].value  = pn;
775
776                 tbl.min_value = pn < tbl.min_value ? pn : tbl.min_value;
777                 tbl.max_value = pn > tbl.max_value ? pn : tbl.max_value;
778
779                 /* check for default proj */
780                 if (pn == get_ia32_pncode(irn)) {
781                         assert(tbl.defProj == NULL && "found two defProjs at SwitchJmp");
782                         tbl.defProj = proj;
783                 }
784
785                 i++;
786         }
787
788         /* sort the branches by their number */
789         qsort(tbl.branches, tbl.num_branches, sizeof(tbl.branches[0]), ia32_cmp_branch_t);
790
791         /* two-complement's magic make this work without overflow */
792         interval = tbl.max_value - tbl.min_value;
793
794         /* check value interval */
795         if (interval > 16 * 1024) {
796                 do_jmp_tbl = 0;
797         }
798
799         /* check ratio of value interval to number of branches */
800         if ((float)(interval + 1) / (float)tbl.num_branches > 8.0) {
801                 do_jmp_tbl = 0;
802         }
803
804         if (do_jmp_tbl) {
805                 /* emit the table */
806                 if (tbl.min_value != 0) {
807                         lc_esnprintf(env, cmd_buf, SNPRINTF_BUF_LEN, "cmpl %lu, -%d(%1S)",
808                                 interval, tbl.min_value, irn);
809                         snprintf(cmnt_buf, SNPRINTF_BUF_LEN, "/* first switch value is not 0 */");
810
811                         IA32_DO_EMIT;
812                 }
813                 else {
814                         lc_esnprintf(env, cmd_buf, SNPRINTF_BUF_LEN, "cmpl %lu, %1S", interval, irn);
815                         snprintf(cmnt_buf, SNPRINTF_BUF_LEN, "/* compare for switch */");
816
817                         IA32_DO_EMIT;
818                 }
819
820                 snprintf(cmd_buf, SNPRINTF_BUF_LEN, "ja %s", get_cfop_target(tbl.defProj, buf));
821                 snprintf(cmnt_buf, SNPRINTF_BUF_LEN, "/* default jump if out of range  */");
822                 IA32_DO_EMIT;
823
824                 if (tbl.num_branches > 1) {
825                         /* create table */
826
827                         lc_esnprintf(env, cmd_buf, SNPRINTF_BUF_LEN, "jmp [%1S*4+%s]", irn, tbl.label);
828                         snprintf(cmnt_buf, SNPRINTF_BUF_LEN, "/* get jump table entry as target */");
829                         IA32_DO_EMIT;
830
831                         fprintf(F, "\t.section\t.rodata\n");
832                         fprintf(F, "\t.align 4\n");
833
834                         fprintf(F, "%s:\n", tbl.label);
835
836                         snprintf(cmd_buf, SNPRINTF_BUF_LEN, ".long %s", get_cfop_target(tbl.branches[0].target, buf));
837                         snprintf(cmnt_buf, SNPRINTF_BUF_LEN, "/* case %d */\n",  tbl.branches[0].value);
838                         IA32_DO_EMIT;
839
840                         last_value = tbl.branches[0].value;
841                         for (i = 1; i < tbl.num_branches; ++i) {
842                                 while (++last_value < tbl.branches[i].value) {
843                                         snprintf(cmd_buf, SNPRINTF_BUF_LEN, ".long %s", get_cfop_target(tbl.defProj, buf));
844                                         snprintf(cmnt_buf, SNPRINTF_BUF_LEN, "/* default case */");
845                                         IA32_DO_EMIT;
846                                 }
847                                 snprintf(cmd_buf, SNPRINTF_BUF_LEN, ".long %s", get_cfop_target(tbl.branches[i].target, buf));
848                                 snprintf(cmnt_buf, SNPRINTF_BUF_LEN, "/* case %d */", last_value);
849                                 IA32_DO_EMIT;
850                         }
851
852                         fprintf(F, "\t.text");
853                 }
854                 else {
855                         /* one jump is enough */
856                         snprintf(cmd_buf, SNPRINTF_BUF_LEN, "jmp %s", get_cfop_target(tbl.branches[0].target, buf));
857                         snprintf(cmnt_buf, SNPRINTF_BUF_LEN, "/* only one case given */");
858                         IA32_DO_EMIT;
859                 }
860         }
861         else { // no jump table
862                 for (i = 0; i < tbl.num_branches; ++i) {
863                         lc_esnprintf(env, cmd_buf, SNPRINTF_BUF_LEN, "cmpl %d, %1S", tbl.branches[i].value, irn);
864                         snprintf(cmnt_buf, SNPRINTF_BUF_LEN, "/* case %d */", i);
865                         IA32_DO_EMIT;
866                         fprintf(F, "\tje %s\n", get_cfop_target(tbl.branches[i].target, buf));
867                 }
868
869                 snprintf(cmd_buf, SNPRINTF_BUF_LEN, "jmp %s", get_cfop_target(tbl.defProj, buf));
870                 snprintf(cmnt_buf, SNPRINTF_BUF_LEN, "/* default case */");
871                 IA32_DO_EMIT;
872         }
873
874         if (tbl.label)
875                 free(tbl.label);
876         if (tbl.branches)
877                 free(tbl.branches);
878 }
879
880 /**
881  * Emits code for a unconditional jump.
882  */
883 void emit_Jmp(const ir_node *irn, ia32_emit_env_t *env) {
884         ir_node *block, *next_bl;
885         FILE *F = env->out;
886         char buf[SNPRINTF_BUF_LEN], cmd_buf[SNPRINTF_BUF_LEN], cmnt_buf[SNPRINTF_BUF_LEN];
887
888         /* for now, the code works for scheduled and non-schedules blocks */
889         block = get_nodes_block(irn);
890
891         /* we have a block schedule */
892         next_bl = next_blk_sched(block);
893         if (get_cfop_target_block(irn) != next_bl) {
894                 snprintf(cmd_buf, SNPRINTF_BUF_LEN, "jmp %s", get_cfop_target(irn, buf));
895                 lc_esnprintf(ia32_get_arg_env(), cmnt_buf, SNPRINTF_BUF_LEN, "/* %+F(%+F) */", irn, get_cfop_target_block(irn));
896         }
897         else {
898                 cmd_buf[0] = '\0';
899                 lc_esnprintf(ia32_get_arg_env(), cmnt_buf, SNPRINTF_BUF_LEN, "/* fallthrough %s */", get_cfop_target(irn, buf));
900         }
901         IA32_DO_EMIT;
902 }
903
904 /****************************
905  *                  _
906  *                 (_)
907  *  _ __  _ __ ___  _  ___
908  * | '_ \| '__/ _ \| |/ __|
909  * | |_) | | | (_) | |\__ \
910  * | .__/|_|  \___/| ||___/
911  * | |            _/ |
912  * |_|           |__/
913  ****************************/
914
915 /**
916  * Emits code for a proj -> node
917  */
918 void emit_Proj(const ir_node *irn, ia32_emit_env_t *env) {
919         ir_node *pred = get_Proj_pred(irn);
920
921         if (get_irn_op(pred) == op_Start) {
922                 switch(get_Proj_proj(irn)) {
923                         case pn_Start_X_initial_exec:
924                                 emit_Jmp(irn, env);
925                                 break;
926                         default:
927                                 break;
928                 }
929         }
930 }
931
932 /**********************************
933  *   _____                  ____
934  *  / ____|                |  _ \
935  * | |     ___  _ __  _   _| |_) |
936  * | |    / _ \| '_ \| | | |  _ <
937  * | |___| (_) | |_) | |_| | |_) |
938  *  \_____\___/| .__/ \__, |____/
939  *             | |     __/ |
940  *             |_|    |___/
941  **********************************/
942
943 /**
944  * Emit movsb/w instructions to make mov count divideable by 4
945  */
946 static void emit_CopyB_prolog(FILE *F, int rem, int size) {
947         char cmd_buf[SNPRINTF_BUF_LEN], cmnt_buf[SNPRINTF_BUF_LEN];
948
949         fprintf(F, "\t/* memcopy %d bytes*/\n", size);
950
951         snprintf(cmd_buf, SNPRINTF_BUF_LEN, "cld");
952         snprintf(cmnt_buf, SNPRINTF_BUF_LEN, "/* copy direction forward*/");
953         IA32_DO_EMIT;
954
955         switch(rem) {
956                 case 1:
957                         snprintf(cmd_buf, SNPRINTF_BUF_LEN, "movsb");
958                         snprintf(cmnt_buf, SNPRINTF_BUF_LEN, "/* memcopy remainder 1 */");
959                         break;
960                 case 2:
961                         snprintf(cmd_buf, SNPRINTF_BUF_LEN, "movsw");
962                         snprintf(cmnt_buf, SNPRINTF_BUF_LEN, "/* memcopy remainder 2 */");
963                         break;
964                 case 3:
965                         snprintf(cmd_buf, SNPRINTF_BUF_LEN, "movsb");
966                         snprintf(cmnt_buf, SNPRINTF_BUF_LEN, "/* memcopy remainder 3 */");
967                         IA32_DO_EMIT;
968                         snprintf(cmd_buf, SNPRINTF_BUF_LEN, "movsw");
969                         snprintf(cmnt_buf, SNPRINTF_BUF_LEN, "/* memcopy remainder 3 */");
970                         break;
971         }
972
973         IA32_DO_EMIT;
974 }
975
976 /**
977  * Emit rep movsd instruction for memcopy.
978  */
979 void emit_ia32_CopyB(const ir_node *irn, ia32_emit_env_t *emit_env) {
980         FILE   *F    = emit_env->out;
981         tarval *tv   = get_ia32_Immop_tarval(irn);
982         int     rem  = get_tarval_long(tv);
983         int     size = get_tarval_long(get_ia32_Immop_tarval(get_irn_n(irn, 2)));
984         char cmd_buf[SNPRINTF_BUF_LEN], cmnt_buf[SNPRINTF_BUF_LEN];
985
986         emit_CopyB_prolog(F, rem, size);
987
988         snprintf(cmd_buf, SNPRINTF_BUF_LEN, "rep movsd");
989         snprintf(cmnt_buf, SNPRINTF_BUF_LEN, "/* memcopy */");
990         IA32_DO_EMIT;
991 }
992
993 /**
994  * Emits unrolled memcopy.
995  */
996 void emit_ia32_CopyB_i(const ir_node *irn, ia32_emit_env_t *emit_env) {
997         tarval *tv   = get_ia32_Immop_tarval(irn);
998         int     size = get_tarval_long(tv);
999         FILE   *F    = emit_env->out;
1000         char cmd_buf[SNPRINTF_BUF_LEN], cmnt_buf[SNPRINTF_BUF_LEN];
1001
1002         emit_CopyB_prolog(F, size & 0x3, size);
1003
1004         size >>= 2;
1005         while (size--) {
1006                 snprintf(cmd_buf, SNPRINTF_BUF_LEN, "movsd");
1007                 snprintf(cmnt_buf, SNPRINTF_BUF_LEN, "/* memcopy unrolled */");
1008                 IA32_DO_EMIT;
1009         }
1010 }
1011
1012
1013
1014 /***************************
1015  *   _____
1016  *  / ____|
1017  * | |     ___  _ ____   __
1018  * | |    / _ \| '_ \ \ / /
1019  * | |___| (_) | | | \ V /
1020  *  \_____\___/|_| |_|\_/
1021  *
1022  ***************************/
1023
1024 /**
1025  * Emit code for conversions (I, FP), (FP, I) and (FP, FP).
1026  */
1027 static void emit_ia32_Conv_with_FP(const ir_node *irn, ia32_emit_env_t *emit_env) {
1028         FILE               *F    = emit_env->out;
1029         const lc_arg_env_t *env  = ia32_get_arg_env();
1030         char               *from, *to, buf[64];
1031         ir_mode *src_mode, *tgt_mode;
1032         char cmd_buf[SNPRINTF_BUF_LEN], cmnt_buf[SNPRINTF_BUF_LEN];
1033
1034         src_mode = is_ia32_AddrModeS(irn) ? get_ia32_ls_mode(irn) : get_irn_mode(get_irn_n(irn, 2));
1035         tgt_mode = get_ia32_res_mode(irn);
1036
1037         from = mode_is_float(src_mode) ? (get_mode_size_bits(src_mode) == 32 ? "ss" : "sd") : "si";
1038         to   = mode_is_float(tgt_mode) ? (get_mode_size_bits(tgt_mode) == 32 ? "ss" : "sd") : "si";
1039
1040         switch(get_ia32_op_type(irn)) {
1041                 case ia32_Normal:
1042                         lc_esnprintf(env, buf, sizeof(buf), "%1D, %3S", irn, irn);
1043                         break;
1044                 case ia32_AddrModeS:
1045                         lc_esnprintf(env, buf, sizeof(buf), "%1D, %s", irn, ia32_emit_am(irn, emit_env));
1046                         break;
1047                 default:
1048                         assert(0 && "unsupported op type for Conv");
1049         }
1050
1051         snprintf(cmd_buf, SNPRINTF_BUF_LEN, "cvt%s2%s %s", from, to, buf);
1052         lc_esnprintf(env, cmnt_buf, SNPRINTF_BUF_LEN, "/* %+F(%+F, %+F) */", irn, src_mode, tgt_mode);
1053         IA32_DO_EMIT;
1054 }
1055
1056 void emit_ia32_Conv_I2FP(const ir_node *irn, ia32_emit_env_t *emit_env) {
1057         emit_ia32_Conv_with_FP(irn, emit_env);
1058 }
1059
1060 void emit_ia32_Conv_FP2I(const ir_node *irn, ia32_emit_env_t *emit_env) {
1061         emit_ia32_Conv_with_FP(irn, emit_env);
1062 }
1063
1064 void emit_ia32_Conv_FP2FP(const ir_node *irn, ia32_emit_env_t *emit_env) {
1065         emit_ia32_Conv_with_FP(irn, emit_env);
1066 }
1067
1068 /**
1069  * Emits code for an Int conversion.
1070  */
1071 void emit_ia32_Conv_I2I(const ir_node *irn, ia32_emit_env_t *emit_env) {
1072         FILE               *F    = emit_env->out;
1073         const lc_arg_env_t *env  = ia32_get_arg_env();
1074         char *move_cmd, *conv_cmd;
1075         ir_mode *src_mode, *tgt_mode;
1076         int n, m;
1077         char cmd_buf[SNPRINTF_BUF_LEN], cmnt_buf[SNPRINTF_BUF_LEN];
1078         const arch_register_t *in_reg, *out_reg;
1079
1080         src_mode = is_ia32_AddrModeS(irn) ? get_ia32_ls_mode(irn) : get_irn_mode(get_irn_n(irn, 2));
1081         tgt_mode = get_ia32_res_mode(irn);
1082
1083         n = get_mode_size_bits(src_mode);
1084         m = get_mode_size_bits(tgt_mode);
1085
1086         if (mode_is_signed(n < m ? src_mode : tgt_mode)) {
1087                 move_cmd = "movsx";
1088                 if (n == 8 || m == 8)
1089                         conv_cmd = "cbw";
1090                 else if (n == 16 || m == 16)
1091                         conv_cmd = "cwde";
1092                 else
1093                         assert(0 && "unsupported Conv_I2I");
1094         }
1095         else {
1096                 move_cmd = "movzx";
1097                 conv_cmd = NULL;
1098         }
1099
1100         switch(get_ia32_op_type(irn)) {
1101                 case ia32_Normal:
1102                         in_reg  = get_in_reg(irn, 2);
1103                         out_reg = get_out_reg(irn, 0);
1104
1105                         if (REGS_ARE_EQUAL(in_reg, &ia32_gp_regs[REG_EAX]) &&
1106                                 REGS_ARE_EQUAL(out_reg, in_reg)                &&
1107                                 mode_is_signed(n < m ? src_mode : tgt_mode))
1108                         {
1109                                 /* argument and result are both in EAX and */
1110                                 /* signedness is ok: -> use converts       */
1111                                 lc_esnprintf(env, cmd_buf, SNPRINTF_BUF_LEN, "%s", conv_cmd);
1112                         }
1113                         else if (REGS_ARE_EQUAL(out_reg, in_reg) &&
1114                                 ! mode_is_signed(n < m ? src_mode : tgt_mode))
1115                         {
1116                                 /* argument and result are in the same register */
1117                                 /* and signedness is ok: -> use and with mask   */
1118                                 int mask = (1 << (n < m ? n : m)) - 1;
1119                                 lc_esnprintf(env, cmd_buf, SNPRINTF_BUF_LEN, "and %1D, 0x%x", irn, mask);
1120                         }
1121                         else {
1122                                 /* use move w/o sign extension */
1123                                 lc_esnprintf(env, cmd_buf, SNPRINTF_BUF_LEN, "%s %1D, %%%s",
1124                                         move_cmd, irn, ia32_get_reg_name_for_mode(emit_env, n < m ? src_mode : tgt_mode, in_reg));
1125                         }
1126
1127                         break;
1128                 case ia32_AddrModeS:
1129                         lc_esnprintf(env, cmd_buf, SNPRINTF_BUF_LEN, "%s %1D, %s",
1130                                 move_cmd, irn, ia32_emit_am(irn, emit_env));
1131                         break;
1132                 default:
1133                         assert(0 && "unsupported op type for Conv");
1134         }
1135
1136         lc_esnprintf(env, cmnt_buf, SNPRINTF_BUF_LEN, "/* %+F(%d Bit mode_%F -> %d Bit mode_%F) */",
1137                 irn, n, src_mode, m, tgt_mode);
1138
1139         IA32_DO_EMIT;
1140 }
1141
1142 /*******************************************
1143  *  _                          _
1144  * | |                        | |
1145  * | |__   ___ _ __   ___   __| | ___  ___
1146  * | '_ \ / _ \ '_ \ / _ \ / _` |/ _ \/ __|
1147  * | |_) |  __/ | | | (_) | (_| |  __/\__ \
1148  * |_.__/ \___|_| |_|\___/ \__,_|\___||___/
1149  *
1150  *******************************************/
1151
1152 /**
1153  * Emits a backend call
1154  */
1155 void emit_be_Call(const ir_node *irn, ia32_emit_env_t *emit_env) {
1156         FILE *F = emit_env->out;
1157         entity *ent = be_Call_get_entity(irn);
1158         char cmd_buf[SNPRINTF_BUF_LEN], cmnt_buf[SNPRINTF_BUF_LEN];
1159
1160         if (ent) {
1161                 snprintf(cmd_buf, SNPRINTF_BUF_LEN, "call %s", get_entity_name(ent));
1162         }
1163         else {
1164                 lc_esnprintf(ia32_get_arg_env(), cmd_buf, SNPRINTF_BUF_LEN, "%1D", get_irn_n(irn, be_pos_Call_ptr));
1165         }
1166
1167         lc_esnprintf(ia32_get_arg_env(), cmnt_buf, SNPRINTF_BUF_LEN, "/* %+F (be_Call) */", irn);
1168
1169         IA32_DO_EMIT;
1170 }
1171
1172 /**
1173  * Emits code to increase stack pointer.
1174  */
1175 void emit_be_IncSP(const ir_node *irn, ia32_emit_env_t *emit_env) {
1176         FILE          *F    = emit_env->out;
1177         unsigned       offs = be_get_IncSP_offset(irn);
1178         be_stack_dir_t dir  = be_get_IncSP_direction(irn);
1179         char cmd_buf[SNPRINTF_BUF_LEN], cmnt_buf[SNPRINTF_BUF_LEN];
1180
1181         if (offs) {
1182                 lc_esnprintf(ia32_get_arg_env(), cmd_buf, SNPRINTF_BUF_LEN, "add %1S,%s%u", irn,
1183                         (dir == be_stack_dir_along) ? " -" : " ", offs);
1184                 lc_esnprintf(ia32_get_arg_env(), cmnt_buf, SNPRINTF_BUF_LEN, "/* %+F (IncSP) */", irn);
1185         }
1186         else {
1187                 snprintf(cmd_buf, SNPRINTF_BUF_LEN, " ");
1188                 lc_esnprintf(ia32_get_arg_env(), cmnt_buf, SNPRINTF_BUF_LEN, "/* omitted %+F (IncSP) with 0 */", irn);
1189         }
1190
1191         IA32_DO_EMIT;
1192 }
1193
1194 /**
1195  * Emits code to set stack pointer.
1196  */
1197 void emit_be_SetSP(const ir_node *irn, ia32_emit_env_t *emit_env) {
1198         FILE *F = emit_env->out;
1199         char cmd_buf[SNPRINTF_BUF_LEN], cmnt_buf[SNPRINTF_BUF_LEN];
1200
1201         lc_esnprintf(ia32_get_arg_env(), cmd_buf, SNPRINTF_BUF_LEN, "mov %1D, %3S", irn, irn);
1202         lc_esnprintf(ia32_get_arg_env(), cmnt_buf, SNPRINTF_BUF_LEN, "/* %+F (restore SP) */", irn);
1203         IA32_DO_EMIT;
1204 }
1205
1206 /**
1207  * Emits code for Copy.
1208  */
1209 void emit_be_Copy(const ir_node *irn, ia32_emit_env_t *emit_env) {
1210         FILE *F = emit_env->out;
1211         char cmd_buf[SNPRINTF_BUF_LEN], cmnt_buf[SNPRINTF_BUF_LEN];
1212
1213         lc_esnprintf(ia32_get_arg_env(), cmd_buf, SNPRINTF_BUF_LEN, "mov %1D, %1S", irn, irn);
1214         lc_esnprintf(ia32_get_arg_env(), cmnt_buf, SNPRINTF_BUF_LEN, "/* %+F */", irn);
1215         IA32_DO_EMIT;
1216 }
1217
1218 /**
1219  * Emits code for exchange.
1220  */
1221 void emit_be_Perm(const ir_node *irn, ia32_emit_env_t *emit_env) {
1222         FILE *F = emit_env->out;
1223         char cmd_buf[SNPRINTF_BUF_LEN], cmnt_buf[SNPRINTF_BUF_LEN];
1224
1225         lc_esnprintf(ia32_get_arg_env(), cmd_buf, SNPRINTF_BUF_LEN, "xchg %1S, %2S", irn, irn);
1226         lc_esnprintf(ia32_get_arg_env(), cmnt_buf, SNPRINTF_BUF_LEN, "/* %+F(%1A, %2A) */", irn, irn, irn);
1227         IA32_DO_EMIT;
1228 }
1229
1230 /***********************************************************************************
1231  *                  _          __                                             _
1232  *                 (_)        / _|                                           | |
1233  *  _ __ ___   __ _ _ _ __   | |_ _ __ __ _ _ __ ___   _____      _____  _ __| | __
1234  * | '_ ` _ \ / _` | | '_ \  |  _| '__/ _` | '_ ` _ \ / _ \ \ /\ / / _ \| '__| |/ /
1235  * | | | | | | (_| | | | | | | | | | | (_| | | | | | |  __/\ V  V / (_) | |  |   <
1236  * |_| |_| |_|\__,_|_|_| |_| |_| |_|  \__,_|_| |_| |_|\___| \_/\_/ \___/|_|  |_|\_\
1237  *
1238  ***********************************************************************************/
1239
1240 /**
1241  * Enters the emitter functions for handled nodes into the generic
1242  * pointer of an opcode.
1243  */
1244 static void ia32_register_emitters(void) {
1245
1246 #define IA32_EMIT(a) op_ia32_##a->ops.generic = (op_func)emit_ia32_##a
1247 #define EMIT(a)      op_##a->ops.generic = (op_func)emit_##a
1248 #define BE_EMIT(a)   op_be_##a->ops.generic = (op_func)emit_be_##a
1249
1250         /* first clear the generic function pointer for all ops */
1251         clear_irp_opcodes_generic_func();
1252
1253         /* register all emitter functions defined in spec */
1254         ia32_register_spec_emitters();
1255
1256         /* other ia32 emitter functions */
1257         IA32_EMIT(CondJmp);
1258         IA32_EMIT(TestJmp);
1259         IA32_EMIT(CJmp);
1260         IA32_EMIT(CJmpAM);
1261         IA32_EMIT(SwitchJmp);
1262         IA32_EMIT(CopyB);
1263         IA32_EMIT(CopyB_i);
1264         IA32_EMIT(Conv_I2FP);
1265         IA32_EMIT(Conv_FP2I);
1266         IA32_EMIT(Conv_FP2FP);
1267         IA32_EMIT(Conv_I2I);
1268
1269         /* benode emitter */
1270         BE_EMIT(Call);
1271         BE_EMIT(IncSP);
1272         BE_EMIT(SetSP);
1273         BE_EMIT(Copy);
1274         BE_EMIT(Perm);
1275
1276         /* firm emitter */
1277         EMIT(Jmp);
1278         EMIT(Proj);
1279
1280 #undef IA32_EMIT
1281 #undef BE_EMIT
1282 #undef EMIT
1283 }
1284
1285 /**
1286  * Emits code for a node.
1287  */
1288 static void ia32_emit_node(const ir_node *irn, void *env) {
1289         ia32_emit_env_t        *emit_env = env;
1290         firm_dbg_module_t *mod      = emit_env->mod;
1291         FILE              *F        = emit_env->out;
1292         ir_op             *op       = get_irn_op(irn);
1293
1294         DBG((mod, LEVEL_1, "emitting code for %+F\n", irn));
1295
1296         if (op->ops.generic) {
1297                 void (*emit)(const ir_node *, void *) = (void (*)(const ir_node *, void *))op->ops.generic;
1298                 (*emit)(irn, env);
1299         }
1300         else {
1301                 ir_fprintf(F, "\t%35s /* %+F */\n", " ", irn);
1302         }
1303 }
1304
1305 /**
1306  * Walks over the nodes in a block connected by scheduling edges
1307  * and emits code for each node.
1308  */
1309 static void ia32_gen_block(ir_node *block, void *env) {
1310         const ir_node *irn;
1311
1312         if (! is_Block(block))
1313                 return;
1314
1315         fprintf(((ia32_emit_env_t *)env)->out, BLOCK_PREFIX("%ld:\n"), get_irn_node_nr(block));
1316         sched_foreach(block, irn) {
1317                 ia32_emit_node(irn, env);
1318         }
1319 }
1320
1321 /**
1322  * Emits code for function start.
1323  */
1324 static void ia32_emit_func_prolog(FILE *F, ir_graph *irg) {
1325         entity     *irg_ent  = get_irg_entity(irg);
1326         const char *irg_name = get_entity_name(irg_ent);
1327
1328         fprintf(F, "\t.text\n");
1329         if (get_entity_visibility(irg_ent) == visibility_external_visible) {
1330                 fprintf(F, ".globl %s\n", irg_name);
1331         }
1332         fprintf(F, "\t.type\t%s, @function\n", irg_name);
1333         fprintf(F, "%s:\n", irg_name);
1334 }
1335
1336 /**
1337  * Emits code for function end
1338  */
1339 static void ia32_emit_func_epilog(FILE *F, ir_graph *irg) {
1340         const char *irg_name = get_entity_name(get_irg_entity(irg));
1341
1342         fprintf(F, "\tret\n");
1343         fprintf(F, "\t.size\t%s, .-%s\n\n", irg_name, irg_name);
1344 }
1345
1346 /**
1347  * Block-walker:
1348  * Sets labels for control flow nodes (jump target)
1349  * TODO: Jump optimization
1350  */
1351 static void ia32_gen_labels(ir_node *block, void *env) {
1352         ir_node *pred;
1353         int n = get_Block_n_cfgpreds(block);
1354
1355         for (n--; n >= 0; n--) {
1356                 pred = get_Block_cfgpred(block, n);
1357                 set_irn_link(pred, block);
1358         }
1359 }
1360
1361 typedef struct {
1362         ir_node *start;
1363         ir_node *end;
1364 } anchor;
1365
1366 /**
1367  * Ext-Block walker: create a block schedule
1368  */
1369 static void create_block_list(ir_extblk *blk, void *env) {
1370         anchor *list = env;
1371         int i, n;
1372
1373         for (i = 0, n = get_extbb_n_blocks(blk); i < n; ++i) {
1374                 ir_node *block = get_extbb_block(blk, i);
1375
1376                 set_irn_link(block, NULL);
1377                 if (list->start)
1378                         set_irn_link(list->end, block);
1379                 else
1380                         list->start = block;
1381
1382                 list->end = block;
1383         }
1384 }
1385
1386 /**
1387  * Main driver. Emits the code for one routine.
1388  */
1389 void ia32_gen_routine(FILE *F, ir_graph *irg, const ia32_code_gen_t *cg) {
1390         ia32_emit_env_t emit_env;
1391         anchor list;
1392         ir_node *block;
1393
1394         emit_env.mod      = firm_dbg_register("firm.be.ia32.emitter");
1395         emit_env.out      = F;
1396         emit_env.arch_env = cg->arch_env;
1397         emit_env.cg       = cg;
1398         emit_env.isa      = (ia32_isa_t *)cg->arch_env->isa;
1399
1400         /* set the global arch_env (needed by print hooks) */
1401         arch_env = cg->arch_env;
1402
1403         ia32_register_emitters();
1404
1405         ia32_emit_func_prolog(F, irg);
1406         irg_block_walk_graph(irg, ia32_gen_labels, NULL, &emit_env);
1407
1408         if (cg->opt.extbb) {
1409                 /* schedule extended basic blocks */
1410
1411                 compute_extbb(irg);
1412
1413                 list.start = NULL;
1414                 list.end   = NULL;
1415                 irg_extblock_walk_graph(irg, NULL, create_block_list, &list);
1416
1417                 have_block_sched = 1;
1418                 for (block = list.start; block; block = get_irn_link(block))
1419                         ia32_gen_block(block, &emit_env);
1420         }
1421         else {
1422                 /* "normal" block schedule */
1423
1424                 have_block_sched = 0;
1425                 irg_walk_blkwise_graph(irg, NULL, ia32_gen_block, &emit_env);
1426         }
1427
1428         ia32_emit_func_epilog(F, irg);
1429 }