allow character mode constants
[libfirm] / ir / be / ia32 / ia32_emitter.c
1 /**
2  * @file
3  * @brief   This file implements the node emitter.
4  * @author  Christian Wuerdig, Matthias Braun
5  * @version $Id$
6  */
7 #ifdef HAVE_CONFIG_H
8 #include "config.h"
9 #endif
10
11 #include <limits.h>
12
13 #include "xmalloc.h"
14 #include "tv.h"
15 #include "iredges.h"
16 #include "debug.h"
17 #include "irgwalk.h"
18 #include "irprintf.h"
19 #include "irop_t.h"
20 #include "irargs_t.h"
21 #include "irprog_t.h"
22 #include "iredges_t.h"
23 #include "execfreq.h"
24 #include "error.h"
25 #include "raw_bitset.h"
26
27 #include "../besched_t.h"
28 #include "../benode_t.h"
29 #include "../beabi.h"
30 #include "../be_dbgout.h"
31 #include "../beemitter.h"
32 #include "../begnuas.h"
33 #include "../beirg_t.h"
34
35 #include "ia32_emitter.h"
36 #include "gen_ia32_emitter.h"
37 #include "gen_ia32_regalloc_if.h"
38 #include "ia32_nodes_attr.h"
39 #include "ia32_new_nodes.h"
40 #include "ia32_map_regs.h"
41 #include "bearch_ia32_t.h"
42
43 DEBUG_ONLY(static firm_dbg_module_t *dbg = NULL;)
44
45 #define BLOCK_PREFIX ".L"
46
47 #define SNPRINTF_BUF_LEN 128
48
49 /**
50  * Returns the register at in position pos.
51  */
52 static
53 const arch_register_t *get_in_reg(ia32_emit_env_t *env, const ir_node *irn,
54                                   int pos)
55 {
56         const arch_env_t       *arch_env = env->arch_env;
57         ir_node                *op;
58         const arch_register_t  *reg = NULL;
59
60         assert(get_irn_arity(irn) > pos && "Invalid IN position");
61
62         /* The out register of the operator at position pos is the
63            in register we need. */
64         op = get_irn_n(irn, pos);
65
66         reg = arch_get_irn_register(arch_env, op);
67
68         assert(reg && "no in register found");
69
70         /* in case of a joker register: just return a valid register */
71         if (arch_register_type_is(reg, joker)) {
72                 const arch_register_req_t *req;
73
74                 /* ask for the requirements */
75                 req = arch_get_register_req(arch_env, irn, pos);
76
77                 if (arch_register_req_is(req, limited)) {
78                         /* in case of limited requirements: get the first allowed register */
79                         unsigned idx = rbitset_next(req->limited, 0, 1);
80                         reg = arch_register_for_index(req->cls, idx);
81                 } else {
82                         /* otherwise get first register in class */
83                         reg = arch_register_for_index(req->cls, 0);
84                 }
85         }
86
87         return reg;
88 }
89
90 /**
91  * Returns the register at out position pos.
92  */
93 static
94 const arch_register_t *get_out_reg(ia32_emit_env_t *env, const ir_node *irn,
95                                    int pos)
96 {
97         const arch_env_t      *arch_env = env->arch_env;
98         ir_node               *proj;
99         const arch_register_t *reg = NULL;
100
101         /* 1st case: irn is not of mode_T, so it has only                 */
102         /*           one OUT register -> good                             */
103         /* 2nd case: irn is of mode_T -> collect all Projs and ask the    */
104         /*           Proj with the corresponding projnum for the register */
105
106         if (get_irn_mode(irn) != mode_T) {
107                 reg = arch_get_irn_register(arch_env, irn);
108         } else if (is_ia32_irn(irn)) {
109                 reg = get_ia32_out_reg(irn, pos);
110         } else {
111                 const ir_edge_t *edge;
112
113                 foreach_out_edge(irn, edge) {
114                         proj = get_edge_src_irn(edge);
115                         assert(is_Proj(proj) && "non-Proj from mode_T node");
116                         if (get_Proj_proj(proj) == pos) {
117                                 reg = arch_get_irn_register(arch_env, proj);
118                                 break;
119                         }
120                 }
121         }
122
123         assert(reg && "no out register found");
124         return reg;
125 }
126
127 /**
128  * Returns an ident for the given tarval tv.
129  */
130 static
131 ident *get_ident_for_tv(tarval *tv) {
132         char buf[256];
133         tarval_snprintf(buf, sizeof(buf), tv);
134         return new_id_from_str(buf);
135 }
136
137 /**
138  * Determine the gnu assembler suffix that indicates a mode
139  */
140 static
141 char get_mode_suffix(const ir_mode *mode) {
142         if(mode_is_float(mode)) {
143                 switch(get_mode_size_bits(mode)) {
144                 case 32:
145                         return 's';
146                 case 64:
147                         return 'l';
148                 case 80:
149                         return 't';
150                 }
151         } else {
152                 assert(mode_is_int(mode) || mode_is_reference(mode) || mode_is_character(mode));
153                 switch(get_mode_size_bits(mode)) {
154                 case 64:
155                         return 'q';
156                 case 32:
157                         return 'l';
158                 case 16:
159                         return 'w';
160                 case 8:
161                         return 'b';
162                 }
163         }
164         panic("Can't output mode_suffix for %+F\n", mode);
165 }
166
167 static
168 int produces_result(const ir_node *node) {
169         return !(is_ia32_St(node) ||
170                 is_ia32_Store8Bit(node) ||
171                 is_ia32_CondJmp(node) ||
172                 is_ia32_xCondJmp(node) ||
173                 is_ia32_CmpSet(node) ||
174                 is_ia32_xCmpSet(node) ||
175                 is_ia32_SwitchJmp(node));
176 }
177
178 static
179 const char *ia32_get_reg_name_for_mode(ia32_emit_env_t *env, ir_mode *mode,
180                                        const arch_register_t *reg) {
181         switch(get_mode_size_bits(mode)) {
182                 case 8:
183                         return ia32_get_mapped_reg_name(env->isa->regs_8bit, reg);
184                 case 16:
185                         return ia32_get_mapped_reg_name(env->isa->regs_16bit, reg);
186                 default:
187                         return (char *)arch_register_get_name(reg);
188         }
189 }
190
191 /**
192  * Add a number to a prefix. This number will not be used a second time.
193  */
194 static
195 char *get_unique_label(char *buf, size_t buflen, const char *prefix) {
196         static unsigned long id = 0;
197         snprintf(buf, buflen, "%s%lu", prefix, ++id);
198         return buf;
199 }
200
201 /*************************************************************
202  *             _       _    __   _          _
203  *            (_)     | |  / _| | |        | |
204  *  _ __  _ __ _ _ __ | |_| |_  | |__   ___| |_ __   ___ _ __
205  * | '_ \| '__| | '_ \| __|  _| | '_ \ / _ \ | '_ \ / _ \ '__|
206  * | |_) | |  | | | | | |_| |   | | | |  __/ | |_) |  __/ |
207  * | .__/|_|  |_|_| |_|\__|_|   |_| |_|\___|_| .__/ \___|_|
208  * | |                                       | |
209  * |_|                                       |_|
210  *************************************************************/
211
212 // we have no C++ and can't define an implicit ia32_emit_env_t* cast to
213 // be_emit_env_t* so we cheat a bit...
214 #define be_emit_char(env,c)             be_emit_char(env->emit,c)
215 #define be_emit_string(env,s)           be_emit_string(env->emit,s)
216 #undef be_emit_cstring
217 #define be_emit_cstring(env,x)          { be_emit_string_len(env->emit, x, sizeof(x)-1); }
218 #define be_emit_ident(env,i)            be_emit_ident(env->emit,i)
219 #define be_emit_write_line(env)         be_emit_write_line(env->emit)
220 #define be_emit_finish_line_gas(env,n)  be_emit_finish_line_gas(env->emit,n)
221 #define be_emit_pad_comment(env)        be_emit_pad_comment(env->emit)
222
223 void ia32_emit_source_register(ia32_emit_env_t *env, const ir_node *node, int pos)
224 {
225         const arch_register_t *reg = get_in_reg(env, node, pos);
226         const char *reg_name = arch_register_get_name(reg);
227
228         assert(pos < get_irn_arity(node));
229
230         be_emit_char(env, '%');
231         be_emit_string(env, reg_name);
232 }
233
234 void ia32_emit_dest_register(ia32_emit_env_t *env, const ir_node *node, int pos) {
235         const arch_register_t *reg = get_out_reg(env, node, pos);
236         const char *reg_name = arch_register_get_name(reg);
237
238         be_emit_char(env, '%');
239         be_emit_string(env, reg_name);
240 }
241
242 void ia32_emit_x87_name(ia32_emit_env_t *env, const ir_node *node, int pos)
243 {
244         ia32_attr_t *attr = get_ia32_attr(node);
245
246         assert(pos < 3);
247         be_emit_char(env, '%');
248         be_emit_string(env, attr->x87[pos]->name);
249 }
250
251 void ia32_emit_immediate(ia32_emit_env_t *env, const ir_node *node)
252 {
253         tarval *tv;
254         ir_entity *ent;
255         ident *id;
256
257         be_emit_char(env, '$');
258
259         switch(get_ia32_immop_type(node)) {
260         case ia32_ImmConst:
261                 tv = get_ia32_Immop_tarval(node);
262                 id = get_ident_for_tv(tv);
263                 break;
264         case ia32_ImmSymConst:
265                 ent = get_ia32_Immop_symconst(node);
266                 mark_entity_visited(ent);
267                 id = get_entity_ld_ident(ent);
268                 break;
269         default:
270                 assert(0);
271                 be_emit_string(env, "BAD");
272                 return;
273         }
274
275         be_emit_ident(env, id);
276 }
277
278 void ia32_emit_mode_suffix(ia32_emit_env_t *env, const ir_mode *mode)
279 {
280         be_emit_char(env, get_mode_suffix(mode));
281 }
282
283 void ia32_emit_x87_mode_suffix(ia32_emit_env_t *env, const ir_node *node)
284 {
285         ir_mode *mode = get_ia32_ls_mode(node);
286         if(mode != NULL)
287                 ia32_emit_mode_suffix(env, mode);
288 }
289
290 static
291 char get_xmm_mode_suffix(ir_mode *mode)
292 {
293         assert(mode_is_float(mode));
294         switch(get_mode_size_bits(mode)) {
295         case 32:
296                 return 's';
297         case 64:
298                 return 'd';
299         default:
300                 assert(0);
301         }
302         return '%';
303 }
304
305 void ia32_emit_xmm_mode_suffix(ia32_emit_env_t *env, const ir_node *node)
306 {
307         ir_mode *mode = get_ia32_ls_mode(node);
308         assert(mode != NULL);
309         be_emit_char(env, 's');
310         be_emit_char(env, get_xmm_mode_suffix(mode));
311 }
312
313 void ia32_emit_xmm_mode_suffix_s(ia32_emit_env_t *env, const ir_node *node)
314 {
315         ir_mode *mode = get_ia32_ls_mode(node);
316         assert(mode != NULL);
317         be_emit_char(env, get_xmm_mode_suffix(mode));
318 }
319
320 void ia32_emit_extend_suffix(ia32_emit_env_t *env, const ir_mode *mode)
321 {
322         if(get_mode_size_bits(mode) == 32)
323                 return;
324         if(mode_is_signed(mode)) {
325                 be_emit_char(env, 's');
326         } else {
327                 be_emit_char(env, 'z');
328         }
329 }
330
331 static
332 void ia32_emit_function_object(ia32_emit_env_t *env, const char *name)
333 {
334         switch (be_gas_flavour) {
335         case GAS_FLAVOUR_NORMAL:
336                 be_emit_cstring(env, "\t.type\t");
337                 be_emit_string(env, name);
338                 be_emit_cstring(env, ", @function\n");
339                 be_emit_write_line(env);
340                 break;
341         case GAS_FLAVOUR_MINGW:
342                 be_emit_cstring(env, "\t.def\t");
343                 be_emit_string(env, name);
344                 be_emit_cstring(env, ";\t.scl\t2;\t.type\t32;\t.endef\n");
345                 be_emit_write_line(env);
346                 break;
347         default:
348                 break;
349         }
350 }
351
352 static
353 void ia32_emit_function_size(ia32_emit_env_t *env, const char *name)
354 {
355         switch (be_gas_flavour) {
356         case GAS_FLAVOUR_NORMAL:
357                 be_emit_cstring(env, "\t.size\t");
358                 be_emit_string(env, name);
359                 be_emit_cstring(env, ", .-");
360                 be_emit_string(env, name);
361                 be_emit_char(env, '\n');
362                 be_emit_write_line(env);
363                 break;
364         default:
365                 break;
366         }
367 }
368
369
370
371 /**
372  * Emits registers and/or address mode of a binary operation.
373  */
374 void ia32_emit_binop(ia32_emit_env_t *env, const ir_node *node) {
375         switch(get_ia32_op_type(node)) {
376                 case ia32_Normal:
377                         if (is_ia32_ImmConst(node) || is_ia32_ImmSymConst(node)) {
378                                 ia32_emit_immediate(env, node);
379                                 be_emit_cstring(env, ", ");
380                                 ia32_emit_source_register(env, node, 2);
381                         } else {
382                                 const arch_register_t *in1 = get_in_reg(env, node, 2);
383                                 const arch_register_t *in2 = get_in_reg(env, node, 3);
384                                 const arch_register_t *out = produces_result(node) ? get_out_reg(env, node, 0) : NULL;
385                                 const arch_register_t *in;
386                                 const char            *in_name;
387
388                                 in      = out ? (REGS_ARE_EQUAL(out, in2) ? in1 : in2) : in2;
389                                 out     = out ? out : in1;
390                                 in_name = arch_register_get_name(in);
391
392                                 if (is_ia32_emit_cl(node)) {
393                                         assert(REGS_ARE_EQUAL(&ia32_gp_regs[REG_ECX], in) && "shift operation needs ecx");
394                                         in_name = "cl";
395                                 }
396
397                                 be_emit_char(env, '%');
398                                 be_emit_string(env, in_name);
399                                 be_emit_cstring(env, ", %");
400                                 be_emit_string(env, arch_register_get_name(out));
401                         }
402                         break;
403                 case ia32_AddrModeS:
404                         ia32_emit_am(env, node);
405                         be_emit_cstring(env, ", ");
406                         if (is_ia32_ImmConst(node) || is_ia32_ImmSymConst(node)) {
407                                 assert(!produces_result(node) && "Source AM with Const must not produce result");
408                                 ia32_emit_immediate(env, node);
409                         } else if (produces_result(node)) {
410                                 ia32_emit_dest_register(env, node, 0);
411                         } else {
412                                 ia32_emit_source_register(env, node, 2);
413                         }
414                         break;
415                 case ia32_AddrModeD:
416                         if (is_ia32_ImmConst(node) || is_ia32_ImmSymConst(node)) {
417                                 ia32_emit_immediate(env, node);
418                                 be_emit_cstring(env, ", ");
419                                 ia32_emit_am(env, node);
420                         } else {
421                                 const arch_register_t *in1 = get_in_reg(env, node,
422                                                                         get_irn_arity(node) == 5 ? 3 : 2);
423                                 ir_mode               *mode = get_ia32_ls_mode(node);
424                                 const char            *in_name;
425
426                                 in_name = ia32_get_reg_name_for_mode(env, mode, in1);
427
428                                 if (is_ia32_emit_cl(node)) {
429                                         assert(REGS_ARE_EQUAL(&ia32_gp_regs[REG_ECX], in1) && "shift operation needs ecx");
430                                         in_name = "cl";
431                                 }
432
433                                 be_emit_char(env, '%');
434                                 be_emit_string(env, in_name);
435                                 be_emit_cstring(env, ", ");
436                                 ia32_emit_am(env, node);
437                         }
438                         break;
439                 default:
440                         assert(0 && "unsupported op type");
441         }
442 }
443
444 /**
445  * Emits registers and/or address mode of a binary operation.
446  */
447 void ia32_emit_x87_binop(ia32_emit_env_t *env, const ir_node *node) {
448         switch(get_ia32_op_type(node)) {
449                 case ia32_Normal:
450                         if (is_ia32_ImmConst(node) || is_ia32_ImmSymConst(node)) {
451                                 // should not happen...
452                                 assert(0);
453                         } else {
454                                 ia32_attr_t *attr = get_ia32_attr(node);
455                                 const arch_register_t *in1 = attr->x87[0];
456                                 const arch_register_t *in2 = attr->x87[1];
457                                 const arch_register_t *out = attr->x87[2];
458                                 const arch_register_t *in;
459
460                                 in  = out ? (REGS_ARE_EQUAL(out, in2) ? in1 : in2) : in2;
461                                 out = out ? out : in1;
462
463                                 be_emit_char(env, '%');
464                                 be_emit_string(env, arch_register_get_name(in));
465                                 be_emit_cstring(env, ", %");
466                                 be_emit_string(env, arch_register_get_name(out));
467                         }
468                         break;
469                 case ia32_AddrModeS:
470                 case ia32_AddrModeD:
471                         ia32_emit_am(env, node);
472                         break;
473                 default:
474                         assert(0 && "unsupported op type");
475         }
476 }
477
478 /**
479  * Emits registers and/or address mode of a unary operation.
480  */
481 void ia32_emit_unop(ia32_emit_env_t *env, const ir_node *node) {
482         switch(get_ia32_op_type(node)) {
483                 case ia32_Normal:
484                         if (is_ia32_ImmConst(node) || is_ia32_ImmSymConst(node)) {
485                                 ia32_emit_immediate(env, node);
486                         } else {
487                                 if (is_ia32_Mul(node) || is_ia32_IMul1OP(node)) {
488                                         ia32_emit_source_register(env, node, 3);
489                                 } else if(is_ia32_IDiv(node) || is_ia32_Div(node)) {
490                                         ia32_emit_source_register(env, node, 4);
491                                 } else if(is_ia32_Push(node)) {
492                                         ia32_emit_source_register(env, node, 2);
493                                 } else if(is_ia32_Pop(node)) {
494                                         ia32_emit_dest_register(env, node, 1);
495                                 } else {
496                                         ia32_emit_dest_register(env, node, 0);
497                                 }
498                         }
499                         break;
500                 case ia32_AddrModeS:
501                 case ia32_AddrModeD:
502                         ia32_emit_am(env, node);
503                         break;
504                 default:
505                         assert(0 && "unsupported op type");
506         }
507 }
508
509 /**
510  * Emits address mode.
511  */
512 void ia32_emit_am(ia32_emit_env_t *env, const ir_node *node) {
513         ia32_am_flavour_t am_flav = get_ia32_am_flavour(node);
514         ir_entity *ent = get_ia32_am_sc(node);
515         int offs = get_ia32_am_offs_int(node);
516
517         /* just to be sure... */
518         assert(!is_ia32_use_frame(node) || get_ia32_frame_ent(node) != NULL);
519
520         /* emit offset */
521         if (ent != NULL) {
522                 ident *id;
523
524                 mark_entity_visited(ent);
525                 id = get_entity_ld_ident(ent);
526                 if (is_ia32_am_sc_sign(node))
527                         be_emit_char(env, '-');
528                 be_emit_ident(env, id);
529
530                 if(get_entity_owner(ent) == get_tls_type()) {
531                         if (get_entity_visibility(ent) == visibility_external_allocated) {
532                                 be_emit_cstring(env, "@INDNTPOFF");
533                         } else {
534                                 be_emit_cstring(env, "@NTPOFF");
535                         }
536                 }
537         }
538
539         if(offs != 0) {
540                 if(ent != NULL) {
541                         be_emit_irprintf(env->emit, "%+d", offs);
542                 } else {
543                         be_emit_irprintf(env->emit, "%d", offs);
544                 }
545         }
546
547         if (am_flav & (ia32_B | ia32_I)) {
548                 be_emit_char(env, '(');
549
550                 /* emit base */
551                 if (am_flav & ia32_B) {
552                         ia32_emit_source_register(env, node, 0);
553                 }
554
555                 /* emit index + scale */
556                 if (am_flav & ia32_I) {
557                         be_emit_char(env, ',');
558                         ia32_emit_source_register(env, node, 1);
559
560                         if (am_flav & ia32_S) {
561                                 be_emit_irprintf(env->emit, ",%d", 1 << get_ia32_am_scale(node));
562                         }
563                 }
564                 be_emit_char(env, ')');
565         }
566 }
567
568 /*************************************************
569  *                 _ _                         _
570  *                (_) |                       | |
571  *   ___ _ __ ___  _| |_    ___ ___  _ __   __| |
572  *  / _ \ '_ ` _ \| | __|  / __/ _ \| '_ \ / _` |
573  * |  __/ | | | | | | |_  | (_| (_) | | | | (_| |
574  *  \___|_| |_| |_|_|\__|  \___\___/|_| |_|\__,_|
575  *
576  *************************************************/
577
578 #undef IA32_DO_EMIT
579 #define IA32_DO_EMIT(irn) ia32_fprintf_format(F, irn, cmd_buf, cmnt_buf)
580
581 /*
582  * coding of conditions
583  */
584 struct cmp2conditon_t {
585         const char *name;
586         pn_Cmp      num;
587 };
588
589 /*
590  * positive conditions for signed compares
591  */
592 static
593 const struct cmp2conditon_t cmp2condition_s[] = {
594         { NULL,              pn_Cmp_False },  /* always false */
595         { "e",               pn_Cmp_Eq },     /* == */
596         { "l",               pn_Cmp_Lt },     /* < */
597         { "le",              pn_Cmp_Le },     /* <= */
598         { "g",               pn_Cmp_Gt },     /* > */
599         { "ge",              pn_Cmp_Ge },     /* >= */
600         { "ne",              pn_Cmp_Lg },     /* != */
601         { NULL,              pn_Cmp_Leg},     /* Floating point: ordered */
602         { NULL,              pn_Cmp_Uo },     /* Floating point: unordered */
603         { "e",               pn_Cmp_Ue },     /* Floating point: unordered or == */
604         { "b",               pn_Cmp_Ul },     /* Floating point: unordered or < */
605         { "be",              pn_Cmp_Ule },    /* Floating point: unordered or <= */
606         { "a",               pn_Cmp_Ug },     /* Floating point: unordered or > */
607         { "ae",              pn_Cmp_Uge },    /* Floating point: unordered or >= */
608         { "ne",              pn_Cmp_Ne },     /* Floating point: unordered or != */
609         { NULL,              pn_Cmp_True },   /* always true */
610 };
611
612 /*
613  * positive conditions for unsigned compares
614  */
615 static
616 const struct cmp2conditon_t cmp2condition_u[] = {
617         { NULL,              pn_Cmp_False },  /* always false */
618         { "e",               pn_Cmp_Eq },     /* == */
619         { "b",               pn_Cmp_Lt },     /* < */
620         { "be",              pn_Cmp_Le },     /* <= */
621         { "a",               pn_Cmp_Gt },     /* > */
622         { "ae",              pn_Cmp_Ge },     /* >= */
623         { "ne",              pn_Cmp_Lg },     /* != */
624         { NULL,              pn_Cmp_True },   /* always true */
625 };
626
627 /*
628  * returns the condition code
629  */
630 static
631 const char *get_cmp_suffix(int cmp_code)
632 {
633         assert( (cmp2condition_s[cmp_code & 15].num) == (cmp_code & 15));
634         assert( (cmp2condition_u[cmp_code & 7].num) == (cmp_code & 7));
635
636         if((cmp_code & ia32_pn_Cmp_Unsigned)) {
637                 return cmp2condition_u[cmp_code & 7].name;
638         } else {
639                 return cmp2condition_s[cmp_code & 15].name;
640         }
641 }
642
643 void ia32_emit_cmp_suffix(ia32_emit_env_t *env, long pnc)
644 {
645         be_emit_string(env, get_cmp_suffix(pnc));
646 }
647
648
649 /**
650  * Returns the target block for a control flow node.
651  */
652 static
653 ir_node *get_cfop_target_block(const ir_node *irn) {
654         return get_irn_link(irn);
655 }
656
657 static
658 void ia32_emit_block_name(ia32_emit_env_t *env, const ir_node *block)
659 {
660         be_emit_cstring(env, BLOCK_PREFIX);
661         be_emit_irprintf(env->emit, "%d", get_irn_node_nr(block));
662 }
663
664 /**
665  * Returns the target label for a control flow node.
666  */
667 static
668 void ia32_emit_cfop_target(ia32_emit_env_t * env, const ir_node *node) {
669         ir_node *block = get_cfop_target_block(node);
670
671         ia32_emit_block_name(env, block);
672 }
673
674 /** Return the next block in Block schedule */
675 static ir_node *next_blk_sched(const ir_node *block) {
676         return get_irn_link(block);
677 }
678
679 /**
680  * Returns the Proj with projection number proj and NOT mode_M
681  */
682 static
683 ir_node *get_proj(const ir_node *node, long proj) {
684         const ir_edge_t *edge;
685         ir_node         *src;
686
687         assert(get_irn_mode(node) == mode_T && "expected mode_T node");
688
689         foreach_out_edge(node, edge) {
690                 src = get_edge_src_irn(edge);
691
692                 assert(is_Proj(src) && "Proj expected");
693                 if (get_irn_mode(src) == mode_M)
694                         continue;
695
696                 if (get_Proj_proj(src) == proj)
697                         return src;
698         }
699         return NULL;
700 }
701
702 /**
703  * Emits the jump sequence for a conditional jump (cmp + jmp_true + jmp_false)
704  */
705 static
706 void finish_CondJmp(ia32_emit_env_t *env, const ir_node *node, ir_mode *mode,
707                     long pnc) {
708         const ir_node *proj_true;
709         const ir_node *proj_false;
710         const ir_node *block;
711         const ir_node *next_block;
712         int flipped = 0;
713
714         /* get both Proj's */
715         proj_true = get_proj(node, pn_Cond_true);
716         assert(proj_true && "CondJmp without true Proj");
717
718         proj_false = get_proj(node, pn_Cond_false);
719         assert(proj_false && "CondJmp without false Proj");
720
721         /* for now, the code works for scheduled and non-schedules blocks */
722         block = get_nodes_block(node);
723
724         /* we have a block schedule */
725         next_block = next_blk_sched(block);
726
727         if (get_cfop_target_block(proj_true) == next_block) {
728                 /* exchange both proj's so the second one can be omitted */
729                 const ir_node *t = proj_true;
730
731                 proj_true  = proj_false;
732                 proj_false = t;
733                 flipped    = 1;
734                 pnc        = get_negated_pnc(pnc, mode);
735         }
736
737         /* in case of unordered compare, check for parity */
738         if (pnc & pn_Cmp_Uo) {
739                 be_emit_cstring(env, "\tjp ");
740                 ia32_emit_cfop_target(env, proj_true);
741                 be_emit_finish_line_gas(env, proj_true);
742         }
743
744         be_emit_cstring(env, "\tj");
745         ia32_emit_cmp_suffix(env, pnc);
746         be_emit_char(env, ' ');
747         ia32_emit_cfop_target(env, proj_true);
748         be_emit_finish_line_gas(env, proj_true);
749
750         /* the second Proj might be a fallthrough */
751         if (get_cfop_target_block(proj_false) != next_block) {
752                 be_emit_cstring(env, "\tjmp ");
753                 ia32_emit_cfop_target(env, proj_false);
754                 be_emit_finish_line_gas(env, proj_false);
755         } else {
756                 be_emit_cstring(env, "\t/* fallthrough to ");
757                 ia32_emit_cfop_target(env, proj_false);
758                 be_emit_cstring(env, " */");
759                 be_emit_finish_line_gas(env, proj_false);
760         }
761 }
762
763 /**
764  * Emits code for conditional jump.
765  */
766 static
767 void CondJmp_emitter(ia32_emit_env_t *env, const ir_node *node) {
768         be_emit_cstring(env, "\tcmp ");
769         ia32_emit_binop(env, node);
770         be_emit_finish_line_gas(env, node);
771
772         finish_CondJmp(env, node, mode_Iu, get_ia32_pncode(node));
773 }
774
775 /**
776  * Emits code for conditional jump with two variables.
777  */
778 static
779 void emit_ia32_CondJmp(ia32_emit_env_t *env, const ir_node *node) {
780         CondJmp_emitter(env, node);
781 }
782
783 /**
784  * Emits code for conditional test and jump.
785  */
786 static
787 void TestJmp_emitter(ia32_emit_env_t *env, const ir_node *node) {
788         if(is_ia32_ImmSymConst(node) || is_ia32_ImmConst(node)) {
789                 be_emit_cstring(env, "\ttest ");
790                 ia32_emit_immediate(env, node);
791                 be_emit_cstring(env, ", ");
792                 ia32_emit_source_register(env, node, 0);
793                 be_emit_finish_line_gas(env, node);
794         } else {
795                 be_emit_cstring(env, "\ttest ");
796                 ia32_emit_source_register(env, node, 1);
797                 be_emit_cstring(env, ", ");
798                 ia32_emit_source_register(env, node, 0);
799                 be_emit_finish_line_gas(env, node);
800         }
801         finish_CondJmp(env, node, mode_Iu, get_ia32_pncode(node));
802 }
803
804 /**
805  * Emits code for conditional test and jump with two variables.
806  */
807 static
808 void emit_ia32_TestJmp(ia32_emit_env_t *env, const ir_node *node) {
809         TestJmp_emitter(env, node);
810 }
811
812 static
813 void emit_ia32_CJmp(ia32_emit_env_t *env, const ir_node *node) {
814         be_emit_cstring(env, "/* omitted redundant test */");
815         be_emit_finish_line_gas(env, node);
816
817         finish_CondJmp(env, node, mode_Is, get_ia32_pncode(node));
818 }
819
820 static
821 void emit_ia32_CJmpAM(ia32_emit_env_t *env, const ir_node *node) {
822         be_emit_cstring(env, "/* omitted redundant test/cmp */");
823         be_emit_finish_line_gas(env, node);
824
825         finish_CondJmp(env, node, mode_Is, get_ia32_pncode(node));
826 }
827
828 /**
829  * Emits code for conditional SSE floating point jump with two variables.
830  */
831 static
832 void emit_ia32_xCondJmp(ia32_emit_env_t *env, const ir_node *node) {
833         be_emit_cstring(env, "\tucomi");
834         ia32_emit_xmm_mode_suffix(env, node);
835         be_emit_char(env, ' ');
836         ia32_emit_binop(env, node);
837         be_emit_finish_line_gas(env, node);
838
839         finish_CondJmp(env, node, mode_F, get_ia32_pncode(node));
840 }
841
842 /**
843  * Emits code for conditional x87 floating point jump with two variables.
844  */
845 static
846 void emit_ia32_x87CondJmp(ia32_emit_env_t *env, const ir_node *node) {
847         ia32_attr_t *attr = get_ia32_attr(node);
848         const char *reg = attr->x87[1]->name;
849         long pnc = get_ia32_pncode(node);
850
851         switch (get_ia32_irn_opcode(node)) {
852         case iro_ia32_fcomrJmp:
853                 pnc = get_inversed_pnc(pnc);
854                 reg = attr->x87[0]->name;
855         case iro_ia32_fcomJmp:
856         default:
857                 be_emit_cstring(env, "\tfucom ");
858                 break;
859         case iro_ia32_fcomrpJmp:
860                 pnc = get_inversed_pnc(pnc);
861                 reg = attr->x87[0]->name;
862         case iro_ia32_fcompJmp:
863                 be_emit_cstring(env, "\tfucomp ");
864                 break;
865         case iro_ia32_fcomrppJmp:
866                 pnc = get_inversed_pnc(pnc);
867         case iro_ia32_fcomppJmp:
868                 be_emit_cstring(env, "\tfucompp ");
869                 reg = "";
870                 break;
871         }
872
873         if(reg[0] != '\0') {
874                 be_emit_char(env, '%');
875                 be_emit_string(env, reg);
876         }
877         be_emit_finish_line_gas(env, node);
878
879         be_emit_cstring(env, "\tfnstsw %ax");
880         be_emit_finish_line_gas(env, node);
881         be_emit_cstring(env, "\tsahf");
882         be_emit_finish_line_gas(env, node);
883
884         finish_CondJmp(env, node, mode_E, pnc);
885 }
886
887 static
888 void CMov_emitter(ia32_emit_env_t *env, const ir_node *node) {
889         long pnc = get_ia32_pncode(node);
890         int is_PsiCondCMov = is_ia32_PsiCondCMov(node);
891         int idx_left  = 2 - is_PsiCondCMov;
892         int idx_right = 3 - is_PsiCondCMov;
893         const arch_register_t *in1, *in2, *out;
894
895         out = arch_get_irn_register(env->arch_env, node);
896         in1 = arch_get_irn_register(env->arch_env, get_irn_n(node, idx_left));
897         in2 = arch_get_irn_register(env->arch_env, get_irn_n(node, idx_right));
898
899         /* we have to emit the cmp first, because the destination register */
900         /* could be one of the compare registers                           */
901         if (is_ia32_CmpCMov(node)) {
902                 be_emit_cstring(env, "\tcmp ");
903                 ia32_emit_source_register(env, node, 1);
904                 be_emit_cstring(env, ", ");
905                 ia32_emit_source_register(env, node, 0);
906         } else if (is_ia32_xCmpCMov(node)) {
907                 be_emit_cstring(env, "\tucomis");
908                 ia32_emit_mode_suffix(env, get_irn_mode(node));
909                 be_emit_char(env, ' ');
910                 ia32_emit_source_register(env, node, 1);
911                 be_emit_cstring(env, ", ");
912                 ia32_emit_source_register(env, node, 0);
913         } else if (is_PsiCondCMov) {
914                 /* omit compare because flags are already set by And/Or */
915                 be_emit_cstring(env, "\ttest ");
916                 ia32_emit_source_register(env, node, 0);
917                 be_emit_cstring(env, ", ");
918                 ia32_emit_source_register(env, node, 0);
919         } else {
920                 assert(0 && "unsupported CMov");
921         }
922         be_emit_finish_line_gas(env, node);
923
924         if (REGS_ARE_EQUAL(out, in2)) {
925                 /* best case: default in == out -> do nothing */
926         } else if (REGS_ARE_EQUAL(out, in1)) {
927                 ir_node *n = (ir_node*) node;
928                 /* true in == out -> need complement compare and exchange true and default in */
929                 ir_node *t = get_irn_n(n, idx_left);
930                 set_irn_n(n, idx_left, get_irn_n(n, idx_right));
931                 set_irn_n(n, idx_right, t);
932
933                 pnc = get_negated_pnc(pnc, get_irn_mode(node));
934         } else {
935                 /* out is different from in: need copy default -> out */
936                 if (is_PsiCondCMov) {
937                         be_emit_cstring(env, "\tmovl ");
938                         ia32_emit_dest_register(env, node, 2);
939                         be_emit_cstring(env, ", ");
940                         ia32_emit_dest_register(env, node, 0);
941                 } else {
942                         be_emit_cstring(env, "\tmovl ");
943                         ia32_emit_source_register(env, node, 3);
944                         be_emit_cstring(env, ", ");
945                         ia32_emit_dest_register(env, node, 0);
946                 }
947                 be_emit_finish_line_gas(env, node);
948         }
949
950         if (is_PsiCondCMov) {
951                 be_emit_cstring(env, "\tcmov");
952                 ia32_emit_cmp_suffix(env, pnc);
953                 be_emit_cstring(env, "l ");
954                 ia32_emit_source_register(env, node, 1);
955                 be_emit_cstring(env, ", ");
956                 ia32_emit_dest_register(env, node, 0);
957         } else {
958                 be_emit_cstring(env, "\tcmov");
959                 ia32_emit_cmp_suffix(env, pnc);
960                 be_emit_cstring(env, "l ");
961                 ia32_emit_source_register(env, node, 2);
962                 be_emit_cstring(env, ", ");
963                 ia32_emit_dest_register(env, node, 0);
964         }
965         be_emit_finish_line_gas(env, node);
966 }
967
968 static
969 void emit_ia32_CmpCMov(ia32_emit_env_t *env, const ir_node *node) {
970         CMov_emitter(env, node);
971 }
972
973 static
974 void emit_ia32_PsiCondCMov(ia32_emit_env_t *env, const ir_node *node) {
975         CMov_emitter(env, node);
976 }
977
978 static
979 void emit_ia32_xCmpCMov(ia32_emit_env_t *env, const ir_node *node) {
980         CMov_emitter(env, node);
981 }
982
983 static
984 void Set_emitter(ia32_emit_env_t *env, const ir_node *node, ir_mode *mode) {
985         int pnc = get_ia32_pncode(node);
986         const char *reg8bit;
987         const arch_register_t *out;
988
989         out     = arch_get_irn_register(env->arch_env, node);
990         reg8bit = ia32_get_mapped_reg_name(env->isa->regs_8bit, out);
991
992         if (is_ia32_CmpSet(node)) {
993                 be_emit_cstring(env, "\tcmp ");
994                 ia32_emit_binop(env, node);
995         } else if (is_ia32_xCmpSet(node)) {
996                 be_emit_cstring(env, "\tucomis");
997                 ia32_emit_mode_suffix(env, get_irn_mode(get_irn_n(node, 2)));
998                 be_emit_char(env, ' ');
999                 ia32_emit_binop(env, node);
1000         } else if (is_ia32_PsiCondSet(node)) {
1001                 be_emit_cstring(env, "\tcmp $0, ");
1002                 ia32_emit_source_register(env, node, 0);
1003         } else {
1004                 assert(0 && "unsupported Set");
1005         }
1006         be_emit_finish_line_gas(env, node);
1007
1008         /* use mov to clear target because it doesn't affect the eflags */
1009         be_emit_cstring(env, "\tmovl $0, %");
1010         be_emit_string(env, arch_register_get_name(out));
1011         be_emit_finish_line_gas(env, node);
1012
1013         be_emit_cstring(env, "\tset");
1014         ia32_emit_cmp_suffix(env, pnc);
1015         be_emit_cstring(env, " %");
1016         be_emit_string(env, reg8bit);
1017         be_emit_finish_line_gas(env, node);
1018 }
1019
1020 static
1021 void emit_ia32_CmpSet(ia32_emit_env_t *env, const ir_node *node) {
1022         Set_emitter(env, node, get_irn_mode(get_irn_n(node, 2)));
1023 }
1024
1025 static
1026 void emit_ia32_PsiCondSet(ia32_emit_env_t *env, const ir_node *node) {
1027         Set_emitter(env, node, get_irn_mode(get_irn_n(node, 0)));
1028 }
1029
1030 static
1031 void emit_ia32_xCmpSet(ia32_emit_env_t *env, const ir_node *node) {
1032         Set_emitter(env, node, get_irn_mode(get_irn_n(node, 2)));
1033 }
1034
1035 static
1036 void emit_ia32_xCmp(ia32_emit_env_t *env, const ir_node *node) {
1037         int  sse_pnc  = -1;
1038         long pnc      = get_ia32_pncode(node);
1039         long unord    = pnc & pn_Cmp_Uo;
1040
1041         assert( (pnc & ia32_pn_Cmp_Unsigned) == 0);
1042
1043         switch (pnc) {
1044                 case pn_Cmp_Leg: /* odered */
1045                         sse_pnc = 7;
1046                         break;
1047                 case pn_Cmp_Uo:  /* unordered */
1048                         sse_pnc = 3;
1049                         break;
1050                 case pn_Cmp_Ue:
1051                 case pn_Cmp_Eq:  /* == */
1052                         sse_pnc = 0;
1053                         break;
1054                 case pn_Cmp_Ul:
1055                 case pn_Cmp_Lt:  /* < */
1056                         sse_pnc = 1;
1057                         break;
1058                 case pn_Cmp_Ule:
1059                 case pn_Cmp_Le: /* <= */
1060                         sse_pnc = 2;
1061                         break;
1062                 case pn_Cmp_Ug:
1063                 case pn_Cmp_Gt:  /* > */
1064                         sse_pnc = 6;
1065                         break;
1066                 case pn_Cmp_Uge:
1067                 case pn_Cmp_Ge: /* >= */
1068                         sse_pnc = 5;
1069                         break;
1070                 case pn_Cmp_Ne:
1071                 case pn_Cmp_Lg:  /* != */
1072                         sse_pnc = 4;
1073                         break;
1074         }
1075
1076         assert(sse_pnc >= 0 && "unsupported compare");
1077
1078         if (unord && sse_pnc != 3) {
1079                 /*
1080                         We need a separate compare against unordered.
1081                         Quick and Dirty solution:
1082                         - get some memory on stack
1083                         - compare
1084                         - store result
1085                         - compare
1086                         - and result and stored result
1087                     - cleanup stack
1088                 */
1089                 be_emit_cstring(env, "\tsubl $8, %esp");
1090                 be_emit_finish_line_gas(env, node);
1091
1092                 be_emit_cstring(env, "\tcmpsd $3, ");
1093                 ia32_emit_binop(env, node);
1094                 be_emit_finish_line_gas(env, node);
1095
1096                 be_emit_cstring(env, "\tmovsd ");
1097                 ia32_emit_dest_register(env, node, 0);
1098                 be_emit_cstring(env, ", (%esp)");
1099                 be_emit_finish_line_gas(env, node);
1100         }
1101
1102         be_emit_cstring(env, "\tcmpsd ");
1103         be_emit_irprintf(env->emit, "%d, ", sse_pnc);
1104         ia32_emit_binop(env, node);
1105         be_emit_finish_line_gas(env, node);
1106
1107         if (unord && sse_pnc != 3) {
1108                 be_emit_cstring(env, "\tandpd (%esp), ");
1109                 ia32_emit_dest_register(env, node, 0);
1110                 be_emit_finish_line_gas(env, node);
1111
1112                 be_emit_cstring(env, "\taddl $8, %esp");
1113                 be_emit_finish_line_gas(env, node);
1114         }
1115 }
1116
1117 /*********************************************************
1118  *                 _ _       _
1119  *                (_) |     (_)
1120  *   ___ _ __ ___  _| |_     _ _   _ _ __ ___  _ __  ___
1121  *  / _ \ '_ ` _ \| | __|   | | | | | '_ ` _ \| '_ \/ __|
1122  * |  __/ | | | | | | |_    | | |_| | | | | | | |_) \__ \
1123  *  \___|_| |_| |_|_|\__|   | |\__,_|_| |_| |_| .__/|___/
1124  *                         _/ |               | |
1125  *                        |__/                |_|
1126  *********************************************************/
1127
1128 /* jump table entry (target and corresponding number) */
1129 typedef struct _branch_t {
1130         ir_node *target;
1131         int      value;
1132 } branch_t;
1133
1134 /* jump table for switch generation */
1135 typedef struct _jmp_tbl_t {
1136         ir_node  *defProj;         /**< default target */
1137         int       min_value;       /**< smallest switch case */
1138         int       max_value;       /**< largest switch case */
1139         int       num_branches;    /**< number of jumps */
1140         char     *label;           /**< label of the jump table */
1141         branch_t *branches;        /**< jump array */
1142 } jmp_tbl_t;
1143
1144 /**
1145  * Compare two variables of type branch_t. Used to sort all switch cases
1146  */
1147 static
1148 int ia32_cmp_branch_t(const void *a, const void *b) {
1149         branch_t *b1 = (branch_t *)a;
1150         branch_t *b2 = (branch_t *)b;
1151
1152         if (b1->value <= b2->value)
1153                 return -1;
1154         else
1155                 return 1;
1156 }
1157
1158 /**
1159  * Emits code for a SwitchJmp (creates a jump table if
1160  * possible otherwise a cmp-jmp cascade). Port from
1161  * cggg ia32 backend
1162  */
1163 static
1164 void emit_ia32_SwitchJmp(ia32_emit_env_t *env, const ir_node *node) {
1165         unsigned long       interval;
1166         int                 last_value, i;
1167         long                pnc;
1168         jmp_tbl_t           tbl;
1169         ir_node            *proj;
1170         const ir_edge_t    *edge;
1171
1172         /* fill the table structure */
1173         tbl.label        = xmalloc(SNPRINTF_BUF_LEN);
1174         tbl.label        = get_unique_label(tbl.label, SNPRINTF_BUF_LEN, ".TBL_");
1175         tbl.defProj      = NULL;
1176         tbl.num_branches = get_irn_n_edges(node);
1177         tbl.branches     = xcalloc(tbl.num_branches, sizeof(tbl.branches[0]));
1178         tbl.min_value    = INT_MAX;
1179         tbl.max_value    = INT_MIN;
1180
1181         i = 0;
1182         /* go over all proj's and collect them */
1183         foreach_out_edge(node, edge) {
1184                 proj = get_edge_src_irn(edge);
1185                 assert(is_Proj(proj) && "Only proj allowed at SwitchJmp");
1186
1187                 pnc = get_Proj_proj(proj);
1188
1189                 /* create branch entry */
1190                 tbl.branches[i].target = proj;
1191                 tbl.branches[i].value  = pnc;
1192
1193                 tbl.min_value = pnc < tbl.min_value ? pnc : tbl.min_value;
1194                 tbl.max_value = pnc > tbl.max_value ? pnc : tbl.max_value;
1195
1196                 /* check for default proj */
1197                 if (pnc == get_ia32_pncode(node)) {
1198                         assert(tbl.defProj == NULL && "found two defProjs at SwitchJmp");
1199                         tbl.defProj = proj;
1200                 }
1201
1202                 i++;
1203         }
1204
1205         /* sort the branches by their number */
1206         qsort(tbl.branches, tbl.num_branches, sizeof(tbl.branches[0]), ia32_cmp_branch_t);
1207
1208         /* two-complement's magic make this work without overflow */
1209         interval = tbl.max_value - tbl.min_value;
1210
1211         /* emit the table */
1212         be_emit_cstring(env, "\tcmpl $");
1213         be_emit_irprintf(env->emit, "%u, ", interval);
1214         ia32_emit_source_register(env, node, 0);
1215         be_emit_finish_line_gas(env, node);
1216
1217         be_emit_cstring(env, "\tja ");
1218         ia32_emit_cfop_target(env, tbl.defProj);
1219         be_emit_finish_line_gas(env, node);
1220
1221         if (tbl.num_branches > 1) {
1222                 /* create table */
1223                 be_emit_cstring(env, "\tjmp *");
1224                 be_emit_string(env, tbl.label);
1225                 be_emit_cstring(env, "(,");
1226                 ia32_emit_source_register(env, node, 0);
1227                 be_emit_cstring(env, ",4)");
1228                 be_emit_finish_line_gas(env, node);
1229
1230                 be_gas_emit_switch_section(env->emit, GAS_SECTION_RODATA);
1231                 be_emit_cstring(env, "\t.align 4\n");
1232                 be_emit_write_line(env);
1233
1234                 be_emit_string(env, tbl.label);
1235                 be_emit_cstring(env, ":\n");
1236                 be_emit_write_line(env);
1237
1238                 be_emit_cstring(env, ".long ");
1239                 ia32_emit_cfop_target(env, tbl.branches[0].target);
1240                 be_emit_finish_line_gas(env, NULL);
1241
1242                 last_value = tbl.branches[0].value;
1243                 for (i = 1; i < tbl.num_branches; ++i) {
1244                         while (++last_value < tbl.branches[i].value) {
1245                                 be_emit_cstring(env, ".long ");
1246                                 ia32_emit_cfop_target(env, tbl.defProj);
1247                                 be_emit_finish_line_gas(env, NULL);
1248                         }
1249                         be_emit_cstring(env, ".long ");
1250                         ia32_emit_cfop_target(env, tbl.branches[i].target);
1251                         be_emit_finish_line_gas(env, NULL);
1252                 }
1253                 be_gas_emit_switch_section(env->emit, GAS_SECTION_TEXT);
1254         } else {
1255                 /* one jump is enough */
1256                 be_emit_cstring(env, "\tjmp ");
1257                 ia32_emit_cfop_target(env, tbl.branches[0].target);
1258                 be_emit_finish_line_gas(env, node);
1259         }
1260
1261         if (tbl.label)
1262                 free(tbl.label);
1263         if (tbl.branches)
1264                 free(tbl.branches);
1265 }
1266
1267 /**
1268  * Emits code for a unconditional jump.
1269  */
1270 static
1271 void emit_Jmp(ia32_emit_env_t *env, const ir_node *node) {
1272         ir_node *block, *next_block;
1273
1274         /* for now, the code works for scheduled and non-schedules blocks */
1275         block = get_nodes_block(node);
1276
1277         /* we have a block schedule */
1278         next_block = next_blk_sched(block);
1279         if (get_cfop_target_block(node) != next_block) {
1280                 be_emit_cstring(env, "\tjmp ");
1281                 ia32_emit_cfop_target(env, node);
1282         } else {
1283                 be_emit_cstring(env, "\t/* fallthrough to ");
1284                 ia32_emit_cfop_target(env, node);
1285                 be_emit_cstring(env, " */");
1286         }
1287         be_emit_finish_line_gas(env, node);
1288 }
1289
1290 /**********************************
1291  *   _____                  ____
1292  *  / ____|                |  _ \
1293  * | |     ___  _ __  _   _| |_) |
1294  * | |    / _ \| '_ \| | | |  _ <
1295  * | |___| (_) | |_) | |_| | |_) |
1296  *  \_____\___/| .__/ \__, |____/
1297  *             | |     __/ |
1298  *             |_|    |___/
1299  **********************************/
1300
1301 /**
1302  * Emit movsb/w instructions to make mov count divideable by 4
1303  */
1304 static
1305 void emit_CopyB_prolog(ia32_emit_env_t *env, int rem) {
1306         be_emit_cstring(env, "\tcld");
1307         be_emit_finish_line_gas(env, NULL);
1308
1309         switch(rem) {
1310         case 1:
1311                 be_emit_cstring(env, "\tmovsb");
1312                 be_emit_finish_line_gas(env, NULL);
1313                 break;
1314         case 2:
1315                 be_emit_cstring(env, "\tmovsw");
1316                 be_emit_finish_line_gas(env, NULL);
1317                 break;
1318         case 3:
1319                 be_emit_cstring(env, "\tmovsb");
1320                 be_emit_finish_line_gas(env, NULL);
1321                 be_emit_cstring(env, "\tmovsw");
1322                 be_emit_finish_line_gas(env, NULL);
1323                 break;
1324         }
1325 }
1326
1327 /**
1328  * Emit rep movsd instruction for memcopy.
1329  */
1330 static
1331 void emit_ia32_CopyB(ia32_emit_env_t *env, const ir_node *node) {
1332         tarval *tv = get_ia32_Immop_tarval(node);
1333         int    rem = get_tarval_long(tv);
1334
1335         emit_CopyB_prolog(env, rem);
1336
1337         be_emit_cstring(env, "\trep movsd");
1338         be_emit_finish_line_gas(env, node);
1339 }
1340
1341 /**
1342  * Emits unrolled memcopy.
1343  */
1344 static
1345 void emit_ia32_CopyB_i(ia32_emit_env_t *env, const ir_node *node) {
1346         tarval *tv   = get_ia32_Immop_tarval(node);
1347         int     size = get_tarval_long(tv);
1348
1349         emit_CopyB_prolog(env, size & 0x3);
1350
1351         size >>= 2;
1352         while (size--) {
1353                 be_emit_cstring(env, "\tmovsd");
1354                 be_emit_finish_line_gas(env, NULL);
1355         }
1356 }
1357
1358
1359
1360 /***************************
1361  *   _____
1362  *  / ____|
1363  * | |     ___  _ ____   __
1364  * | |    / _ \| '_ \ \ / /
1365  * | |___| (_) | | | \ V /
1366  *  \_____\___/|_| |_|\_/
1367  *
1368  ***************************/
1369
1370 /**
1371  * Emit code for conversions (I, FP), (FP, I) and (FP, FP).
1372  */
1373 static
1374 void emit_ia32_Conv_with_FP(ia32_emit_env_t *env, const ir_node *node) {
1375         ir_mode            *ls_mode = get_ia32_ls_mode(node);
1376         int                 ls_bits = get_mode_size_bits(ls_mode);
1377
1378         be_emit_cstring(env, "\tcvt");
1379
1380         if(is_ia32_Conv_I2FP(node)) {
1381                 if(ls_bits == 32) {
1382                         be_emit_cstring(env, "si2ss");
1383                 } else {
1384                         be_emit_cstring(env, "si2sd");
1385                 }
1386         } else if(is_ia32_Conv_FP2I(node)) {
1387                 if(ls_bits == 32) {
1388                         be_emit_cstring(env, "ss2si");
1389                 } else {
1390                         be_emit_cstring(env, "sd2si");
1391                 }
1392         } else {
1393                 assert(is_ia32_Conv_FP2FP(node));
1394                 if(ls_bits == 32) {
1395                         be_emit_cstring(env, "sd2ss");
1396                 } else {
1397                         be_emit_cstring(env, "ss2sd");
1398                 }
1399         }
1400         be_emit_char(env, ' ');
1401
1402         switch(get_ia32_op_type(node)) {
1403                 case ia32_Normal:
1404                         ia32_emit_source_register(env, node, 2);
1405                         be_emit_cstring(env, ", ");
1406                         ia32_emit_dest_register(env, node, 0);
1407                         break;
1408                 case ia32_AddrModeS:
1409                         ia32_emit_dest_register(env, node, 0);
1410                         be_emit_cstring(env, ", ");
1411                         ia32_emit_am(env, node);
1412                         break;
1413                 default:
1414                         assert(0 && "unsupported op type for Conv");
1415         }
1416         be_emit_finish_line_gas(env, node);
1417 }
1418
1419 static
1420 void emit_ia32_Conv_I2FP(ia32_emit_env_t *env, const ir_node *node) {
1421         emit_ia32_Conv_with_FP(env, node);
1422 }
1423
1424 static
1425 void emit_ia32_Conv_FP2I(ia32_emit_env_t *env, const ir_node *node) {
1426         emit_ia32_Conv_with_FP(env, node);
1427 }
1428
1429 static
1430 void emit_ia32_Conv_FP2FP(ia32_emit_env_t *env, const ir_node *node) {
1431         emit_ia32_Conv_with_FP(env, node);
1432 }
1433
1434 /**
1435  * Emits code for an Int conversion.
1436  */
1437 static
1438 void emit_ia32_Conv_I2I(ia32_emit_env_t *env, const ir_node *node) {
1439         const char *sign_suffix;
1440         ir_mode *smaller_mode = get_ia32_ls_mode(node);
1441         int smaller_bits = get_mode_size_bits(smaller_mode);
1442         int signed_mode;
1443         const arch_register_t *in_reg, *out_reg;
1444
1445         assert(!mode_is_float(smaller_mode));
1446         assert(smaller_bits == 8 || smaller_bits == 16 || smaller_bits == 32);
1447
1448         signed_mode = mode_is_signed(smaller_mode);
1449         if(smaller_bits == 32) {
1450                 // this should not happen as it's no convert
1451                 assert(0);
1452                 sign_suffix = "";
1453         } else {
1454                 sign_suffix = signed_mode ? "s" : "z";
1455         }
1456
1457         switch(get_ia32_op_type(node)) {
1458                 case ia32_Normal:
1459                         in_reg  = get_in_reg(env, node, 2);
1460                         out_reg = get_out_reg(env, node, 0);
1461
1462                         if (REGS_ARE_EQUAL(in_reg, &ia32_gp_regs[REG_EAX]) &&
1463                                 REGS_ARE_EQUAL(out_reg, in_reg)                &&
1464                                 signed_mode)
1465                         {
1466                                 /* argument and result are both in EAX and */
1467                                 /* signedness is ok: -> use converts       */
1468                                 if (smaller_bits == 8) {
1469                                         be_emit_cstring(env, "\tcbtw");
1470                                 } else if (smaller_bits == 16) {
1471                                         be_emit_cstring(env, "\tcwtl");
1472                                 } else {
1473                                         assert(0);
1474                                 }
1475                         } else if (REGS_ARE_EQUAL(out_reg, in_reg) && !signed_mode) {
1476                                 /* argument and result are in the same register */
1477                                 /* and signedness is ok: -> use and with mask   */
1478                                 int mask = (1 << smaller_bits) - 1;
1479                                 be_emit_cstring(env, "\tandl $0x");
1480                                 be_emit_irprintf(env->emit, "%x, ", mask);
1481                                 ia32_emit_dest_register(env, node, 0);
1482                         } else {
1483                                 const char *sreg = ia32_get_reg_name_for_mode(env, smaller_mode, in_reg);
1484
1485                                 be_emit_cstring(env, "\tmov");
1486                                 be_emit_string(env, sign_suffix);
1487                                 ia32_emit_mode_suffix(env, smaller_mode);
1488                                 be_emit_cstring(env, "l %");
1489                                 be_emit_string(env, sreg);
1490                                 be_emit_cstring(env, ", ");
1491                                 ia32_emit_dest_register(env, node, 0);
1492                         }
1493                         break;
1494                 case ia32_AddrModeS: {
1495                         be_emit_cstring(env, "\tmov");
1496                         be_emit_string(env, sign_suffix);
1497                         ia32_emit_mode_suffix(env, smaller_mode);
1498                         be_emit_cstring(env, "l %");
1499                         ia32_emit_am(env, node);
1500                         be_emit_cstring(env, ", ");
1501                         ia32_emit_dest_register(env, node, 0);
1502                         break;
1503                 }
1504                 default:
1505                         assert(0 && "unsupported op type for Conv");
1506         }
1507         be_emit_finish_line_gas(env, node);
1508 }
1509
1510 /**
1511  * Emits code for an 8Bit Int conversion.
1512  */
1513 void emit_ia32_Conv_I2I8Bit(ia32_emit_env_t *env, const ir_node *node) {
1514         emit_ia32_Conv_I2I(env, node);
1515 }
1516
1517
1518 /*******************************************
1519  *  _                          _
1520  * | |                        | |
1521  * | |__   ___ _ __   ___   __| | ___  ___
1522  * | '_ \ / _ \ '_ \ / _ \ / _` |/ _ \/ __|
1523  * | |_) |  __/ | | | (_) | (_| |  __/\__ \
1524  * |_.__/ \___|_| |_|\___/ \__,_|\___||___/
1525  *
1526  *******************************************/
1527
1528 /**
1529  * Emits a backend call
1530  */
1531 static
1532 void emit_be_Call(ia32_emit_env_t *env, const ir_node *node) {
1533         ir_entity *ent = be_Call_get_entity(node);
1534
1535         be_emit_cstring(env, "\tcall ");
1536         if (ent) {
1537                 mark_entity_visited(ent);
1538                 be_emit_string(env, get_entity_ld_name(ent));
1539         } else {
1540                 be_emit_char(env, '*');
1541                 ia32_emit_dest_register(env, get_irn_n(node, be_pos_Call_ptr), 0);
1542         }
1543         be_emit_finish_line_gas(env, node);
1544 }
1545
1546 /**
1547  * Emits code to increase stack pointer.
1548  */
1549 static
1550 void emit_be_IncSP(ia32_emit_env_t *env, const ir_node *node) {
1551         int offs = be_get_IncSP_offset(node);
1552
1553         if (offs == 0)
1554                 return;
1555
1556         if (offs > 0) {
1557                 be_emit_cstring(env, "\tsubl $");
1558                 be_emit_irprintf(env->emit, "%u, ", offs);
1559                 ia32_emit_source_register(env, node, 0);
1560         } else {
1561                 be_emit_cstring(env, "\taddl $");
1562                 be_emit_irprintf(env->emit, "%u, ", -offs);
1563                 ia32_emit_source_register(env, node, 0);
1564         }
1565         be_emit_finish_line_gas(env, node);
1566 }
1567
1568 /**
1569  * Emits code to set stack pointer.
1570  */
1571 static
1572 void emit_be_SetSP(ia32_emit_env_t *env, const ir_node *node) {
1573         be_emit_cstring(env, "\tmovl ");
1574         ia32_emit_source_register(env, node, 2);
1575         be_emit_cstring(env, ", ");
1576         ia32_emit_dest_register(env, node, 0);
1577         be_emit_finish_line_gas(env, node);
1578 }
1579
1580 /**
1581  * Emits code for Copy/CopyKeep.
1582  */
1583 static
1584 void Copy_emitter(ia32_emit_env_t *env, const ir_node *node, const ir_node *op)
1585 {
1586         const arch_env_t *aenv = env->arch_env;
1587         ir_mode *mode;
1588
1589         if (REGS_ARE_EQUAL(arch_get_irn_register(aenv, node), arch_get_irn_register(aenv, op)) ||
1590                 arch_register_type_is(arch_get_irn_register(aenv, op), virtual))
1591                 return;
1592
1593         mode = get_irn_mode(node);
1594         if (mode == mode_E) {
1595                 be_emit_cstring(env, "\tmovsd ");
1596                 ia32_emit_source_register(env, node, 0);
1597                 be_emit_cstring(env, ", ");
1598                 ia32_emit_dest_register(env, node, 0);
1599         } else {
1600                 be_emit_cstring(env, "\tmovl ");
1601                 ia32_emit_source_register(env, node, 0);
1602                 be_emit_cstring(env, ", ");
1603                 ia32_emit_dest_register(env, node, 0);
1604         }
1605         be_emit_finish_line_gas(env, node);
1606 }
1607
1608 static
1609 void emit_be_Copy(ia32_emit_env_t *env, const ir_node *node) {
1610         Copy_emitter(env, node, be_get_Copy_op(node));
1611 }
1612
1613 static
1614 void emit_be_CopyKeep(ia32_emit_env_t *env, const ir_node *node) {
1615         Copy_emitter(env, node, be_get_CopyKeep_op(node));
1616 }
1617
1618 /**
1619  * Emits code for exchange.
1620  */
1621 static
1622 void emit_be_Perm(ia32_emit_env_t *env, const ir_node *node) {
1623         const arch_register_t *in1, *in2;
1624         const arch_register_class_t *cls1, *cls2;
1625
1626         in1 = arch_get_irn_register(env->arch_env, get_irn_n(node, 0));
1627         in2 = arch_get_irn_register(env->arch_env, get_irn_n(node, 1));
1628
1629         cls1 = arch_register_get_class(in1);
1630         cls2 = arch_register_get_class(in2);
1631
1632         assert(cls1 == cls2 && "Register class mismatch at Perm");
1633
1634         if (cls1 == &ia32_reg_classes[CLASS_ia32_gp]) {
1635                 be_emit_cstring(env, "\txchg ");
1636                 ia32_emit_source_register(env, node, 1);
1637                 be_emit_cstring(env, ", ");
1638                 ia32_emit_source_register(env, node, 0);
1639                 be_emit_finish_line_gas(env, node);
1640         } else if (cls1 == &ia32_reg_classes[CLASS_ia32_xmm]) {
1641                 be_emit_cstring(env, "\txorpd ");
1642                 ia32_emit_source_register(env, node, 1);
1643                 be_emit_cstring(env, ", ");
1644                 ia32_emit_source_register(env, node, 0);
1645                 be_emit_finish_line_gas(env, NULL);
1646
1647                 be_emit_cstring(env, "\txorpd ");
1648                 ia32_emit_source_register(env, node, 0);
1649                 be_emit_cstring(env, ", ");
1650                 ia32_emit_source_register(env, node, 1);
1651                 be_emit_finish_line_gas(env, NULL);
1652
1653                 be_emit_cstring(env, "\txorpd ");
1654                 ia32_emit_source_register(env, node, 1);
1655                 be_emit_cstring(env, ", ");
1656                 ia32_emit_source_register(env, node, 0);
1657                 be_emit_finish_line_gas(env, node);
1658         } else if (cls1 == &ia32_reg_classes[CLASS_ia32_vfp]) {
1659                 /* is a NOP */
1660         } else if (cls1 == &ia32_reg_classes[CLASS_ia32_st]) {
1661                 /* is a NOP */
1662         }
1663 }
1664
1665 /**
1666  * Emits code for Constant loading.
1667  */
1668 static
1669 void emit_ia32_Const(ia32_emit_env_t *env, const ir_node *node) {
1670         ia32_immop_type_t imm_tp = get_ia32_immop_type(node);
1671
1672         if (imm_tp == ia32_ImmSymConst) {
1673                 be_emit_cstring(env, "\tmovl ");
1674                 ia32_emit_immediate(env, node);
1675                 be_emit_cstring(env, ", ");
1676                 ia32_emit_dest_register(env, node, 0);
1677         } else {
1678                 tarval *tv = get_ia32_Immop_tarval(node);
1679                 assert(get_irn_mode(node) == mode_Iu);
1680                 /* beware: in some rare cases mode is mode_b which has no tarval_null() */
1681                 if (tarval_is_null(tv)) {
1682                         if (env->isa->opt_arch == arch_pentium_4) {
1683                                 /* P4 prefers sub r, r, others xor r, r */
1684                                 be_emit_cstring(env, "\tsubl ");
1685                         } else {
1686                                 be_emit_cstring(env, "\txorl ");
1687                         }
1688                         ia32_emit_dest_register(env, node, 0);
1689                         be_emit_cstring(env, ", ");
1690                         ia32_emit_dest_register(env, node, 0);
1691                 } else {
1692                         be_emit_cstring(env, "\tmovl ");
1693                         ia32_emit_immediate(env, node);
1694                         be_emit_cstring(env, ", ");
1695                         ia32_emit_dest_register(env, node, 0);
1696                 }
1697         }
1698         be_emit_finish_line_gas(env, node);
1699 }
1700
1701 /**
1702  * Emits code to load the TLS base
1703  */
1704 static
1705 void emit_ia32_LdTls(ia32_emit_env_t *env, const ir_node *node) {
1706         be_emit_cstring(env, "\tmovl %gs:0, ");
1707         ia32_emit_dest_register(env, node, 0);
1708         be_emit_finish_line_gas(env, node);
1709 }
1710
1711 static
1712 void emit_be_Return(ia32_emit_env_t *env, const ir_node *node) {
1713         be_emit_cstring(env, "\tret");
1714         be_emit_finish_line_gas(env, node);
1715 }
1716
1717 static
1718 void emit_Nothing(ia32_emit_env_t *env, const ir_node *node) {
1719 }
1720
1721
1722 /***********************************************************************************
1723  *                  _          __                                             _
1724  *                 (_)        / _|                                           | |
1725  *  _ __ ___   __ _ _ _ __   | |_ _ __ __ _ _ __ ___   _____      _____  _ __| | __
1726  * | '_ ` _ \ / _` | | '_ \  |  _| '__/ _` | '_ ` _ \ / _ \ \ /\ / / _ \| '__| |/ /
1727  * | | | | | | (_| | | | | | | | | | | (_| | | | | | |  __/\ V  V / (_) | |  |   <
1728  * |_| |_| |_|\__,_|_|_| |_| |_| |_|  \__,_|_| |_| |_|\___| \_/\_/ \___/|_|  |_|\_\
1729  *
1730  ***********************************************************************************/
1731
1732 /**
1733  * Enters the emitter functions for handled nodes into the generic
1734  * pointer of an opcode.
1735  */
1736 static
1737 void ia32_register_emitters(void) {
1738
1739 #define IA32_EMIT2(a,b) op_ia32_##a->ops.generic = (op_func)emit_ia32_##b
1740 #define IA32_EMIT(a)    IA32_EMIT2(a,a)
1741 #define EMIT(a)         op_##a->ops.generic = (op_func)emit_##a
1742 #define IGN(a)                  op_##a->ops.generic = (op_func)emit_Nothing
1743 #define BE_EMIT(a)      op_be_##a->ops.generic = (op_func)emit_be_##a
1744 #define BE_IGN(a)               op_be_##a->ops.generic = (op_func)emit_Nothing
1745
1746         /* first clear the generic function pointer for all ops */
1747         clear_irp_opcodes_generic_func();
1748
1749         /* register all emitter functions defined in spec */
1750         ia32_register_spec_emitters();
1751
1752         /* other ia32 emitter functions */
1753         IA32_EMIT(CondJmp);
1754         IA32_EMIT(TestJmp);
1755         IA32_EMIT(CJmp);
1756         IA32_EMIT(CJmpAM);
1757         IA32_EMIT(CmpCMov);
1758         IA32_EMIT(PsiCondCMov);
1759         IA32_EMIT(CmpSet);
1760         IA32_EMIT(PsiCondSet);
1761         IA32_EMIT(SwitchJmp);
1762         IA32_EMIT(CopyB);
1763         IA32_EMIT(CopyB_i);
1764         IA32_EMIT(Conv_I2FP);
1765         IA32_EMIT(Conv_FP2I);
1766         IA32_EMIT(Conv_FP2FP);
1767         IA32_EMIT(Conv_I2I);
1768         IA32_EMIT(Conv_I2I8Bit);
1769         IA32_EMIT(Const);
1770         IA32_EMIT(LdTls);
1771         IA32_EMIT(xCmp);
1772         IA32_EMIT(xCmpSet);
1773         IA32_EMIT(xCmpCMov);
1774         IA32_EMIT(xCondJmp);
1775         IA32_EMIT2(fcomJmp, x87CondJmp);
1776         IA32_EMIT2(fcompJmp, x87CondJmp);
1777         IA32_EMIT2(fcomppJmp, x87CondJmp);
1778         IA32_EMIT2(fcomrJmp, x87CondJmp);
1779         IA32_EMIT2(fcomrpJmp, x87CondJmp);
1780         IA32_EMIT2(fcomrppJmp, x87CondJmp);
1781
1782         /* benode emitter */
1783         BE_EMIT(Call);
1784         BE_EMIT(IncSP);
1785         BE_EMIT(SetSP);
1786         BE_EMIT(Copy);
1787         BE_EMIT(CopyKeep);
1788         BE_EMIT(Perm);
1789         BE_EMIT(Return);
1790
1791         BE_IGN(RegParams);
1792         BE_IGN(Barrier);
1793         BE_IGN(Keep);
1794
1795         /* firm emitter */
1796         EMIT(Jmp);
1797         IGN(Proj);
1798         IGN(Phi);
1799         IGN(Start);
1800
1801 #undef BE_EMIT
1802 #undef EMIT
1803 #undef IGN
1804 #undef IA32_EMIT2
1805 #undef IA32_EMIT
1806 }
1807
1808 static const char *last_name = NULL;
1809 static unsigned last_line = -1;
1810 static unsigned num = -1;
1811
1812 /**
1813  * Emit the debug support for node node.
1814  */
1815 static
1816 void ia32_emit_dbg(ia32_emit_env_t *env, const ir_node *node) {
1817         dbg_info *db = get_irn_dbg_info(node);
1818         unsigned lineno;
1819         const char *fname = be_retrieve_dbg_info(db, &lineno);
1820
1821         if (! env->cg->birg->main_env->options->stabs_debug_support)
1822                 return;
1823
1824         if (fname) {
1825                 if (last_name != fname) {
1826                         last_line = -1;
1827                         be_dbg_include_begin(env->cg->birg->main_env->db_handle, fname);
1828                         last_name = fname;
1829                 }
1830                 if (last_line != lineno) {
1831                         char name[64];
1832
1833                         snprintf(name, sizeof(name), ".LM%u", ++num);
1834                         last_line = lineno;
1835                         be_dbg_line(env->cg->birg->main_env->db_handle, lineno, name);
1836                         be_emit_string(env, name);
1837                         be_emit_cstring(env, ":\n");
1838                         be_emit_write_line(env);
1839                 }
1840         }
1841 }
1842
1843 typedef void (*emit_func_ptr) (ia32_emit_env_t *, const ir_node *);
1844
1845 /**
1846  * Emits code for a node.
1847  */
1848 static
1849 void ia32_emit_node(ia32_emit_env_t *env, const ir_node *node) {
1850         ir_op *op = get_irn_op(node);
1851
1852         DBG((dbg, LEVEL_1, "emitting code for %+F\n", node));
1853
1854         if (op->ops.generic) {
1855                 emit_func_ptr func = (emit_func_ptr) op->ops.generic;
1856                 ia32_emit_dbg(env, node);
1857                 (*func) (env, node);
1858         } else {
1859                 emit_Nothing(env, node);
1860                 ir_fprintf(stderr, "Warning: No emit handler for node %+F (%+G)\n", node, node);
1861         }
1862 }
1863
1864 /**
1865  * Emits gas alignment directives
1866  */
1867 static
1868 void ia32_emit_alignment(ia32_emit_env_t *env, unsigned align, unsigned skip) {
1869         be_emit_cstring(env, "\t.p2align ");
1870         be_emit_irprintf(env->emit, "%u,,%u\n", align, skip);
1871         be_emit_write_line(env);
1872 }
1873
1874 /**
1875  * Emits gas alignment directives for Functions depended on cpu architecture.
1876  */
1877 static
1878 void ia32_emit_align_func(ia32_emit_env_t *env, cpu_support cpu) {
1879         unsigned align;
1880         unsigned maximum_skip;
1881
1882         switch (cpu) {
1883                 case arch_i386:
1884                         align = 2;
1885                         break;
1886                 case arch_i486:
1887                         align = 4;
1888                         break;
1889                 case arch_k6:
1890                         align = 5;
1891                         break;
1892                 default:
1893                         align = 4;
1894         }
1895         maximum_skip = (1 << align) - 1;
1896         ia32_emit_alignment(env, align, maximum_skip);
1897 }
1898
1899 /**
1900  * Emits gas alignment directives for Labels depended on cpu architecture.
1901  */
1902 static
1903 void ia32_emit_align_label(ia32_emit_env_t *env, cpu_support cpu) {
1904         unsigned align; unsigned maximum_skip;
1905
1906         switch (cpu) {
1907                 case arch_i386:
1908                         align = 2;
1909                         break;
1910                 case arch_i486:
1911                         align = 4;
1912                         break;
1913                 case arch_k6:
1914                         align = 5;
1915                         break;
1916                 default:
1917                         align = 4;
1918         }
1919         maximum_skip = (1 << align) - 1;
1920         ia32_emit_alignment(env, align, maximum_skip);
1921 }
1922
1923 /**
1924  * Test wether a block should be aligned.
1925  * For cpus in the P4/Athlon class it is usefull to align jump labels to
1926  * 16 bytes. However we should only do that if the alignment nops before the
1927  * label aren't executed more often than we have jumps to the label.
1928  */
1929 static
1930 int should_align_block(ia32_emit_env_t *env, ir_node *block, ir_node *prev) {
1931         static const double DELTA = .0001;
1932         ir_exec_freq *exec_freq = env->cg->birg->exec_freq;
1933         double        block_freq;
1934         double        prev_freq = 0;  /**< execfreq of the fallthrough block */
1935         double        jmp_freq  = 0;  /**< execfreq of all non-fallthrough blocks */
1936         cpu_support   cpu       = env->isa->opt_arch;
1937         int           i, n_cfgpreds;
1938
1939         if(exec_freq == NULL)
1940                 return 0;
1941         if(cpu == arch_i386 || cpu == arch_i486)
1942                 return 0;
1943
1944         block_freq = get_block_execfreq(exec_freq, block);
1945         if(block_freq < DELTA)
1946                 return 0;
1947
1948         n_cfgpreds = get_Block_n_cfgpreds(block);
1949         for(i = 0; i < n_cfgpreds; ++i) {
1950                 ir_node *pred      = get_Block_cfgpred_block(block, i);
1951                 double   pred_freq = get_block_execfreq(exec_freq, pred);
1952
1953                 if(pred == prev) {
1954                         assert(prev_freq == 0);
1955                         prev_freq += pred_freq;
1956                 } else {
1957                         jmp_freq  += pred_freq;
1958                 }
1959         }
1960
1961         if(prev_freq < DELTA && !(jmp_freq < DELTA))
1962                 return 1;
1963
1964         jmp_freq /= prev_freq;
1965
1966         switch (cpu) {
1967                 case arch_athlon:
1968                 case arch_athlon_64:
1969                 case arch_k6:
1970                         return jmp_freq > 3;
1971                 default:
1972                         return jmp_freq > 2;
1973         }
1974 }
1975
1976 static
1977 void ia32_emit_block_header(ia32_emit_env_t *env, ir_node *block, ir_node *prev)
1978 {
1979         int           n_cfgpreds;
1980         int           need_label;
1981         int           i, arity;
1982         ir_exec_freq  *exec_freq = env->cg->birg->exec_freq;
1983
1984         need_label = 1;
1985         n_cfgpreds = get_Block_n_cfgpreds(block);
1986         if (n_cfgpreds == 0) {
1987                 need_label = 0;
1988         } else if (n_cfgpreds == 1) {
1989                 ir_node *pred       = get_Block_cfgpred(block, 0);
1990                 ir_node *pred_block = get_nodes_block(pred);
1991
1992                 /* we don't need labels for fallthrough blocks, however switch-jmps
1993                  * are no fallthoughs */
1994                 if(pred_block == prev &&
1995                                 !(is_Proj(pred) && is_ia32_SwitchJmp(get_Proj_pred(pred)))) {
1996                         need_label = 0;
1997                 } else {
1998                         need_label = 1;
1999                 }
2000         } else {
2001                 need_label = 1;
2002         }
2003
2004         if (should_align_block(env, block, prev)) {
2005                 assert(need_label);
2006                 ia32_emit_align_label(env, env->isa->opt_arch);
2007         }
2008
2009         if(need_label) {
2010                 ia32_emit_block_name(env, block);
2011                 be_emit_char(env, ':');
2012
2013                 be_emit_pad_comment(env);
2014                 be_emit_cstring(env, "   /* preds:");
2015
2016                 /* emit list of pred blocks in comment */
2017                 arity = get_irn_arity(block);
2018                 for (i = 0; i < arity; ++i) {
2019                         ir_node *predblock = get_Block_cfgpred_block(block, i);
2020                         be_emit_irprintf(env->emit, " %d", get_irn_node_nr(predblock));
2021                 }
2022
2023                 if (exec_freq != NULL) {
2024                         be_emit_irprintf(env->emit, " freq: %f",
2025                                          get_block_execfreq(exec_freq, block));
2026                 }
2027                 be_emit_cstring(env, " */\n");
2028         } else {
2029                 be_emit_cstring(env, "\t/* ");
2030                 ia32_emit_block_name(env, block);
2031                 be_emit_cstring(env, ": */\n");
2032         }
2033         be_emit_write_line(env);
2034 }
2035
2036 /**
2037  * Walks over the nodes in a block connected by scheduling edges
2038  * and emits code for each node.
2039  */
2040 static
2041 void ia32_gen_block(ia32_emit_env_t *env, ir_node *block, ir_node *last_block)
2042 {
2043         const ir_node *node;
2044
2045         ia32_emit_block_header(env, block, last_block);
2046
2047         /* emit the contents of the block */
2048         ia32_emit_dbg(env, block);
2049         sched_foreach(block, node) {
2050                 ia32_emit_node(env, node);
2051         }
2052 }
2053
2054 /**
2055  * Emits code for function start.
2056  */
2057 static
2058 void ia32_emit_func_prolog(ia32_emit_env_t *env, ir_graph *irg) {
2059         ir_entity  *irg_ent  = get_irg_entity(irg);
2060         const char *irg_name = get_entity_ld_name(irg_ent);
2061         cpu_support cpu      = env->isa->opt_arch;
2062         const be_irg_t *birg = env->cg->birg;
2063
2064         be_emit_write_line(env);
2065         be_gas_emit_switch_section(env->emit, GAS_SECTION_TEXT);
2066         be_dbg_method_begin(birg->main_env->db_handle, irg_ent, be_abi_get_stack_layout(birg->abi));
2067         ia32_emit_align_func(env, cpu);
2068         if (get_entity_visibility(irg_ent) == visibility_external_visible) {
2069                 be_emit_cstring(env, ".global ");
2070                 be_emit_string(env, irg_name);
2071                 be_emit_char(env, '\n');
2072                 be_emit_write_line(env);
2073         }
2074         ia32_emit_function_object(env, irg_name);
2075         be_emit_string(env, irg_name);
2076         be_emit_cstring(env, ":\n");
2077         be_emit_write_line(env);
2078 }
2079
2080 /**
2081  * Emits code for function end
2082  */
2083 static
2084 void ia32_emit_func_epilog(ia32_emit_env_t *env, ir_graph *irg) {
2085         const char *irg_name = get_entity_ld_name(get_irg_entity(irg));
2086         const be_irg_t *birg = env->cg->birg;
2087
2088         ia32_emit_function_size(env, irg_name);
2089         be_dbg_method_end(birg->main_env->db_handle);
2090         be_emit_char(env, '\n');
2091         be_emit_write_line(env);
2092 }
2093
2094 /**
2095  * Block-walker:
2096  * Sets labels for control flow nodes (jump target)
2097  */
2098 static
2099 void ia32_gen_labels(ir_node *block, void *data) {
2100         ir_node *pred;
2101         int n = get_Block_n_cfgpreds(block);
2102
2103         for (n--; n >= 0; n--) {
2104                 pred = get_Block_cfgpred(block, n);
2105                 set_irn_link(pred, block);
2106         }
2107 }
2108
2109 /**
2110  * Main driver. Emits the code for one routine.
2111  */
2112 void ia32_gen_routine(ia32_code_gen_t *cg, ir_graph *irg) {
2113         ia32_emit_env_t env;
2114         ir_node *block;
2115         ir_node *last_block = NULL;
2116         int i, n;
2117
2118         env.isa      = (ia32_isa_t *)cg->arch_env->isa;
2119         env.emit     = &env.isa->emit;
2120         env.arch_env = cg->arch_env;
2121         env.cg       = cg;
2122
2123         ia32_register_emitters();
2124
2125         ia32_emit_func_prolog(&env, irg);
2126         irg_block_walk_graph(irg, ia32_gen_labels, NULL, &env);
2127
2128         n = ARR_LEN(cg->blk_sched);
2129         for (i = 0; i < n;) {
2130                 ir_node *next_bl;
2131
2132                 block   = cg->blk_sched[i];
2133                 ++i;
2134                 next_bl = i < n ? cg->blk_sched[i] : NULL;
2135
2136                 /* set here the link. the emitter expects to find the next block here */
2137                 set_irn_link(block, next_bl);
2138                 ia32_gen_block(&env, block, last_block);
2139                 last_block = block;
2140         }
2141
2142         ia32_emit_func_epilog(&env, irg);
2143 }
2144
2145 void ia32_init_emitter(void)
2146 {
2147         FIRM_DBG_REGISTER(dbg, "firm.be.ia32.emitter");
2148 }