fixed warnings
[libfirm] / ir / be / ia32 / ia32_emitter.c
1 /*
2  * Copyright (C) 1995-2007 University of Karlsruhe.  All right reserved.
3  *
4  * This file is part of libFirm.
5  *
6  * This file may be distributed and/or modified under the terms of the
7  * GNU General Public License version 2 as published by the Free Software
8  * Foundation and appearing in the file LICENSE.GPL included in the
9  * packaging of this file.
10  *
11  * Licensees holding valid libFirm Professional Edition licenses may use
12  * this file in accordance with the libFirm Commercial License.
13  * Agreement provided with the Software.
14  *
15  * This file is provided AS IS with NO WARRANTY OF ANY KIND, INCLUDING THE
16  * WARRANTY OF DESIGN, MERCHANTABILITY AND FITNESS FOR A PARTICULAR
17  * PURPOSE.
18  */
19
20 /**
21  * @file
22  * @brief       This file implements the ia32 node emitter.
23  * @author      Christian Wuerdig, Matthias Braun
24  * @version     $Id$
25  */
26 #ifdef HAVE_CONFIG_H
27 #include "config.h"
28 #endif
29
30 #include <limits.h>
31
32 #include "xmalloc.h"
33 #include "tv.h"
34 #include "iredges.h"
35 #include "debug.h"
36 #include "irgwalk.h"
37 #include "irprintf.h"
38 #include "irop_t.h"
39 #include "irargs_t.h"
40 #include "irprog_t.h"
41 #include "iredges_t.h"
42 #include "execfreq.h"
43 #include "error.h"
44 #include "raw_bitset.h"
45
46 #include "../besched_t.h"
47 #include "../benode_t.h"
48 #include "../beabi.h"
49 #include "../be_dbgout.h"
50 #include "../beemitter.h"
51 #include "../begnuas.h"
52 #include "../beirg_t.h"
53
54 #include "ia32_emitter.h"
55 #include "gen_ia32_emitter.h"
56 #include "gen_ia32_regalloc_if.h"
57 #include "ia32_nodes_attr.h"
58 #include "ia32_new_nodes.h"
59 #include "ia32_map_regs.h"
60 #include "bearch_ia32_t.h"
61
62 DEBUG_ONLY(static firm_dbg_module_t *dbg = NULL;)
63
64 #define BLOCK_PREFIX ".L"
65
66 #define SNPRINTF_BUF_LEN 128
67
68 /**
69  * Returns the register at in position pos.
70  */
71 static
72 const arch_register_t *get_in_reg(ia32_emit_env_t *env, const ir_node *irn,
73                                   int pos)
74 {
75         const arch_env_t       *arch_env = env->arch_env;
76         ir_node                *op;
77         const arch_register_t  *reg = NULL;
78
79         assert(get_irn_arity(irn) > pos && "Invalid IN position");
80
81         /* The out register of the operator at position pos is the
82            in register we need. */
83         op = get_irn_n(irn, pos);
84
85         reg = arch_get_irn_register(arch_env, op);
86
87         assert(reg && "no in register found");
88
89         /* in case of a joker register: just return a valid register */
90         if (arch_register_type_is(reg, joker)) {
91                 const arch_register_req_t *req;
92
93                 /* ask for the requirements */
94                 req = arch_get_register_req(arch_env, irn, pos);
95
96                 if (arch_register_req_is(req, limited)) {
97                         /* in case of limited requirements: get the first allowed register */
98                         unsigned idx = rbitset_next(req->limited, 0, 1);
99                         reg = arch_register_for_index(req->cls, idx);
100                 } else {
101                         /* otherwise get first register in class */
102                         reg = arch_register_for_index(req->cls, 0);
103                 }
104         }
105
106         return reg;
107 }
108
109 /**
110  * Returns the register at out position pos.
111  */
112 static
113 const arch_register_t *get_out_reg(ia32_emit_env_t *env, const ir_node *irn,
114                                    int pos)
115 {
116         const arch_env_t      *arch_env = env->arch_env;
117         ir_node               *proj;
118         const arch_register_t *reg = NULL;
119
120         /* 1st case: irn is not of mode_T, so it has only                 */
121         /*           one OUT register -> good                             */
122         /* 2nd case: irn is of mode_T -> collect all Projs and ask the    */
123         /*           Proj with the corresponding projnum for the register */
124
125         if (get_irn_mode(irn) != mode_T) {
126                 reg = arch_get_irn_register(arch_env, irn);
127         } else if (is_ia32_irn(irn)) {
128                 reg = get_ia32_out_reg(irn, pos);
129         } else {
130                 const ir_edge_t *edge;
131
132                 foreach_out_edge(irn, edge) {
133                         proj = get_edge_src_irn(edge);
134                         assert(is_Proj(proj) && "non-Proj from mode_T node");
135                         if (get_Proj_proj(proj) == pos) {
136                                 reg = arch_get_irn_register(arch_env, proj);
137                                 break;
138                         }
139                 }
140         }
141
142         assert(reg && "no out register found");
143         return reg;
144 }
145
146 /**
147  * Determine the gnu assembler suffix that indicates a mode
148  */
149 static
150 char get_mode_suffix(const ir_mode *mode) {
151         if(mode_is_float(mode)) {
152                 switch(get_mode_size_bits(mode)) {
153                 case 32:
154                         return 's';
155                 case 64:
156                         return 'l';
157                 case 80:
158                         return 't';
159                 }
160         } else {
161                 assert(mode_is_int(mode) || mode_is_reference(mode) || mode_is_character(mode));
162                 switch(get_mode_size_bits(mode)) {
163                 case 64:
164                         return 'q';
165                 case 32:
166                         return 'l';
167                 case 16:
168                         return 'w';
169                 case 8:
170                         return 'b';
171                 }
172         }
173         panic("Can't output mode_suffix for %+F\n", mode);
174 }
175
176 static
177 int produces_result(const ir_node *node) {
178         return !(is_ia32_St(node) ||
179                 is_ia32_CondJmp(node) ||
180                 is_ia32_xCondJmp(node) ||
181                 is_ia32_CmpSet(node) ||
182                 is_ia32_xCmpSet(node) ||
183                 is_ia32_SwitchJmp(node));
184 }
185
186 static
187 const char *ia32_get_reg_name_for_mode(ia32_emit_env_t *env, ir_mode *mode,
188                                        const arch_register_t *reg) {
189         switch(get_mode_size_bits(mode)) {
190                 case 8:
191                         return ia32_get_mapped_reg_name(env->isa->regs_8bit, reg);
192                 case 16:
193                         return ia32_get_mapped_reg_name(env->isa->regs_16bit, reg);
194                 default:
195                         return (char *)arch_register_get_name(reg);
196         }
197 }
198
199 /**
200  * Add a number to a prefix. This number will not be used a second time.
201  */
202 static
203 char *get_unique_label(char *buf, size_t buflen, const char *prefix) {
204         static unsigned long id = 0;
205         snprintf(buf, buflen, "%s%lu", prefix, ++id);
206         return buf;
207 }
208
209 /*************************************************************
210  *             _       _    __   _          _
211  *            (_)     | |  / _| | |        | |
212  *  _ __  _ __ _ _ __ | |_| |_  | |__   ___| |_ __   ___ _ __
213  * | '_ \| '__| | '_ \| __|  _| | '_ \ / _ \ | '_ \ / _ \ '__|
214  * | |_) | |  | | | | | |_| |   | | | |  __/ | |_) |  __/ |
215  * | .__/|_|  |_|_| |_|\__|_|   |_| |_|\___|_| .__/ \___|_|
216  * | |                                       | |
217  * |_|                                       |_|
218  *************************************************************/
219
220 // we have no C++ and can't define an implicit ia32_emit_env_t* cast to
221 // be_emit_env_t* so we cheat a bit...
222 #define be_emit_char(env,c)             be_emit_char(env->emit,c)
223 #define be_emit_string(env,s)           be_emit_string(env->emit,s)
224 #undef be_emit_cstring
225 #define be_emit_cstring(env,x)          { be_emit_string_len(env->emit, x, sizeof(x)-1); }
226 #define be_emit_ident(env,i)            be_emit_ident(env->emit,i)
227 #define be_emit_tarval(env,tv)          be_emit_tarval(env->emit,tv)
228 #define be_emit_write_line(env)         be_emit_write_line(env->emit)
229 #define be_emit_finish_line_gas(env,n)  be_emit_finish_line_gas(env->emit,n)
230 #define be_emit_pad_comment(env)        be_emit_pad_comment(env->emit)
231
232 void ia32_emit_source_register(ia32_emit_env_t *env, const ir_node *node, int pos)
233 {
234         const arch_register_t *reg = get_in_reg(env, node, pos);
235         const char *reg_name = arch_register_get_name(reg);
236
237         assert(pos < get_irn_arity(node));
238
239         be_emit_char(env, '%');
240         be_emit_string(env, reg_name);
241 }
242
243 void ia32_emit_dest_register(ia32_emit_env_t *env, const ir_node *node, int pos) {
244         const arch_register_t *reg = get_out_reg(env, node, pos);
245         const char *reg_name = arch_register_get_name(reg);
246
247         be_emit_char(env, '%');
248         be_emit_string(env, reg_name);
249 }
250
251 void ia32_emit_x87_name(ia32_emit_env_t *env, const ir_node *node, int pos)
252 {
253         const ia32_x87_attr_t *attr = get_ia32_x87_attr_const(node);
254
255         assert(pos < 3);
256         be_emit_char(env, '%');
257         be_emit_string(env, attr->x87[pos]->name);
258 }
259
260 void ia32_emit_immediate(ia32_emit_env_t *env, const ir_node *node)
261 {
262         tarval *tv;
263         ir_entity *ent;
264         ident *id;
265
266         be_emit_char(env, '$');
267
268         switch(get_ia32_immop_type(node)) {
269         case ia32_ImmConst:
270                 tv = get_ia32_Immop_tarval(node);
271                 be_emit_tarval(env, tv);
272                 return;
273         case ia32_ImmSymConst:
274                 ent = get_ia32_Immop_symconst(node);
275                 mark_entity_visited(ent);
276                 id = get_entity_ld_ident(ent);
277                 be_emit_ident(env, id);
278                 return;
279         case ia32_ImmNone:
280                 break;
281         }
282
283         assert(0);
284         be_emit_string(env, "BAD");
285         return;
286 }
287
288 static
289 void ia32_emit_mode_suffix_mode(ia32_emit_env_t *env, const ir_mode *mode)
290 {
291         be_emit_char(env, get_mode_suffix(mode));
292 }
293
294 void ia32_emit_mode_suffix(ia32_emit_env_t *env, const ir_node *node)
295 {
296         ir_mode *mode = get_ia32_ls_mode(node);
297         if(mode == NULL)
298                 mode = mode_Iu;
299
300         ia32_emit_mode_suffix_mode(env, mode);
301 }
302
303 void ia32_emit_x87_mode_suffix(ia32_emit_env_t *env, const ir_node *node)
304 {
305         ir_mode *mode = get_ia32_ls_mode(node);
306         if(mode != NULL)
307                 ia32_emit_mode_suffix_mode(env, mode);
308 }
309
310 static
311 char get_xmm_mode_suffix(ir_mode *mode)
312 {
313         assert(mode_is_float(mode));
314         switch(get_mode_size_bits(mode)) {
315         case 32:
316                 return 's';
317         case 64:
318                 return 'd';
319         default:
320                 assert(0);
321         }
322         return '%';
323 }
324
325 void ia32_emit_xmm_mode_suffix(ia32_emit_env_t *env, const ir_node *node)
326 {
327         ir_mode *mode = get_ia32_ls_mode(node);
328         assert(mode != NULL);
329         be_emit_char(env, 's');
330         be_emit_char(env, get_xmm_mode_suffix(mode));
331 }
332
333 void ia32_emit_xmm_mode_suffix_s(ia32_emit_env_t *env, const ir_node *node)
334 {
335         ir_mode *mode = get_ia32_ls_mode(node);
336         assert(mode != NULL);
337         be_emit_char(env, get_xmm_mode_suffix(mode));
338 }
339
340 void ia32_emit_extend_suffix(ia32_emit_env_t *env, const ir_mode *mode)
341 {
342         if(get_mode_size_bits(mode) == 32)
343                 return;
344         if(mode_is_signed(mode)) {
345                 be_emit_char(env, 's');
346         } else {
347                 be_emit_char(env, 'z');
348         }
349 }
350
351 static
352 void ia32_emit_function_object(ia32_emit_env_t *env, const char *name)
353 {
354         switch (be_gas_flavour) {
355         case GAS_FLAVOUR_NORMAL:
356                 be_emit_cstring(env, "\t.type\t");
357                 be_emit_string(env, name);
358                 be_emit_cstring(env, ", @function\n");
359                 be_emit_write_line(env);
360                 break;
361         case GAS_FLAVOUR_MINGW:
362                 be_emit_cstring(env, "\t.def\t");
363                 be_emit_string(env, name);
364                 be_emit_cstring(env, ";\t.scl\t2;\t.type\t32;\t.endef\n");
365                 be_emit_write_line(env);
366                 break;
367         default:
368                 break;
369         }
370 }
371
372 static
373 void ia32_emit_function_size(ia32_emit_env_t *env, const char *name)
374 {
375         switch (be_gas_flavour) {
376         case GAS_FLAVOUR_NORMAL:
377                 be_emit_cstring(env, "\t.size\t");
378                 be_emit_string(env, name);
379                 be_emit_cstring(env, ", .-");
380                 be_emit_string(env, name);
381                 be_emit_char(env, '\n');
382                 be_emit_write_line(env);
383                 break;
384         default:
385                 break;
386         }
387 }
388
389
390 static
391 void emit_ia32_Immediate(ia32_emit_env_t *env, const ir_node *node);
392
393 /**
394  * Emits registers and/or address mode of a binary operation.
395  */
396 void ia32_emit_binop(ia32_emit_env_t *env, const ir_node *node) {
397         const ir_node *right_op;
398
399         switch(get_ia32_op_type(node)) {
400         case ia32_Normal:
401                 right_op = get_irn_n(node, 3);
402                 if(is_ia32_Immediate(right_op)) {
403                         emit_ia32_Immediate(env, right_op);
404                         be_emit_cstring(env, ", ");
405                         ia32_emit_source_register(env, node, 2);
406                         break;
407                 } else if (is_ia32_ImmConst(node) || is_ia32_ImmSymConst(node)) {
408                         ia32_emit_immediate(env, node);
409                         be_emit_cstring(env, ", ");
410                         ia32_emit_source_register(env, node, 2);
411                 } else {
412                         const arch_register_t *in1 = get_in_reg(env, node, 2);
413                         const arch_register_t *in2 = get_in_reg(env, node, 3);
414                         const arch_register_t *out = produces_result(node) ? get_out_reg(env, node, 0) : NULL;
415                         const arch_register_t *in;
416                         const char            *in_name;
417
418                         in      = out ? (REGS_ARE_EQUAL(out, in2) ? in1 : in2) : in2;
419                         out     = out ? out : in1;
420                         in_name = arch_register_get_name(in);
421
422                         if (is_ia32_emit_cl(node)) {
423                                 assert(REGS_ARE_EQUAL(&ia32_gp_regs[REG_ECX], in) && "shift operation needs ecx");
424                                 in_name = "cl";
425                         }
426
427                         be_emit_char(env, '%');
428                         be_emit_string(env, in_name);
429                         be_emit_cstring(env, ", %");
430                         be_emit_string(env, arch_register_get_name(out));
431                 }
432                 break;
433         case ia32_AddrModeS:
434                 ia32_emit_am(env, node);
435                 be_emit_cstring(env, ", ");
436                 if (is_ia32_ImmConst(node) || is_ia32_ImmSymConst(node)) {
437                         assert(!produces_result(node) && "Source AM with Const must not produce result");
438                         ia32_emit_immediate(env, node);
439                 } else if (produces_result(node)) {
440                         ia32_emit_dest_register(env, node, 0);
441                 } else {
442                         ia32_emit_source_register(env, node, 2);
443                 }
444                 break;
445         case ia32_AddrModeD:
446                 right_op = get_irn_n(node, 3);
447                 if(is_ia32_Immediate(right_op)) {
448                         emit_ia32_Immediate(env, right_op);
449                         be_emit_cstring(env, ", ");
450                         ia32_emit_am(env, node);
451                         break;
452                 } else if (is_ia32_ImmConst(node) || is_ia32_ImmSymConst(node)) {
453                         ia32_emit_immediate(env, node);
454                         be_emit_cstring(env, ", ");
455                         ia32_emit_am(env, node);
456                 } else {
457                         const arch_register_t *in1 = get_in_reg(env, node,
458                                                                     get_irn_arity(node) == 5 ? 3 : 2);
459                         ir_mode               *mode = get_ia32_ls_mode(node);
460                         const char            *in_name;
461
462                         in_name = ia32_get_reg_name_for_mode(env, mode, in1);
463
464                         if (is_ia32_emit_cl(node)) {
465                                 assert(REGS_ARE_EQUAL(&ia32_gp_regs[REG_ECX], in1) && "shift operation needs ecx");
466                                 in_name = "cl";
467                         }
468
469                         be_emit_char(env, '%');
470                         be_emit_string(env, in_name);
471                         be_emit_cstring(env, ", ");
472                         ia32_emit_am(env, node);
473                 }
474                 break;
475         default:
476                 assert(0 && "unsupported op type");
477         }
478 }
479
480 /**
481  * Emits registers and/or address mode of a binary operation.
482  */
483 void ia32_emit_x87_binop(ia32_emit_env_t *env, const ir_node *node) {
484         switch(get_ia32_op_type(node)) {
485                 case ia32_Normal:
486                         if (is_ia32_ImmConst(node) || is_ia32_ImmSymConst(node)) {
487                                 // should not happen...
488                                 assert(0);
489                         } else {
490                                 const ia32_x87_attr_t *x87_attr = get_ia32_x87_attr_const(node);
491                                 const arch_register_t *in1      = x87_attr->x87[0];
492                                 const arch_register_t *in2      = x87_attr->x87[1];
493                                 const arch_register_t *out      = x87_attr->x87[2];
494                                 const arch_register_t *in;
495
496                                 in  = out ? (REGS_ARE_EQUAL(out, in2) ? in1 : in2) : in2;
497                                 out = out ? out : in1;
498
499                                 be_emit_char(env, '%');
500                                 be_emit_string(env, arch_register_get_name(in));
501                                 be_emit_cstring(env, ", %");
502                                 be_emit_string(env, arch_register_get_name(out));
503                         }
504                         break;
505                 case ia32_AddrModeS:
506                 case ia32_AddrModeD:
507                         ia32_emit_am(env, node);
508                         break;
509                 default:
510                         assert(0 && "unsupported op type");
511         }
512 }
513
514 void ia32_emit_am_or_dest_register(ia32_emit_env_t *env, const ir_node *node,
515                                    int pos) {
516         if(get_ia32_op_type(node) == ia32_Normal) {
517                 ia32_emit_dest_register(env, node, pos);
518         } else {
519                 assert(get_ia32_op_type(node) == ia32_AddrModeD);
520                 ia32_emit_am(env, node);
521         }
522 }
523
524 /**
525  * Emits registers and/or address mode of a unary operation.
526  */
527 void ia32_emit_unop(ia32_emit_env_t *env, const ir_node *node, int pos) {
528         const ir_node *op;
529
530         switch(get_ia32_op_type(node)) {
531         case ia32_Normal:
532                 op = get_irn_n(node, pos);
533                 if (is_ia32_Immediate(op)) {
534                         emit_ia32_Immediate(env, op);
535                 } else if (is_ia32_ImmConst(node) || is_ia32_ImmSymConst(node)) {
536                         ia32_emit_immediate(env, node);
537                 } else {
538                         ia32_emit_source_register(env, node, pos);
539                 }
540                 break;
541         case ia32_AddrModeS:
542         case ia32_AddrModeD:
543                 ia32_emit_am(env, node);
544                 break;
545         default:
546                 assert(0 && "unsupported op type");
547         }
548 }
549
550 /**
551  * Emits address mode.
552  */
553 void ia32_emit_am(ia32_emit_env_t *env, const ir_node *node) {
554         ir_entity *ent       = get_ia32_am_sc(node);
555         int        offs      = get_ia32_am_offs_int(node);
556         ir_node   *base      = get_irn_n(node, 0);
557         int        has_base  = !is_ia32_NoReg_GP(base);
558         ir_node   *index     = get_irn_n(node, 1);
559         int        has_index = !is_ia32_NoReg_GP(index);
560
561         /* just to be sure... */
562         assert(!is_ia32_use_frame(node) || get_ia32_frame_ent(node) != NULL);
563
564         /* emit offset */
565         if (ent != NULL) {
566                 ident *id;
567
568                 mark_entity_visited(ent);
569                 id = get_entity_ld_ident(ent);
570                 if (is_ia32_am_sc_sign(node))
571                         be_emit_char(env, '-');
572                 be_emit_ident(env, id);
573
574                 if(get_entity_owner(ent) == get_tls_type()) {
575                         if (get_entity_visibility(ent) == visibility_external_allocated) {
576                                 be_emit_cstring(env, "@INDNTPOFF");
577                         } else {
578                                 be_emit_cstring(env, "@NTPOFF");
579                         }
580                 }
581         }
582
583         if(offs != 0) {
584                 if(ent != NULL) {
585                         be_emit_irprintf(env->emit, "%+d", offs);
586                 } else {
587                         be_emit_irprintf(env->emit, "%d", offs);
588                 }
589         }
590
591         if (has_base || has_index) {
592                 be_emit_char(env, '(');
593
594                 /* emit base */
595                 if (has_base) {
596                         ia32_emit_source_register(env, node, 0);
597                 }
598
599                 /* emit index + scale */
600                 if (has_index) {
601                         int scale;
602                         be_emit_char(env, ',');
603                         ia32_emit_source_register(env, node, 1);
604
605                         scale = get_ia32_am_scale(node);
606                         if (scale > 0) {
607                                 be_emit_irprintf(env->emit, ",%d", 1 << get_ia32_am_scale(node));
608                         }
609                 }
610                 be_emit_char(env, ')');
611         }
612 }
613
614 /*************************************************
615  *                 _ _                         _
616  *                (_) |                       | |
617  *   ___ _ __ ___  _| |_    ___ ___  _ __   __| |
618  *  / _ \ '_ ` _ \| | __|  / __/ _ \| '_ \ / _` |
619  * |  __/ | | | | | | |_  | (_| (_) | | | | (_| |
620  *  \___|_| |_| |_|_|\__|  \___\___/|_| |_|\__,_|
621  *
622  *************************************************/
623
624 #undef IA32_DO_EMIT
625 #define IA32_DO_EMIT(irn) ia32_fprintf_format(F, irn, cmd_buf, cmnt_buf)
626
627 /*
628  * coding of conditions
629  */
630 struct cmp2conditon_t {
631         const char *name;
632         pn_Cmp      num;
633 };
634
635 /*
636  * positive conditions for signed compares
637  */
638 static
639 const struct cmp2conditon_t cmp2condition_s[] = {
640         { NULL,              pn_Cmp_False },  /* always false */
641         { "e",               pn_Cmp_Eq },     /* == */
642         { "l",               pn_Cmp_Lt },     /* < */
643         { "le",              pn_Cmp_Le },     /* <= */
644         { "g",               pn_Cmp_Gt },     /* > */
645         { "ge",              pn_Cmp_Ge },     /* >= */
646         { "ne",              pn_Cmp_Lg },     /* != */
647         { NULL,              pn_Cmp_Leg},     /* Floating point: ordered */
648         { NULL,              pn_Cmp_Uo },     /* Floating point: unordered */
649         { "e",               pn_Cmp_Ue },     /* Floating point: unordered or == */
650         { "b",               pn_Cmp_Ul },     /* Floating point: unordered or < */
651         { "be",              pn_Cmp_Ule },    /* Floating point: unordered or <= */
652         { "a",               pn_Cmp_Ug },     /* Floating point: unordered or > */
653         { "ae",              pn_Cmp_Uge },    /* Floating point: unordered or >= */
654         { "ne",              pn_Cmp_Ne },     /* Floating point: unordered or != */
655         { NULL,              pn_Cmp_True },   /* always true */
656 };
657
658 /*
659  * positive conditions for unsigned compares
660  */
661 static
662 const struct cmp2conditon_t cmp2condition_u[] = {
663         { NULL,              pn_Cmp_False },  /* always false */
664         { "e",               pn_Cmp_Eq },     /* == */
665         { "b",               pn_Cmp_Lt },     /* < */
666         { "be",              pn_Cmp_Le },     /* <= */
667         { "a",               pn_Cmp_Gt },     /* > */
668         { "ae",              pn_Cmp_Ge },     /* >= */
669         { "ne",              pn_Cmp_Lg },     /* != */
670         { NULL,              pn_Cmp_True },   /* always true */
671 };
672
673 /*
674  * returns the condition code
675  */
676 static
677 const char *get_cmp_suffix(pn_Cmp cmp_code)
678 {
679         assert( (cmp2condition_s[cmp_code & 15].num) == (cmp_code & 15));
680         assert( (cmp2condition_u[cmp_code & 7].num) == (cmp_code & 7));
681
682         if((cmp_code & ia32_pn_Cmp_Unsigned)) {
683                 return cmp2condition_u[cmp_code & 7].name;
684         } else {
685                 return cmp2condition_s[cmp_code & 15].name;
686         }
687 }
688
689 void ia32_emit_cmp_suffix(ia32_emit_env_t *env, long pnc)
690 {
691         be_emit_string(env, get_cmp_suffix(pnc));
692 }
693
694
695 /**
696  * Returns the target block for a control flow node.
697  */
698 static
699 ir_node *get_cfop_target_block(const ir_node *irn) {
700         return get_irn_link(irn);
701 }
702
703 static
704 void ia32_emit_block_name(ia32_emit_env_t *env, const ir_node *block)
705 {
706         be_emit_cstring(env, BLOCK_PREFIX);
707         be_emit_irprintf(env->emit, "%d", get_irn_node_nr(block));
708 }
709
710 /**
711  * Returns the target label for a control flow node.
712  */
713 static
714 void ia32_emit_cfop_target(ia32_emit_env_t * env, const ir_node *node) {
715         ir_node *block = get_cfop_target_block(node);
716
717         ia32_emit_block_name(env, block);
718 }
719
720 /** Return the next block in Block schedule */
721 static ir_node *next_blk_sched(const ir_node *block) {
722         return get_irn_link(block);
723 }
724
725 /**
726  * Returns the Proj with projection number proj and NOT mode_M
727  */
728 static
729 ir_node *get_proj(const ir_node *node, long proj) {
730         const ir_edge_t *edge;
731         ir_node         *src;
732
733         assert(get_irn_mode(node) == mode_T && "expected mode_T node");
734
735         foreach_out_edge(node, edge) {
736                 src = get_edge_src_irn(edge);
737
738                 assert(is_Proj(src) && "Proj expected");
739                 if (get_irn_mode(src) == mode_M)
740                         continue;
741
742                 if (get_Proj_proj(src) == proj)
743                         return src;
744         }
745         return NULL;
746 }
747
748 /**
749  * Emits the jump sequence for a conditional jump (cmp + jmp_true + jmp_false)
750  */
751 static
752 void finish_CondJmp(ia32_emit_env_t *env, const ir_node *node, ir_mode *mode,
753                     long pnc) {
754         const ir_node *proj_true;
755         const ir_node *proj_false;
756         const ir_node *block;
757         const ir_node *next_block;
758         int flipped = 0;
759
760         /* get both Proj's */
761         proj_true = get_proj(node, pn_Cond_true);
762         assert(proj_true && "CondJmp without true Proj");
763
764         proj_false = get_proj(node, pn_Cond_false);
765         assert(proj_false && "CondJmp without false Proj");
766
767         /* for now, the code works for scheduled and non-schedules blocks */
768         block = get_nodes_block(node);
769
770         /* we have a block schedule */
771         next_block = next_blk_sched(block);
772
773         if (get_cfop_target_block(proj_true) == next_block) {
774                 /* exchange both proj's so the second one can be omitted */
775                 const ir_node *t = proj_true;
776
777                 proj_true  = proj_false;
778                 proj_false = t;
779                 flipped    = 1;
780                 pnc        = get_negated_pnc(pnc, mode);
781         }
782
783         /* in case of unordered compare, check for parity */
784         if (pnc & pn_Cmp_Uo) {
785                 be_emit_cstring(env, "\tjp ");
786                 ia32_emit_cfop_target(env, proj_true);
787                 be_emit_finish_line_gas(env, proj_true);
788         }
789
790         be_emit_cstring(env, "\tj");
791         ia32_emit_cmp_suffix(env, pnc);
792         be_emit_char(env, ' ');
793         ia32_emit_cfop_target(env, proj_true);
794         be_emit_finish_line_gas(env, proj_true);
795
796         /* the second Proj might be a fallthrough */
797         if (get_cfop_target_block(proj_false) != next_block) {
798                 be_emit_cstring(env, "\tjmp ");
799                 ia32_emit_cfop_target(env, proj_false);
800                 be_emit_finish_line_gas(env, proj_false);
801         } else {
802                 be_emit_cstring(env, "\t/* fallthrough to ");
803                 ia32_emit_cfop_target(env, proj_false);
804                 be_emit_cstring(env, " */");
805                 be_emit_finish_line_gas(env, proj_false);
806         }
807 }
808
809 /**
810  * Emits code for conditional jump.
811  */
812 static
813 void CondJmp_emitter(ia32_emit_env_t *env, const ir_node *node) {
814         be_emit_cstring(env, "\tcmp ");
815         ia32_emit_binop(env, node);
816         be_emit_finish_line_gas(env, node);
817
818         finish_CondJmp(env, node, mode_Iu, get_ia32_pncode(node));
819 }
820
821 /**
822  * Emits code for conditional jump with two variables.
823  */
824 static
825 void emit_ia32_CondJmp(ia32_emit_env_t *env, const ir_node *node) {
826         CondJmp_emitter(env, node);
827 }
828
829 /**
830  * Emits code for conditional test and jump.
831  */
832 static
833 void TestJmp_emitter(ia32_emit_env_t *env, const ir_node *node) {
834         if(is_ia32_ImmSymConst(node) || is_ia32_ImmConst(node)) {
835                 be_emit_cstring(env, "\ttest ");
836                 ia32_emit_immediate(env, node);
837                 be_emit_cstring(env, ", ");
838                 ia32_emit_source_register(env, node, 0);
839                 be_emit_finish_line_gas(env, node);
840         } else {
841                 be_emit_cstring(env, "\ttest ");
842                 ia32_emit_source_register(env, node, 1);
843                 be_emit_cstring(env, ", ");
844                 ia32_emit_source_register(env, node, 0);
845                 be_emit_finish_line_gas(env, node);
846         }
847         finish_CondJmp(env, node, mode_Iu, get_ia32_pncode(node));
848 }
849
850 /**
851  * Emits code for conditional test and jump with two variables.
852  */
853 static
854 void emit_ia32_TestJmp(ia32_emit_env_t *env, const ir_node *node) {
855         TestJmp_emitter(env, node);
856 }
857
858 static
859 void emit_ia32_CJmp(ia32_emit_env_t *env, const ir_node *node) {
860         be_emit_cstring(env, "/* omitted redundant test */");
861         be_emit_finish_line_gas(env, node);
862
863         finish_CondJmp(env, node, mode_Is, get_ia32_pncode(node));
864 }
865
866 static
867 void emit_ia32_CJmpAM(ia32_emit_env_t *env, const ir_node *node) {
868         be_emit_cstring(env, "/* omitted redundant test/cmp */");
869         be_emit_finish_line_gas(env, node);
870
871         finish_CondJmp(env, node, mode_Is, get_ia32_pncode(node));
872 }
873
874 /**
875  * Emits code for conditional SSE floating point jump with two variables.
876  */
877 static
878 void emit_ia32_xCondJmp(ia32_emit_env_t *env, const ir_node *node) {
879         be_emit_cstring(env, "\tucomi");
880         ia32_emit_xmm_mode_suffix(env, node);
881         be_emit_char(env, ' ');
882         ia32_emit_binop(env, node);
883         be_emit_finish_line_gas(env, node);
884
885         finish_CondJmp(env, node, mode_F, get_ia32_pncode(node));
886 }
887
888 /**
889  * Emits code for conditional x87 floating point jump with two variables.
890  */
891 static
892 void emit_ia32_x87CondJmp(ia32_emit_env_t *env, const ir_node *node) {
893         const ia32_x87_attr_t *x87_attr = get_ia32_x87_attr_const(node);
894         const char            *reg      = x87_attr->x87[1]->name;
895         long                   pnc      = get_ia32_pncode(node);
896
897         switch (get_ia32_irn_opcode(node)) {
898         case iro_ia32_fcomrJmp:
899                 pnc = get_inversed_pnc(pnc);
900                 reg = x87_attr->x87[0]->name;
901         case iro_ia32_fcomJmp:
902         default:
903                 be_emit_cstring(env, "\tfucom ");
904                 break;
905         case iro_ia32_fcomrpJmp:
906                 pnc = get_inversed_pnc(pnc);
907                 reg = x87_attr->x87[0]->name;
908         case iro_ia32_fcompJmp:
909                 be_emit_cstring(env, "\tfucomp ");
910                 break;
911         case iro_ia32_fcomrppJmp:
912                 pnc = get_inversed_pnc(pnc);
913         case iro_ia32_fcomppJmp:
914                 be_emit_cstring(env, "\tfucompp ");
915                 reg = "";
916                 break;
917         }
918
919         if(reg[0] != '\0') {
920                 be_emit_char(env, '%');
921                 be_emit_string(env, reg);
922         }
923         be_emit_finish_line_gas(env, node);
924
925         be_emit_cstring(env, "\tfnstsw %ax");
926         be_emit_finish_line_gas(env, node);
927         be_emit_cstring(env, "\tsahf");
928         be_emit_finish_line_gas(env, node);
929
930         finish_CondJmp(env, node, mode_E, pnc);
931 }
932
933 static
934 void emit_register_or_immediate(ia32_emit_env_t *env, const ir_node *node,
935                                 int pos)
936 {
937         ir_node *op = get_irn_n(node, pos);
938         if(is_ia32_Immediate(op)) {
939                 emit_ia32_Immediate(env, op);
940         } else {
941                 ia32_emit_source_register(env, node, pos);
942         }
943 }
944
945 static
946 int is_ia32_Immediate_0(const ir_node *node)
947 {
948         const ia32_immediate_attr_t *attr = get_ia32_immediate_attr_const(node);
949         tarval                      *tv   = attr->offset;
950
951         if(tv == NULL || attr->symconst != NULL)
952                 return 0;
953
954         return classify_tarval(tv) == CNST_NULL;
955 }
956
957 static
958 void CMov_emitter(ia32_emit_env_t *env, const ir_node *node)
959 {
960         long pnc = get_ia32_pncode(node);
961         const arch_register_t *in1, *in2, *out;
962
963         out = arch_get_irn_register(env->arch_env, node);
964         in1 = arch_get_irn_register(env->arch_env, get_irn_n(node, 2));
965         in2 = arch_get_irn_register(env->arch_env, get_irn_n(node, 3));
966
967         /* we have to emit the cmp first, because the destination register */
968         /* could be one of the compare registers                           */
969         if (is_ia32_CmpCMov(node)) {
970                 long pncr = pnc & ~ia32_pn_Cmp_Unsigned;
971                 ir_node *cmp_right = get_irn_n(node, 1);
972
973                 if( (pncr == pn_Cmp_Eq || pncr == pn_Cmp_Lg)
974                                 && is_ia32_Immediate(cmp_right)
975                                 && is_ia32_Immediate_0(cmp_right)) {
976                         be_emit_cstring(env, "\ttest ");
977                         ia32_emit_source_register(env, node, 0);
978                         be_emit_cstring(env, ", ");
979                         ia32_emit_source_register(env, node, 0);
980                 } else {
981                         be_emit_cstring(env, "\tcmp ");
982                         emit_register_or_immediate(env, node, 1);
983                         be_emit_cstring(env, ", ");
984                         ia32_emit_source_register(env, node, 0);
985                 }
986         } else if (is_ia32_xCmpCMov(node)) {
987                 be_emit_cstring(env, "\tucomis");
988                 ia32_emit_mode_suffix_mode(env, get_irn_mode(node));
989                 be_emit_char(env, ' ');
990                 ia32_emit_source_register(env, node, 1);
991                 be_emit_cstring(env, ", ");
992                 ia32_emit_source_register(env, node, 0);
993         } else {
994                 assert(0 && "unsupported CMov");
995         }
996         be_emit_finish_line_gas(env, node);
997
998         if (REGS_ARE_EQUAL(out, in2)) {
999                 /* best case: default in == out -> do nothing */
1000         } else if (REGS_ARE_EQUAL(out, in1)) {
1001                 ir_node *n = (ir_node*) node;
1002                 /* true in == out -> need complement compare and exchange true and default in */
1003                 ir_node *t = get_irn_n(n, 2);
1004                 set_irn_n(n, 2, get_irn_n(n, 3));
1005                 set_irn_n(n, 3, t);
1006
1007                 pnc = get_negated_pnc(pnc, get_irn_mode(node));
1008         } else {
1009                 /* out is different from in: need copy default -> out */
1010                 be_emit_cstring(env, "\tmovl ");
1011                 ia32_emit_source_register(env, node, n_ia32_CmpCMov_val_false);
1012                 be_emit_cstring(env, ", ");
1013                 ia32_emit_dest_register(env, node, 0);
1014                 be_emit_finish_line_gas(env, node);
1015         }
1016
1017         be_emit_cstring(env, "\tcmov");
1018         ia32_emit_cmp_suffix(env, pnc);
1019         be_emit_cstring(env, "l ");
1020         ia32_emit_source_register(env, node, n_ia32_CmpCMov_val_true);
1021         be_emit_cstring(env, ", ");
1022         ia32_emit_dest_register(env, node, 0);
1023         be_emit_finish_line_gas(env, node);
1024 }
1025
1026 static
1027 void emit_ia32_CmpCMov(ia32_emit_env_t *env, const ir_node *node)
1028 {
1029         CMov_emitter(env, node);
1030 }
1031
1032 static
1033 void emit_ia32_xCmpCMov(ia32_emit_env_t *env, const ir_node *node)
1034 {
1035         CMov_emitter(env, node);
1036 }
1037
1038 static
1039 void Set_emitter(ia32_emit_env_t *env, const ir_node *node)
1040 {
1041         long pnc = get_ia32_pncode(node);
1042         const char *reg8bit;
1043         const arch_register_t *out;
1044
1045         out     = arch_get_irn_register(env->arch_env, node);
1046         reg8bit = ia32_get_mapped_reg_name(env->isa->regs_8bit, out);
1047
1048         if (is_ia32_CmpSet(node)) {
1049                 long     pncr      = pnc & ~ia32_pn_Cmp_Unsigned;
1050                 ir_node *cmp_right = get_irn_n(node, n_ia32_CmpSet_cmp_right);
1051
1052                 if( (pncr == pn_Cmp_Eq || pncr == pn_Cmp_Lg)
1053                                 && is_ia32_Immediate(cmp_right)
1054                                 && is_ia32_Immediate_0(cmp_right)) {
1055                         be_emit_cstring(env, "\ttest ");
1056                         ia32_emit_source_register(env, node, n_ia32_CmpSet_cmp_left);
1057                         be_emit_cstring(env, ", ");
1058                         ia32_emit_source_register(env, node, n_ia32_CmpSet_cmp_left);
1059                 } else {
1060                         be_emit_cstring(env, "\tcmp ");
1061                         ia32_emit_binop(env, node);
1062                 }
1063         } else if (is_ia32_xCmpSet(node)) {
1064                 be_emit_cstring(env, "\tucomis");
1065                 ia32_emit_mode_suffix_mode(env, get_irn_mode(get_irn_n(node, 2)));
1066                 be_emit_char(env, ' ');
1067                 ia32_emit_binop(env, node);
1068         } else {
1069                 assert(0 && "unsupported Set");
1070         }
1071         be_emit_finish_line_gas(env, node);
1072
1073         /* use mov to clear target because it doesn't affect the eflags */
1074         be_emit_cstring(env, "\tmovl $0, %");
1075         be_emit_string(env, arch_register_get_name(out));
1076         be_emit_finish_line_gas(env, node);
1077
1078         be_emit_cstring(env, "\tset");
1079         ia32_emit_cmp_suffix(env, pnc);
1080         be_emit_cstring(env, " %");
1081         be_emit_string(env, reg8bit);
1082         be_emit_finish_line_gas(env, node);
1083 }
1084
1085 static
1086 void emit_ia32_CmpSet(ia32_emit_env_t *env, const ir_node *node) {
1087         Set_emitter(env, node);
1088 }
1089
1090 static
1091 void emit_ia32_xCmpSet(ia32_emit_env_t *env, const ir_node *node) {
1092         Set_emitter(env, node);
1093 }
1094
1095 static
1096 void emit_ia32_xCmp(ia32_emit_env_t *env, const ir_node *node) {
1097         int  sse_pnc  = -1;
1098         long pnc      = get_ia32_pncode(node);
1099         long unord    = pnc & pn_Cmp_Uo;
1100
1101         assert( (pnc & ia32_pn_Cmp_Unsigned) == 0);
1102
1103         switch (pnc) {
1104                 case pn_Cmp_Leg: /* odered */
1105                         sse_pnc = 7;
1106                         break;
1107                 case pn_Cmp_Uo:  /* unordered */
1108                         sse_pnc = 3;
1109                         break;
1110                 case pn_Cmp_Ue:
1111                 case pn_Cmp_Eq:  /* == */
1112                         sse_pnc = 0;
1113                         break;
1114                 case pn_Cmp_Ul:
1115                 case pn_Cmp_Lt:  /* < */
1116                         sse_pnc = 1;
1117                         break;
1118                 case pn_Cmp_Ule:
1119                 case pn_Cmp_Le: /* <= */
1120                         sse_pnc = 2;
1121                         break;
1122                 case pn_Cmp_Ug:
1123                 case pn_Cmp_Gt:  /* > */
1124                         sse_pnc = 6;
1125                         break;
1126                 case pn_Cmp_Uge:
1127                 case pn_Cmp_Ge: /* >= */
1128                         sse_pnc = 5;
1129                         break;
1130                 case pn_Cmp_Ne:
1131                 case pn_Cmp_Lg:  /* != */
1132                         sse_pnc = 4;
1133                         break;
1134         }
1135
1136         assert(sse_pnc >= 0 && "unsupported compare");
1137
1138         if (unord && sse_pnc != 3) {
1139                 /*
1140                         We need a separate compare against unordered.
1141                         Quick and Dirty solution:
1142                         - get some memory on stack
1143                         - compare
1144                         - store result
1145                         - compare
1146                         - and result and stored result
1147                     - cleanup stack
1148                 */
1149                 be_emit_cstring(env, "\tsubl $8, %esp");
1150                 be_emit_finish_line_gas(env, node);
1151
1152                 be_emit_cstring(env, "\tcmpsd $3, ");
1153                 ia32_emit_binop(env, node);
1154                 be_emit_finish_line_gas(env, node);
1155
1156                 be_emit_cstring(env, "\tmovsd ");
1157                 ia32_emit_dest_register(env, node, 0);
1158                 be_emit_cstring(env, ", (%esp)");
1159                 be_emit_finish_line_gas(env, node);
1160         }
1161
1162         be_emit_cstring(env, "\tcmpsd ");
1163         be_emit_irprintf(env->emit, "%d, ", sse_pnc);
1164         ia32_emit_binop(env, node);
1165         be_emit_finish_line_gas(env, node);
1166
1167         if (unord && sse_pnc != 3) {
1168                 be_emit_cstring(env, "\tandpd (%esp), ");
1169                 ia32_emit_dest_register(env, node, 0);
1170                 be_emit_finish_line_gas(env, node);
1171
1172                 be_emit_cstring(env, "\taddl $8, %esp");
1173                 be_emit_finish_line_gas(env, node);
1174         }
1175 }
1176
1177 /*********************************************************
1178  *                 _ _       _
1179  *                (_) |     (_)
1180  *   ___ _ __ ___  _| |_     _ _   _ _ __ ___  _ __  ___
1181  *  / _ \ '_ ` _ \| | __|   | | | | | '_ ` _ \| '_ \/ __|
1182  * |  __/ | | | | | | |_    | | |_| | | | | | | |_) \__ \
1183  *  \___|_| |_| |_|_|\__|   | |\__,_|_| |_| |_| .__/|___/
1184  *                         _/ |               | |
1185  *                        |__/                |_|
1186  *********************************************************/
1187
1188 /* jump table entry (target and corresponding number) */
1189 typedef struct _branch_t {
1190         ir_node *target;
1191         int      value;
1192 } branch_t;
1193
1194 /* jump table for switch generation */
1195 typedef struct _jmp_tbl_t {
1196         ir_node  *defProj;         /**< default target */
1197         long      min_value;       /**< smallest switch case */
1198         long      max_value;       /**< largest switch case */
1199         long      num_branches;    /**< number of jumps */
1200         char     *label;           /**< label of the jump table */
1201         branch_t *branches;        /**< jump array */
1202 } jmp_tbl_t;
1203
1204 /**
1205  * Compare two variables of type branch_t. Used to sort all switch cases
1206  */
1207 static
1208 int ia32_cmp_branch_t(const void *a, const void *b) {
1209         branch_t *b1 = (branch_t *)a;
1210         branch_t *b2 = (branch_t *)b;
1211
1212         if (b1->value <= b2->value)
1213                 return -1;
1214         else
1215                 return 1;
1216 }
1217
1218 /**
1219  * Emits code for a SwitchJmp (creates a jump table if
1220  * possible otherwise a cmp-jmp cascade). Port from
1221  * cggg ia32 backend
1222  */
1223 static
1224 void emit_ia32_SwitchJmp(ia32_emit_env_t *env, const ir_node *node) {
1225         unsigned long       interval;
1226         int                 last_value, i;
1227         long                pnc;
1228         jmp_tbl_t           tbl;
1229         ir_node            *proj;
1230         const ir_edge_t    *edge;
1231
1232         /* fill the table structure */
1233         tbl.label        = xmalloc(SNPRINTF_BUF_LEN);
1234         tbl.label        = get_unique_label(tbl.label, SNPRINTF_BUF_LEN, ".TBL_");
1235         tbl.defProj      = NULL;
1236         tbl.num_branches = get_irn_n_edges(node);
1237         tbl.branches     = xcalloc(tbl.num_branches, sizeof(tbl.branches[0]));
1238         tbl.min_value    = INT_MAX;
1239         tbl.max_value    = INT_MIN;
1240
1241         i = 0;
1242         /* go over all proj's and collect them */
1243         foreach_out_edge(node, edge) {
1244                 proj = get_edge_src_irn(edge);
1245                 assert(is_Proj(proj) && "Only proj allowed at SwitchJmp");
1246
1247                 pnc = get_Proj_proj(proj);
1248
1249                 /* create branch entry */
1250                 tbl.branches[i].target = proj;
1251                 tbl.branches[i].value  = pnc;
1252
1253                 tbl.min_value = pnc < tbl.min_value ? pnc : tbl.min_value;
1254                 tbl.max_value = pnc > tbl.max_value ? pnc : tbl.max_value;
1255
1256                 /* check for default proj */
1257                 if (pnc == get_ia32_pncode(node)) {
1258                         assert(tbl.defProj == NULL && "found two defProjs at SwitchJmp");
1259                         tbl.defProj = proj;
1260                 }
1261
1262                 i++;
1263         }
1264
1265         /* sort the branches by their number */
1266         qsort(tbl.branches, tbl.num_branches, sizeof(tbl.branches[0]), ia32_cmp_branch_t);
1267
1268         /* two-complement's magic make this work without overflow */
1269         interval = tbl.max_value - tbl.min_value;
1270
1271         /* emit the table */
1272         be_emit_cstring(env, "\tcmpl $");
1273         be_emit_irprintf(env->emit, "%u, ", interval);
1274         ia32_emit_source_register(env, node, 0);
1275         be_emit_finish_line_gas(env, node);
1276
1277         be_emit_cstring(env, "\tja ");
1278         ia32_emit_cfop_target(env, tbl.defProj);
1279         be_emit_finish_line_gas(env, node);
1280
1281         if (tbl.num_branches > 1) {
1282                 /* create table */
1283                 be_emit_cstring(env, "\tjmp *");
1284                 be_emit_string(env, tbl.label);
1285                 be_emit_cstring(env, "(,");
1286                 ia32_emit_source_register(env, node, 0);
1287                 be_emit_cstring(env, ",4)");
1288                 be_emit_finish_line_gas(env, node);
1289
1290                 be_gas_emit_switch_section(env->emit, GAS_SECTION_RODATA);
1291                 be_emit_cstring(env, "\t.align 4\n");
1292                 be_emit_write_line(env);
1293
1294                 be_emit_string(env, tbl.label);
1295                 be_emit_cstring(env, ":\n");
1296                 be_emit_write_line(env);
1297
1298                 be_emit_cstring(env, ".long ");
1299                 ia32_emit_cfop_target(env, tbl.branches[0].target);
1300                 be_emit_finish_line_gas(env, NULL);
1301
1302                 last_value = tbl.branches[0].value;
1303                 for (i = 1; i < tbl.num_branches; ++i) {
1304                         while (++last_value < tbl.branches[i].value) {
1305                                 be_emit_cstring(env, ".long ");
1306                                 ia32_emit_cfop_target(env, tbl.defProj);
1307                                 be_emit_finish_line_gas(env, NULL);
1308                         }
1309                         be_emit_cstring(env, ".long ");
1310                         ia32_emit_cfop_target(env, tbl.branches[i].target);
1311                         be_emit_finish_line_gas(env, NULL);
1312                 }
1313                 be_gas_emit_switch_section(env->emit, GAS_SECTION_TEXT);
1314         } else {
1315                 /* one jump is enough */
1316                 be_emit_cstring(env, "\tjmp ");
1317                 ia32_emit_cfop_target(env, tbl.branches[0].target);
1318                 be_emit_finish_line_gas(env, node);
1319         }
1320
1321         if (tbl.label)
1322                 free(tbl.label);
1323         if (tbl.branches)
1324                 free(tbl.branches);
1325 }
1326
1327 /**
1328  * Emits code for a unconditional jump.
1329  */
1330 static
1331 void emit_Jmp(ia32_emit_env_t *env, const ir_node *node) {
1332         ir_node *block, *next_block;
1333
1334         /* for now, the code works for scheduled and non-schedules blocks */
1335         block = get_nodes_block(node);
1336
1337         /* we have a block schedule */
1338         next_block = next_blk_sched(block);
1339         if (get_cfop_target_block(node) != next_block) {
1340                 be_emit_cstring(env, "\tjmp ");
1341                 ia32_emit_cfop_target(env, node);
1342         } else {
1343                 be_emit_cstring(env, "\t/* fallthrough to ");
1344                 ia32_emit_cfop_target(env, node);
1345                 be_emit_cstring(env, " */");
1346         }
1347         be_emit_finish_line_gas(env, node);
1348 }
1349
1350 static
1351 void emit_ia32_Immediate(ia32_emit_env_t *env, const ir_node *node)
1352 {
1353         const ia32_immediate_attr_t *attr = get_ia32_immediate_attr_const(node);
1354
1355         assert(attr->symconst != NULL || attr->offset != NULL);
1356         if(attr->symconst != NULL) {
1357                 ident *id = get_entity_ld_ident(attr->symconst);
1358
1359                 if(attr->attr.data.am_sc_sign)
1360                         be_emit_char(env, '-');
1361                 be_emit_ident(env, id);
1362         }
1363         if(attr->offset != NULL) {
1364                 if(attr->symconst != NULL)
1365                         be_emit_char(env, '+');
1366                 else
1367                         be_emit_char(env, '$');
1368                 be_emit_tarval(env, attr->offset);
1369         }
1370 }
1371
1372 static
1373 const char* emit_asm_operand(ia32_emit_env_t *env, const ir_node *node,
1374                              const char *s)
1375 {
1376         const arch_register_t *reg;
1377         const char            *reg_name;
1378         char                   c;
1379         char                   modifier = 0;
1380         int                    num      = -1;
1381         const ia32_attr_t     *attr;
1382         int                    n_outs;
1383         int                    p;
1384
1385         assert(*s == '%');
1386         c = *(++s);
1387
1388         /* parse modifiers */
1389         switch(c) {
1390         case 0:
1391                 ir_fprintf(stderr, "Warning: asm text (%+F) ends with %\n", node);
1392                 be_emit_char(env, '%');
1393                 return s + 1;
1394         case '%':
1395                 be_emit_char(env, '%');
1396                 return s + 1;
1397         case 'w':
1398         case 'b':
1399         case 'h':
1400                 modifier = c;
1401                 ++s;
1402                 break;
1403         case '0':
1404         case '1':
1405         case '2':
1406         case '3':
1407         case '4':
1408         case '5':
1409         case '6':
1410         case '7':
1411         case '8':
1412         case '9':
1413                 break;
1414         default:
1415                 ir_fprintf(stderr, "Warning: asm text (%+F) contains unknown modifier "
1416                            "'%c' for asm op\n", node, c);
1417                 ++s;
1418                 break;
1419         }
1420
1421         /* parse number */
1422         sscanf(s, "%d%n", &num, &p);
1423         if(num < 0) {
1424                 ir_fprintf(stderr, "Warning: Couldn't parse assembler operand (%+F)\n",
1425                            node);
1426                 return s;
1427         } else {
1428                 s += p;
1429         }
1430
1431         /* get register */
1432         attr   = get_ia32_attr_const(node);
1433         n_outs = ARR_LEN(attr->slots);
1434         if(num < n_outs) {
1435                 reg = get_out_reg(env, node, num);
1436         } else {
1437                 ir_node *pred;
1438                 int      in = num - n_outs;
1439                 if(in >= get_irn_arity(node)) {
1440                         ir_fprintf(stderr, "Warning: Invalid input %d specified in asm "
1441                                    "op (%+F)\n", num, node);
1442                         return s;
1443                 }
1444                 pred = get_irn_n(node, in);
1445                 /* might be an immediate value */
1446                 if(is_ia32_Immediate(pred)) {
1447                         emit_ia32_Immediate(env, pred);
1448                         return s;
1449                 }
1450                 reg = get_in_reg(env, node, in);
1451         }
1452         if(reg == NULL) {
1453                 ir_fprintf(stderr, "Warning: no register assigned for %d asm op "
1454                            "(%+F)\n", num, node);
1455                 return s;
1456         }
1457
1458         /* emit it */
1459         be_emit_char(env, '%');
1460         switch(modifier) {
1461         case 0:
1462                 reg_name = arch_register_get_name(reg);
1463                 break;
1464         case 'b':
1465                 reg_name = ia32_get_mapped_reg_name(env->isa->regs_8bit, reg);
1466                 break;
1467         case 'h':
1468                 reg_name = ia32_get_mapped_reg_name(env->isa->regs_8bit_high, reg);
1469                 break;
1470         case 'w':
1471                 reg_name = ia32_get_mapped_reg_name(env->isa->regs_16bit, reg);
1472                 break;
1473         default:
1474                 panic("Invalid asm op modifier");
1475         }
1476         be_emit_string(env, reg_name);
1477
1478         return s;
1479 }
1480
1481 /**
1482  * Emits code for an ASM pseudo op.
1483  */
1484 static
1485 void emit_ia32_Asm(ia32_emit_env_t *env, const ir_node *node)
1486 {
1487         const void            *gen_attr = get_irn_generic_attr_const(node);
1488         const ia32_asm_attr_t *attr
1489                 = CONST_CAST_IA32_ATTR(ia32_asm_attr_t, gen_attr);
1490         ident                 *asm_text = attr->asm_text;
1491         const char            *s        = get_id_str(asm_text);
1492
1493         be_emit_cstring(env, "# Begin ASM \t");
1494         be_emit_finish_line_gas(env, node);
1495
1496         if (s[0] != '\t')
1497                 be_emit_char(env, '\t');
1498
1499         while(*s != 0) {
1500                 if(*s == '%') {
1501                         s = emit_asm_operand(env, node, s);
1502                         continue;
1503                 } else {
1504                         be_emit_char(env, *s);
1505                 }
1506                 ++s;
1507         }
1508
1509         be_emit_char(env, '\n');
1510         be_emit_write_line(env);
1511
1512         be_emit_cstring(env, "# End ASM\n");
1513         be_emit_write_line(env);
1514 }
1515
1516 /**********************************
1517  *   _____                  ____
1518  *  / ____|                |  _ \
1519  * | |     ___  _ __  _   _| |_) |
1520  * | |    / _ \| '_ \| | | |  _ <
1521  * | |___| (_) | |_) | |_| | |_) |
1522  *  \_____\___/| .__/ \__, |____/
1523  *             | |     __/ |
1524  *             |_|    |___/
1525  **********************************/
1526
1527 /**
1528  * Emit movsb/w instructions to make mov count divideable by 4
1529  */
1530 static
1531 void emit_CopyB_prolog(ia32_emit_env_t *env, int rem) {
1532         be_emit_cstring(env, "\tcld");
1533         be_emit_finish_line_gas(env, NULL);
1534
1535         switch(rem) {
1536         case 1:
1537                 be_emit_cstring(env, "\tmovsb");
1538                 be_emit_finish_line_gas(env, NULL);
1539                 break;
1540         case 2:
1541                 be_emit_cstring(env, "\tmovsw");
1542                 be_emit_finish_line_gas(env, NULL);
1543                 break;
1544         case 3:
1545                 be_emit_cstring(env, "\tmovsb");
1546                 be_emit_finish_line_gas(env, NULL);
1547                 be_emit_cstring(env, "\tmovsw");
1548                 be_emit_finish_line_gas(env, NULL);
1549                 break;
1550         }
1551 }
1552
1553 /**
1554  * Emit rep movsd instruction for memcopy.
1555  */
1556 static
1557 void emit_ia32_CopyB(ia32_emit_env_t *env, const ir_node *node) {
1558         tarval *tv = get_ia32_Immop_tarval(node);
1559         int    rem = get_tarval_long(tv);
1560
1561         emit_CopyB_prolog(env, rem);
1562
1563         be_emit_cstring(env, "\trep movsd");
1564         be_emit_finish_line_gas(env, node);
1565 }
1566
1567 /**
1568  * Emits unrolled memcopy.
1569  */
1570 static
1571 void emit_ia32_CopyB_i(ia32_emit_env_t *env, const ir_node *node) {
1572         tarval *tv   = get_ia32_Immop_tarval(node);
1573         int     size = get_tarval_long(tv);
1574
1575         emit_CopyB_prolog(env, size & 0x3);
1576
1577         size >>= 2;
1578         while (size--) {
1579                 be_emit_cstring(env, "\tmovsd");
1580                 be_emit_finish_line_gas(env, NULL);
1581         }
1582 }
1583
1584
1585
1586 /***************************
1587  *   _____
1588  *  / ____|
1589  * | |     ___  _ ____   __
1590  * | |    / _ \| '_ \ \ / /
1591  * | |___| (_) | | | \ V /
1592  *  \_____\___/|_| |_|\_/
1593  *
1594  ***************************/
1595
1596 /**
1597  * Emit code for conversions (I, FP), (FP, I) and (FP, FP).
1598  */
1599 static
1600 void emit_ia32_Conv_with_FP(ia32_emit_env_t *env, const ir_node *node) {
1601         ir_mode            *ls_mode = get_ia32_ls_mode(node);
1602         int                 ls_bits = get_mode_size_bits(ls_mode);
1603
1604         be_emit_cstring(env, "\tcvt");
1605
1606         if(is_ia32_Conv_I2FP(node)) {
1607                 if(ls_bits == 32) {
1608                         be_emit_cstring(env, "si2ss");
1609                 } else {
1610                         be_emit_cstring(env, "si2sd");
1611                 }
1612         } else if(is_ia32_Conv_FP2I(node)) {
1613                 if(ls_bits == 32) {
1614                         be_emit_cstring(env, "ss2si");
1615                 } else {
1616                         be_emit_cstring(env, "sd2si");
1617                 }
1618         } else {
1619                 assert(is_ia32_Conv_FP2FP(node));
1620                 if(ls_bits == 32) {
1621                         be_emit_cstring(env, "sd2ss");
1622                 } else {
1623                         be_emit_cstring(env, "ss2sd");
1624                 }
1625         }
1626         be_emit_char(env, ' ');
1627
1628         switch(get_ia32_op_type(node)) {
1629                 case ia32_Normal:
1630                         ia32_emit_source_register(env, node, 2);
1631                         be_emit_cstring(env, ", ");
1632                         ia32_emit_dest_register(env, node, 0);
1633                         break;
1634                 case ia32_AddrModeS:
1635                         ia32_emit_dest_register(env, node, 0);
1636                         be_emit_cstring(env, ", ");
1637                         ia32_emit_am(env, node);
1638                         break;
1639                 default:
1640                         assert(0 && "unsupported op type for Conv");
1641         }
1642         be_emit_finish_line_gas(env, node);
1643 }
1644
1645 static
1646 void emit_ia32_Conv_I2FP(ia32_emit_env_t *env, const ir_node *node) {
1647         emit_ia32_Conv_with_FP(env, node);
1648 }
1649
1650 static
1651 void emit_ia32_Conv_FP2I(ia32_emit_env_t *env, const ir_node *node) {
1652         emit_ia32_Conv_with_FP(env, node);
1653 }
1654
1655 static
1656 void emit_ia32_Conv_FP2FP(ia32_emit_env_t *env, const ir_node *node) {
1657         emit_ia32_Conv_with_FP(env, node);
1658 }
1659
1660 /**
1661  * Emits code for an Int conversion.
1662  */
1663 static
1664 void emit_ia32_Conv_I2I(ia32_emit_env_t *env, const ir_node *node) {
1665         const char *sign_suffix;
1666         ir_mode *smaller_mode = get_ia32_ls_mode(node);
1667         int smaller_bits = get_mode_size_bits(smaller_mode);
1668         int signed_mode;
1669         const arch_register_t *in_reg, *out_reg;
1670
1671         assert(!mode_is_float(smaller_mode));
1672         assert(smaller_bits == 8 || smaller_bits == 16 || smaller_bits == 32);
1673
1674         signed_mode = mode_is_signed(smaller_mode);
1675         if(smaller_bits == 32) {
1676                 // this should not happen as it's no convert
1677                 assert(0);
1678                 sign_suffix = "";
1679         } else {
1680                 sign_suffix = signed_mode ? "s" : "z";
1681         }
1682
1683         switch(get_ia32_op_type(node)) {
1684                 case ia32_Normal:
1685                         in_reg  = get_in_reg(env, node, 2);
1686                         out_reg = get_out_reg(env, node, 0);
1687
1688                         if (REGS_ARE_EQUAL(in_reg, &ia32_gp_regs[REG_EAX]) &&
1689                                 REGS_ARE_EQUAL(out_reg, in_reg)                &&
1690                                 signed_mode &&
1691                                 smaller_bits == 16)
1692                         {
1693                                 /* argument and result are both in EAX and */
1694                                 /* signedness is ok: -> use the smaller cwtl opcode */
1695                                 be_emit_cstring(env, "\tcwtl");
1696                         } else {
1697                                 const char *sreg = ia32_get_reg_name_for_mode(env, smaller_mode, in_reg);
1698
1699                                 be_emit_cstring(env, "\tmov");
1700                                 be_emit_string(env, sign_suffix);
1701                                 ia32_emit_mode_suffix_mode(env, smaller_mode);
1702                                 be_emit_cstring(env, "l %");
1703                                 be_emit_string(env, sreg);
1704                                 be_emit_cstring(env, ", ");
1705                                 ia32_emit_dest_register(env, node, 0);
1706                         }
1707                         break;
1708                 case ia32_AddrModeS: {
1709                         be_emit_cstring(env, "\tmov");
1710                         be_emit_string(env, sign_suffix);
1711                         ia32_emit_mode_suffix_mode(env, smaller_mode);
1712                         be_emit_cstring(env, "l %");
1713                         ia32_emit_am(env, node);
1714                         be_emit_cstring(env, ", ");
1715                         ia32_emit_dest_register(env, node, 0);
1716                         break;
1717                 }
1718                 default:
1719                         assert(0 && "unsupported op type for Conv");
1720         }
1721         be_emit_finish_line_gas(env, node);
1722 }
1723
1724 /**
1725  * Emits code for an 8Bit Int conversion.
1726  */
1727 void emit_ia32_Conv_I2I8Bit(ia32_emit_env_t *env, const ir_node *node) {
1728         emit_ia32_Conv_I2I(env, node);
1729 }
1730
1731
1732 /*******************************************
1733  *  _                          _
1734  * | |                        | |
1735  * | |__   ___ _ __   ___   __| | ___  ___
1736  * | '_ \ / _ \ '_ \ / _ \ / _` |/ _ \/ __|
1737  * | |_) |  __/ | | | (_) | (_| |  __/\__ \
1738  * |_.__/ \___|_| |_|\___/ \__,_|\___||___/
1739  *
1740  *******************************************/
1741
1742 /**
1743  * Emits a backend call
1744  */
1745 static
1746 void emit_be_Call(ia32_emit_env_t *env, const ir_node *node) {
1747         ir_entity *ent = be_Call_get_entity(node);
1748
1749         be_emit_cstring(env, "\tcall ");
1750         if (ent) {
1751                 mark_entity_visited(ent);
1752                 be_emit_string(env, get_entity_ld_name(ent));
1753         } else {
1754                 be_emit_char(env, '*');
1755                 ia32_emit_dest_register(env, get_irn_n(node, be_pos_Call_ptr), 0);
1756         }
1757         be_emit_finish_line_gas(env, node);
1758 }
1759
1760 /**
1761  * Emits code to increase stack pointer.
1762  */
1763 static
1764 void emit_be_IncSP(ia32_emit_env_t *env, const ir_node *node) {
1765         int offs = be_get_IncSP_offset(node);
1766
1767         if (offs == 0)
1768                 return;
1769
1770         if (offs > 0) {
1771                 be_emit_cstring(env, "\tsubl $");
1772                 be_emit_irprintf(env->emit, "%u, ", offs);
1773                 ia32_emit_source_register(env, node, 0);
1774         } else {
1775                 be_emit_cstring(env, "\taddl $");
1776                 be_emit_irprintf(env->emit, "%u, ", -offs);
1777                 ia32_emit_source_register(env, node, 0);
1778         }
1779         be_emit_finish_line_gas(env, node);
1780 }
1781
1782 /**
1783  * Emits code to set stack pointer.
1784  */
1785 static
1786 void emit_be_SetSP(ia32_emit_env_t *env, const ir_node *node) {
1787         be_emit_cstring(env, "\tmovl ");
1788         ia32_emit_source_register(env, node, 2);
1789         be_emit_cstring(env, ", ");
1790         ia32_emit_dest_register(env, node, 0);
1791         be_emit_finish_line_gas(env, node);
1792 }
1793
1794 /**
1795  * Emits code for Copy/CopyKeep.
1796  */
1797 static
1798 void Copy_emitter(ia32_emit_env_t *env, const ir_node *node, const ir_node *op)
1799 {
1800         const arch_env_t *aenv = env->arch_env;
1801         ir_mode *mode;
1802
1803         if (REGS_ARE_EQUAL(arch_get_irn_register(aenv, node), arch_get_irn_register(aenv, op)) ||
1804                 arch_register_type_is(arch_get_irn_register(aenv, op), virtual))
1805                 return;
1806
1807         mode = get_irn_mode(node);
1808         if (mode == mode_E) {
1809                 be_emit_cstring(env, "\tmovsd ");
1810                 ia32_emit_source_register(env, node, 0);
1811                 be_emit_cstring(env, ", ");
1812                 ia32_emit_dest_register(env, node, 0);
1813         } else {
1814                 be_emit_cstring(env, "\tmovl ");
1815                 ia32_emit_source_register(env, node, 0);
1816                 be_emit_cstring(env, ", ");
1817                 ia32_emit_dest_register(env, node, 0);
1818         }
1819         be_emit_finish_line_gas(env, node);
1820 }
1821
1822 static
1823 void emit_be_Copy(ia32_emit_env_t *env, const ir_node *node) {
1824         Copy_emitter(env, node, be_get_Copy_op(node));
1825 }
1826
1827 static
1828 void emit_be_CopyKeep(ia32_emit_env_t *env, const ir_node *node) {
1829         Copy_emitter(env, node, be_get_CopyKeep_op(node));
1830 }
1831
1832 /**
1833  * Emits code for exchange.
1834  */
1835 static
1836 void emit_be_Perm(ia32_emit_env_t *env, const ir_node *node) {
1837         const arch_register_t *in1, *in2;
1838         const arch_register_class_t *cls1, *cls2;
1839
1840         in1 = arch_get_irn_register(env->arch_env, get_irn_n(node, 0));
1841         in2 = arch_get_irn_register(env->arch_env, get_irn_n(node, 1));
1842
1843         cls1 = arch_register_get_class(in1);
1844         cls2 = arch_register_get_class(in2);
1845
1846         assert(cls1 == cls2 && "Register class mismatch at Perm");
1847
1848         if (cls1 == &ia32_reg_classes[CLASS_ia32_gp]) {
1849                 be_emit_cstring(env, "\txchg ");
1850                 ia32_emit_source_register(env, node, 1);
1851                 be_emit_cstring(env, ", ");
1852                 ia32_emit_source_register(env, node, 0);
1853                 be_emit_finish_line_gas(env, node);
1854         } else if (cls1 == &ia32_reg_classes[CLASS_ia32_xmm]) {
1855                 be_emit_cstring(env, "\txorpd ");
1856                 ia32_emit_source_register(env, node, 1);
1857                 be_emit_cstring(env, ", ");
1858                 ia32_emit_source_register(env, node, 0);
1859                 be_emit_finish_line_gas(env, NULL);
1860
1861                 be_emit_cstring(env, "\txorpd ");
1862                 ia32_emit_source_register(env, node, 0);
1863                 be_emit_cstring(env, ", ");
1864                 ia32_emit_source_register(env, node, 1);
1865                 be_emit_finish_line_gas(env, NULL);
1866
1867                 be_emit_cstring(env, "\txorpd ");
1868                 ia32_emit_source_register(env, node, 1);
1869                 be_emit_cstring(env, ", ");
1870                 ia32_emit_source_register(env, node, 0);
1871                 be_emit_finish_line_gas(env, node);
1872         } else if (cls1 == &ia32_reg_classes[CLASS_ia32_vfp]) {
1873                 /* is a NOP */
1874         } else if (cls1 == &ia32_reg_classes[CLASS_ia32_st]) {
1875                 /* is a NOP */
1876         }
1877 }
1878
1879 /**
1880  * Emits code for Constant loading.
1881  */
1882 static
1883 void emit_ia32_Const(ia32_emit_env_t *env, const ir_node *node) {
1884         ia32_immop_type_t imm_tp = get_ia32_immop_type(node);
1885
1886         if (imm_tp == ia32_ImmSymConst) {
1887                 be_emit_cstring(env, "\tmovl ");
1888                 ia32_emit_immediate(env, node);
1889                 be_emit_cstring(env, ", ");
1890                 ia32_emit_dest_register(env, node, 0);
1891         } else {
1892                 tarval *tv = get_ia32_Immop_tarval(node);
1893                 assert(get_irn_mode(node) == mode_Iu);
1894                 /* beware: in some rare cases mode is mode_b which has no tarval_null() */
1895                 if (tarval_is_null(tv)) {
1896                         if (env->isa->opt_arch == arch_pentium_4) {
1897                                 /* P4 prefers sub r, r, others xor r, r */
1898                                 be_emit_cstring(env, "\tsubl ");
1899                         } else {
1900                                 be_emit_cstring(env, "\txorl ");
1901                         }
1902                         ia32_emit_dest_register(env, node, 0);
1903                         be_emit_cstring(env, ", ");
1904                         ia32_emit_dest_register(env, node, 0);
1905                 } else {
1906                         be_emit_cstring(env, "\tmovl ");
1907                         ia32_emit_immediate(env, node);
1908                         be_emit_cstring(env, ", ");
1909                         ia32_emit_dest_register(env, node, 0);
1910                 }
1911         }
1912         be_emit_finish_line_gas(env, node);
1913 }
1914
1915 /**
1916  * Emits code to load the TLS base
1917  */
1918 static
1919 void emit_ia32_LdTls(ia32_emit_env_t *env, const ir_node *node) {
1920         be_emit_cstring(env, "\tmovl %gs:0, ");
1921         ia32_emit_dest_register(env, node, 0);
1922         be_emit_finish_line_gas(env, node);
1923 }
1924
1925 static
1926 void emit_be_Return(ia32_emit_env_t *env, const ir_node *node)
1927 {
1928         be_emit_cstring(env, "\tret");
1929         be_emit_finish_line_gas(env, node);
1930 }
1931
1932 static
1933 void emit_Nothing(ia32_emit_env_t *env, const ir_node *node)
1934 {
1935         (void) env;
1936         (void) node;
1937 }
1938
1939
1940 /***********************************************************************************
1941  *                  _          __                                             _
1942  *                 (_)        / _|                                           | |
1943  *  _ __ ___   __ _ _ _ __   | |_ _ __ __ _ _ __ ___   _____      _____  _ __| | __
1944  * | '_ ` _ \ / _` | | '_ \  |  _| '__/ _` | '_ ` _ \ / _ \ \ /\ / / _ \| '__| |/ /
1945  * | | | | | | (_| | | | | | | | | | | (_| | | | | | |  __/\ V  V / (_) | |  |   <
1946  * |_| |_| |_|\__,_|_|_| |_| |_| |_|  \__,_|_| |_| |_|\___| \_/\_/ \___/|_|  |_|\_\
1947  *
1948  ***********************************************************************************/
1949
1950 /**
1951  * Enters the emitter functions for handled nodes into the generic
1952  * pointer of an opcode.
1953  */
1954 static
1955 void ia32_register_emitters(void) {
1956
1957 #define IA32_EMIT2(a,b) op_ia32_##a->ops.generic = (op_func)emit_ia32_##b
1958 #define IA32_EMIT(a)    IA32_EMIT2(a,a)
1959 #define EMIT(a)         op_##a->ops.generic = (op_func)emit_##a
1960 #define IGN(a)                  op_##a->ops.generic = (op_func)emit_Nothing
1961 #define BE_EMIT(a)      op_be_##a->ops.generic = (op_func)emit_be_##a
1962 #define BE_IGN(a)               op_be_##a->ops.generic = (op_func)emit_Nothing
1963
1964         /* first clear the generic function pointer for all ops */
1965         clear_irp_opcodes_generic_func();
1966
1967         /* register all emitter functions defined in spec */
1968         ia32_register_spec_emitters();
1969
1970         /* other ia32 emitter functions */
1971         IA32_EMIT(Asm);
1972         IA32_EMIT(CondJmp);
1973         IA32_EMIT(TestJmp);
1974         IA32_EMIT(CJmp);
1975         IA32_EMIT(CJmpAM);
1976         IA32_EMIT(CmpCMov);
1977         IA32_EMIT(CmpSet);
1978         IA32_EMIT(SwitchJmp);
1979         IA32_EMIT(CopyB);
1980         IA32_EMIT(CopyB_i);
1981         IA32_EMIT(Conv_I2FP);
1982         IA32_EMIT(Conv_FP2I);
1983         IA32_EMIT(Conv_FP2FP);
1984         IA32_EMIT(Conv_I2I);
1985         IA32_EMIT(Conv_I2I8Bit);
1986         IA32_EMIT(Const);
1987         IA32_EMIT(LdTls);
1988         IA32_EMIT(xCmp);
1989         IA32_EMIT(xCmpSet);
1990         IA32_EMIT(xCmpCMov);
1991         IA32_EMIT(xCondJmp);
1992         IA32_EMIT2(fcomJmp, x87CondJmp);
1993         IA32_EMIT2(fcompJmp, x87CondJmp);
1994         IA32_EMIT2(fcomppJmp, x87CondJmp);
1995         IA32_EMIT2(fcomrJmp, x87CondJmp);
1996         IA32_EMIT2(fcomrpJmp, x87CondJmp);
1997         IA32_EMIT2(fcomrppJmp, x87CondJmp);
1998
1999         /* benode emitter */
2000         BE_EMIT(Call);
2001         BE_EMIT(IncSP);
2002         BE_EMIT(SetSP);
2003         BE_EMIT(Copy);
2004         BE_EMIT(CopyKeep);
2005         BE_EMIT(Perm);
2006         BE_EMIT(Return);
2007
2008         BE_IGN(RegParams);
2009         BE_IGN(Barrier);
2010         BE_IGN(Keep);
2011
2012         /* firm emitter */
2013         EMIT(Jmp);
2014         IGN(Proj);
2015         IGN(Phi);
2016         IGN(Start);
2017
2018 #undef BE_EMIT
2019 #undef EMIT
2020 #undef IGN
2021 #undef IA32_EMIT2
2022 #undef IA32_EMIT
2023 }
2024
2025 static const char *last_name = NULL;
2026 static unsigned last_line = -1;
2027 static unsigned num = -1;
2028
2029 /**
2030  * Emit the debug support for node node.
2031  */
2032 static
2033 void ia32_emit_dbg(ia32_emit_env_t *env, const ir_node *node) {
2034         dbg_info *db = get_irn_dbg_info(node);
2035         unsigned lineno;
2036         const char *fname = be_retrieve_dbg_info(db, &lineno);
2037
2038         if (! env->cg->birg->main_env->options->stabs_debug_support)
2039                 return;
2040
2041         if (fname) {
2042                 if (last_name != fname) {
2043                         last_line = -1;
2044                         be_dbg_include_begin(env->cg->birg->main_env->db_handle, fname);
2045                         last_name = fname;
2046                 }
2047                 if (last_line != lineno) {
2048                         char name[64];
2049
2050                         snprintf(name, sizeof(name), ".LM%u", ++num);
2051                         last_line = lineno;
2052                         be_dbg_line(env->cg->birg->main_env->db_handle, lineno, name);
2053                         be_emit_string(env, name);
2054                         be_emit_cstring(env, ":\n");
2055                         be_emit_write_line(env);
2056                 }
2057         }
2058 }
2059
2060 typedef void (*emit_func_ptr) (ia32_emit_env_t *, const ir_node *);
2061
2062 /**
2063  * Emits code for a node.
2064  */
2065 static
2066 void ia32_emit_node(ia32_emit_env_t *env, const ir_node *node) {
2067         ir_op *op = get_irn_op(node);
2068
2069         DBG((dbg, LEVEL_1, "emitting code for %+F\n", node));
2070
2071         if (op->ops.generic) {
2072                 emit_func_ptr func = (emit_func_ptr) op->ops.generic;
2073                 ia32_emit_dbg(env, node);
2074                 (*func) (env, node);
2075         } else {
2076                 emit_Nothing(env, node);
2077                 ir_fprintf(stderr, "Warning: No emit handler for node %+F (%+G)\n", node, node);
2078         }
2079 }
2080
2081 /**
2082  * Emits gas alignment directives
2083  */
2084 static
2085 void ia32_emit_alignment(ia32_emit_env_t *env, unsigned align, unsigned skip) {
2086         be_emit_cstring(env, "\t.p2align ");
2087         be_emit_irprintf(env->emit, "%u,,%u\n", align, skip);
2088         be_emit_write_line(env);
2089 }
2090
2091 /**
2092  * Emits gas alignment directives for Functions depended on cpu architecture.
2093  */
2094 static
2095 void ia32_emit_align_func(ia32_emit_env_t *env, cpu_support cpu) {
2096         unsigned align;
2097         unsigned maximum_skip;
2098
2099         switch (cpu) {
2100                 case arch_i386:
2101                         align = 2;
2102                         break;
2103                 case arch_i486:
2104                         align = 4;
2105                         break;
2106                 case arch_k6:
2107                         align = 5;
2108                         break;
2109                 default:
2110                         align = 4;
2111         }
2112         maximum_skip = (1 << align) - 1;
2113         ia32_emit_alignment(env, align, maximum_skip);
2114 }
2115
2116 /**
2117  * Emits gas alignment directives for Labels depended on cpu architecture.
2118  */
2119 static
2120 void ia32_emit_align_label(ia32_emit_env_t *env, cpu_support cpu) {
2121         unsigned align; unsigned maximum_skip;
2122
2123         switch (cpu) {
2124                 case arch_i386:
2125                         align = 2;
2126                         break;
2127                 case arch_i486:
2128                         align = 4;
2129                         break;
2130                 case arch_k6:
2131                         align = 5;
2132                         break;
2133                 default:
2134                         align = 4;
2135         }
2136         maximum_skip = (1 << align) - 1;
2137         ia32_emit_alignment(env, align, maximum_skip);
2138 }
2139
2140 /**
2141  * Test wether a block should be aligned.
2142  * For cpus in the P4/Athlon class it is usefull to align jump labels to
2143  * 16 bytes. However we should only do that if the alignment nops before the
2144  * label aren't executed more often than we have jumps to the label.
2145  */
2146 static
2147 int should_align_block(ia32_emit_env_t *env, ir_node *block, ir_node *prev) {
2148         static const double DELTA = .0001;
2149         ir_exec_freq *exec_freq = env->cg->birg->exec_freq;
2150         double        block_freq;
2151         double        prev_freq = 0;  /**< execfreq of the fallthrough block */
2152         double        jmp_freq  = 0;  /**< execfreq of all non-fallthrough blocks */
2153         cpu_support   cpu       = env->isa->opt_arch;
2154         int           i, n_cfgpreds;
2155
2156         if(exec_freq == NULL)
2157                 return 0;
2158         if(cpu == arch_i386 || cpu == arch_i486)
2159                 return 0;
2160
2161         block_freq = get_block_execfreq(exec_freq, block);
2162         if(block_freq < DELTA)
2163                 return 0;
2164
2165         n_cfgpreds = get_Block_n_cfgpreds(block);
2166         for(i = 0; i < n_cfgpreds; ++i) {
2167                 ir_node *pred      = get_Block_cfgpred_block(block, i);
2168                 double   pred_freq = get_block_execfreq(exec_freq, pred);
2169
2170                 if(pred == prev) {
2171                         prev_freq += pred_freq;
2172                 } else {
2173                         jmp_freq  += pred_freq;
2174                 }
2175         }
2176
2177         if(prev_freq < DELTA && !(jmp_freq < DELTA))
2178                 return 1;
2179
2180         jmp_freq /= prev_freq;
2181
2182         switch (cpu) {
2183                 case arch_athlon:
2184                 case arch_athlon_64:
2185                 case arch_k6:
2186                         return jmp_freq > 3;
2187                 default:
2188                         return jmp_freq > 2;
2189         }
2190 }
2191
2192 static
2193 void ia32_emit_block_header(ia32_emit_env_t *env, ir_node *block, ir_node *prev)
2194 {
2195         int           n_cfgpreds;
2196         int           need_label;
2197         int           i, arity;
2198         ir_exec_freq  *exec_freq = env->cg->birg->exec_freq;
2199
2200         need_label = 1;
2201         n_cfgpreds = get_Block_n_cfgpreds(block);
2202         if (n_cfgpreds == 0) {
2203                 need_label = 0;
2204         } else if (n_cfgpreds == 1) {
2205                 ir_node *pred       = get_Block_cfgpred(block, 0);
2206                 ir_node *pred_block = get_nodes_block(pred);
2207
2208                 /* we don't need labels for fallthrough blocks, however switch-jmps
2209                  * are no fallthoughs */
2210                 if(pred_block == prev &&
2211                                 !(is_Proj(pred) && is_ia32_SwitchJmp(get_Proj_pred(pred)))) {
2212                         need_label = 0;
2213                 } else {
2214                         need_label = 1;
2215                 }
2216         } else {
2217                 need_label = 1;
2218         }
2219
2220         if (should_align_block(env, block, prev)) {
2221                 assert(need_label);
2222                 ia32_emit_align_label(env, env->isa->opt_arch);
2223         }
2224
2225         if(need_label) {
2226                 ia32_emit_block_name(env, block);
2227                 be_emit_char(env, ':');
2228
2229                 be_emit_pad_comment(env);
2230                 be_emit_cstring(env, "   /* preds:");
2231
2232                 /* emit list of pred blocks in comment */
2233                 arity = get_irn_arity(block);
2234                 for (i = 0; i < arity; ++i) {
2235                         ir_node *predblock = get_Block_cfgpred_block(block, i);
2236                         be_emit_irprintf(env->emit, " %d", get_irn_node_nr(predblock));
2237                 }
2238         } else {
2239                 be_emit_cstring(env, "\t/* ");
2240                 ia32_emit_block_name(env, block);
2241                 be_emit_cstring(env, ": ");
2242         }
2243         if (exec_freq != NULL) {
2244                 be_emit_irprintf(env->emit, " freq: %f",
2245                                  get_block_execfreq(exec_freq, block));
2246         }
2247         be_emit_cstring(env, " */\n");
2248         be_emit_write_line(env);
2249 }
2250
2251 /**
2252  * Walks over the nodes in a block connected by scheduling edges
2253  * and emits code for each node.
2254  */
2255 static
2256 void ia32_gen_block(ia32_emit_env_t *env, ir_node *block, ir_node *last_block)
2257 {
2258         const ir_node *node;
2259
2260         ia32_emit_block_header(env, block, last_block);
2261
2262         /* emit the contents of the block */
2263         ia32_emit_dbg(env, block);
2264         sched_foreach(block, node) {
2265                 ia32_emit_node(env, node);
2266         }
2267 }
2268
2269 /**
2270  * Emits code for function start.
2271  */
2272 static
2273 void ia32_emit_func_prolog(ia32_emit_env_t *env, ir_graph *irg) {
2274         ir_entity  *irg_ent  = get_irg_entity(irg);
2275         const char *irg_name = get_entity_ld_name(irg_ent);
2276         cpu_support cpu      = env->isa->opt_arch;
2277         const be_irg_t *birg = env->cg->birg;
2278
2279         be_emit_write_line(env);
2280         be_gas_emit_switch_section(env->emit, GAS_SECTION_TEXT);
2281         be_dbg_method_begin(birg->main_env->db_handle, irg_ent, be_abi_get_stack_layout(birg->abi));
2282         ia32_emit_align_func(env, cpu);
2283         if (get_entity_visibility(irg_ent) == visibility_external_visible) {
2284                 be_emit_cstring(env, ".global ");
2285                 be_emit_string(env, irg_name);
2286                 be_emit_char(env, '\n');
2287                 be_emit_write_line(env);
2288         }
2289         ia32_emit_function_object(env, irg_name);
2290         be_emit_string(env, irg_name);
2291         be_emit_cstring(env, ":\n");
2292         be_emit_write_line(env);
2293 }
2294
2295 /**
2296  * Emits code for function end
2297  */
2298 static
2299 void ia32_emit_func_epilog(ia32_emit_env_t *env, ir_graph *irg) {
2300         const char *irg_name = get_entity_ld_name(get_irg_entity(irg));
2301         const be_irg_t *birg = env->cg->birg;
2302
2303         ia32_emit_function_size(env, irg_name);
2304         be_dbg_method_end(birg->main_env->db_handle);
2305         be_emit_char(env, '\n');
2306         be_emit_write_line(env);
2307 }
2308
2309 /**
2310  * Block-walker:
2311  * Sets labels for control flow nodes (jump target)
2312  */
2313 static
2314 void ia32_gen_labels(ir_node *block, void *data)
2315 {
2316         ir_node *pred;
2317         int n = get_Block_n_cfgpreds(block);
2318         (void) data;
2319
2320         for (n--; n >= 0; n--) {
2321                 pred = get_Block_cfgpred(block, n);
2322                 set_irn_link(pred, block);
2323         }
2324 }
2325
2326 /**
2327  * Emit an exception label if the current instruction can fail.
2328  */
2329 void ia32_emit_exc_label(ia32_emit_env_t *env, const ir_node *node) {
2330         if (get_ia32_exc_label(node)) {
2331                 be_emit_irprintf(env->emit, ".EXL%u\n", 0);
2332                 be_emit_write_line(env);
2333         }
2334 }
2335
2336 /**
2337  * Main driver. Emits the code for one routine.
2338  */
2339 void ia32_gen_routine(ia32_code_gen_t *cg, ir_graph *irg) {
2340         ia32_emit_env_t env;
2341         ir_node *block;
2342         ir_node *last_block = NULL;
2343         int i, n;
2344
2345         env.isa      = (ia32_isa_t *)cg->arch_env->isa;
2346         env.emit     = &env.isa->emit;
2347         env.arch_env = cg->arch_env;
2348         env.cg       = cg;
2349
2350         ia32_register_emitters();
2351
2352         ia32_emit_func_prolog(&env, irg);
2353         irg_block_walk_graph(irg, ia32_gen_labels, NULL, &env);
2354
2355         n = ARR_LEN(cg->blk_sched);
2356         for (i = 0; i < n;) {
2357                 ir_node *next_bl;
2358
2359                 block   = cg->blk_sched[i];
2360                 ++i;
2361                 next_bl = i < n ? cg->blk_sched[i] : NULL;
2362
2363                 /* set here the link. the emitter expects to find the next block here */
2364                 set_irn_link(block, next_bl);
2365                 ia32_gen_block(&env, block, last_block);
2366                 last_block = block;
2367         }
2368
2369         ia32_emit_func_epilog(&env, irg);
2370 }
2371
2372 void ia32_init_emitter(void)
2373 {
2374         FIRM_DBG_REGISTER(dbg, "firm.be.ia32.emitter");
2375 }