b5c3ec41ed4e39f9386a268347585f1c8d4964ee
[libfirm] / ir / be / ia32 / ia32_emitter.c
1 /*
2  * Copyright (C) 1995-2007 University of Karlsruhe.  All right reserved.
3  *
4  * This file is part of libFirm.
5  *
6  * This file may be distributed and/or modified under the terms of the
7  * GNU General Public License version 2 as published by the Free Software
8  * Foundation and appearing in the file LICENSE.GPL included in the
9  * packaging of this file.
10  *
11  * Licensees holding valid libFirm Professional Edition licenses may use
12  * this file in accordance with the libFirm Commercial License.
13  * Agreement provided with the Software.
14  *
15  * This file is provided AS IS with NO WARRANTY OF ANY KIND, INCLUDING THE
16  * WARRANTY OF DESIGN, MERCHANTABILITY AND FITNESS FOR A PARTICULAR
17  * PURPOSE.
18  */
19
20 /**
21  * @file
22  * @brief       This file implements the ia32 node emitter.
23  * @author      Christian Wuerdig, Matthias Braun
24  * @version     $Id$
25  */
26 #ifdef HAVE_CONFIG_H
27 #include "config.h"
28 #endif
29
30 #include <limits.h>
31
32 #include "xmalloc.h"
33 #include "tv.h"
34 #include "iredges.h"
35 #include "debug.h"
36 #include "irgwalk.h"
37 #include "irprintf.h"
38 #include "irop_t.h"
39 #include "irargs_t.h"
40 #include "irprog_t.h"
41 #include "iredges_t.h"
42 #include "execfreq.h"
43 #include "error.h"
44 #include "raw_bitset.h"
45
46 #include "../besched_t.h"
47 #include "../benode_t.h"
48 #include "../beabi.h"
49 #include "../be_dbgout.h"
50 #include "../beemitter.h"
51 #include "../begnuas.h"
52 #include "../beirg_t.h"
53
54 #include "ia32_emitter.h"
55 #include "gen_ia32_emitter.h"
56 #include "gen_ia32_regalloc_if.h"
57 #include "ia32_nodes_attr.h"
58 #include "ia32_new_nodes.h"
59 #include "ia32_map_regs.h"
60 #include "bearch_ia32_t.h"
61
62 DEBUG_ONLY(static firm_dbg_module_t *dbg = NULL;)
63
64 #define BLOCK_PREFIX ".L"
65
66 #define SNPRINTF_BUF_LEN 128
67
68 /**
69  * Returns the register at in position pos.
70  */
71 static
72 const arch_register_t *get_in_reg(ia32_emit_env_t *env, const ir_node *irn,
73                                   int pos)
74 {
75         const arch_env_t       *arch_env = env->arch_env;
76         ir_node                *op;
77         const arch_register_t  *reg = NULL;
78
79         assert(get_irn_arity(irn) > pos && "Invalid IN position");
80
81         /* The out register of the operator at position pos is the
82            in register we need. */
83         op = get_irn_n(irn, pos);
84
85         reg = arch_get_irn_register(arch_env, op);
86
87         assert(reg && "no in register found");
88
89         /* in case of a joker register: just return a valid register */
90         if (arch_register_type_is(reg, joker)) {
91                 const arch_register_req_t *req;
92
93                 /* ask for the requirements */
94                 req = arch_get_register_req(arch_env, irn, pos);
95
96                 if (arch_register_req_is(req, limited)) {
97                         /* in case of limited requirements: get the first allowed register */
98                         unsigned idx = rbitset_next(req->limited, 0, 1);
99                         reg = arch_register_for_index(req->cls, idx);
100                 } else {
101                         /* otherwise get first register in class */
102                         reg = arch_register_for_index(req->cls, 0);
103                 }
104         }
105
106         return reg;
107 }
108
109 /**
110  * Returns the register at out position pos.
111  */
112 static
113 const arch_register_t *get_out_reg(ia32_emit_env_t *env, const ir_node *irn,
114                                    int pos)
115 {
116         const arch_env_t      *arch_env = env->arch_env;
117         ir_node               *proj;
118         const arch_register_t *reg = NULL;
119
120         /* 1st case: irn is not of mode_T, so it has only                 */
121         /*           one OUT register -> good                             */
122         /* 2nd case: irn is of mode_T -> collect all Projs and ask the    */
123         /*           Proj with the corresponding projnum for the register */
124
125         if (get_irn_mode(irn) != mode_T) {
126                 reg = arch_get_irn_register(arch_env, irn);
127         } else if (is_ia32_irn(irn)) {
128                 reg = get_ia32_out_reg(irn, pos);
129         } else {
130                 const ir_edge_t *edge;
131
132                 foreach_out_edge(irn, edge) {
133                         proj = get_edge_src_irn(edge);
134                         assert(is_Proj(proj) && "non-Proj from mode_T node");
135                         if (get_Proj_proj(proj) == pos) {
136                                 reg = arch_get_irn_register(arch_env, proj);
137                                 break;
138                         }
139                 }
140         }
141
142         assert(reg && "no out register found");
143         return reg;
144 }
145
146 /**
147  * Determine the gnu assembler suffix that indicates a mode
148  */
149 static
150 char get_mode_suffix(const ir_mode *mode) {
151         if(mode_is_float(mode)) {
152                 switch(get_mode_size_bits(mode)) {
153                 case 32:
154                         return 's';
155                 case 64:
156                         return 'l';
157                 case 80:
158                 case 96:
159                         return 't';
160                 }
161         } else {
162                 assert(mode_is_int(mode) || mode_is_reference(mode) || mode_is_character(mode));
163                 switch(get_mode_size_bits(mode)) {
164                 case 64:
165                         return 'q';
166                 case 32:
167                         return 'l';
168                 case 16:
169                         return 'w';
170                 case 8:
171                         return 'b';
172                 }
173         }
174         panic("Can't output mode_suffix for %+F\n", mode);
175 }
176
177 static
178 int produces_result(const ir_node *node) {
179         return !(is_ia32_St(node) ||
180                 is_ia32_CondJmp(node) ||
181                 is_ia32_xCondJmp(node) ||
182                 is_ia32_CmpSet(node) ||
183                 is_ia32_xCmpSet(node) ||
184                 is_ia32_SwitchJmp(node));
185 }
186
187 static
188 const char *ia32_get_reg_name_for_mode(ia32_emit_env_t *env, ir_mode *mode,
189                                        const arch_register_t *reg) {
190         switch(get_mode_size_bits(mode)) {
191                 case 8:
192                         return ia32_get_mapped_reg_name(env->isa->regs_8bit, reg);
193                 case 16:
194                         return ia32_get_mapped_reg_name(env->isa->regs_16bit, reg);
195                 default:
196                         return (char *)arch_register_get_name(reg);
197         }
198 }
199
200 /**
201  * Add a number to a prefix. This number will not be used a second time.
202  */
203 static
204 char *get_unique_label(char *buf, size_t buflen, const char *prefix) {
205         static unsigned long id = 0;
206         snprintf(buf, buflen, "%s%lu", prefix, ++id);
207         return buf;
208 }
209
210 /*************************************************************
211  *             _       _    __   _          _
212  *            (_)     | |  / _| | |        | |
213  *  _ __  _ __ _ _ __ | |_| |_  | |__   ___| |_ __   ___ _ __
214  * | '_ \| '__| | '_ \| __|  _| | '_ \ / _ \ | '_ \ / _ \ '__|
215  * | |_) | |  | | | | | |_| |   | | | |  __/ | |_) |  __/ |
216  * | .__/|_|  |_|_| |_|\__|_|   |_| |_|\___|_| .__/ \___|_|
217  * | |                                       | |
218  * |_|                                       |_|
219  *************************************************************/
220
221 // we have no C++ and can't define an implicit ia32_emit_env_t* cast to
222 // be_emit_env_t* so we cheat a bit...
223 #define be_emit_char(env,c)             be_emit_char(env->emit,c)
224 #define be_emit_string(env,s)           be_emit_string(env->emit,s)
225 #undef be_emit_cstring
226 #define be_emit_cstring(env,x)          { be_emit_string_len(env->emit, x, sizeof(x)-1); }
227 #define be_emit_ident(env,i)            be_emit_ident(env->emit,i)
228 #define be_emit_tarval(env,tv)          be_emit_tarval(env->emit,tv)
229 #define be_emit_write_line(env)         be_emit_write_line(env->emit)
230 #define be_emit_finish_line_gas(env,n)  be_emit_finish_line_gas(env->emit,n)
231 #define be_emit_pad_comment(env)        be_emit_pad_comment(env->emit)
232
233 void ia32_emit_source_register(ia32_emit_env_t *env, const ir_node *node, int pos)
234 {
235         const arch_register_t *reg = get_in_reg(env, node, pos);
236         const char *reg_name = arch_register_get_name(reg);
237
238         assert(pos < get_irn_arity(node));
239
240         be_emit_char(env, '%');
241         be_emit_string(env, reg_name);
242 }
243
244 void ia32_emit_dest_register(ia32_emit_env_t *env, const ir_node *node, int pos) {
245         const arch_register_t *reg = get_out_reg(env, node, pos);
246         const char *reg_name = arch_register_get_name(reg);
247
248         be_emit_char(env, '%');
249         be_emit_string(env, reg_name);
250 }
251
252 void ia32_emit_x87_name(ia32_emit_env_t *env, const ir_node *node, int pos)
253 {
254         const ia32_x87_attr_t *attr = get_ia32_x87_attr_const(node);
255
256         assert(pos < 3);
257         be_emit_char(env, '%');
258         be_emit_string(env, attr->x87[pos]->name);
259 }
260
261 void ia32_emit_immediate(ia32_emit_env_t *env, const ir_node *node)
262 {
263         tarval *tv;
264         ir_entity *ent;
265         ident *id;
266
267         be_emit_char(env, '$');
268
269         switch(get_ia32_immop_type(node)) {
270         case ia32_ImmConst:
271                 tv = get_ia32_Immop_tarval(node);
272                 be_emit_tarval(env, tv);
273                 return;
274         case ia32_ImmSymConst:
275                 ent = get_ia32_Immop_symconst(node);
276                 mark_entity_visited(ent);
277                 id = get_entity_ld_ident(ent);
278                 be_emit_ident(env, id);
279                 return;
280         case ia32_ImmNone:
281                 break;
282         }
283
284         assert(0);
285         be_emit_string(env, "BAD");
286         return;
287 }
288
289 static
290 void ia32_emit_mode_suffix_mode(ia32_emit_env_t *env, const ir_mode *mode)
291 {
292         be_emit_char(env, get_mode_suffix(mode));
293 }
294
295 void ia32_emit_mode_suffix(ia32_emit_env_t *env, const ir_node *node)
296 {
297         ir_mode *mode = get_ia32_ls_mode(node);
298         if(mode == NULL)
299                 mode = mode_Iu;
300
301         ia32_emit_mode_suffix_mode(env, mode);
302 }
303
304 void ia32_emit_x87_mode_suffix(ia32_emit_env_t *env, const ir_node *node)
305 {
306         ir_mode *mode = get_ia32_ls_mode(node);
307         if(mode != NULL)
308                 ia32_emit_mode_suffix_mode(env, mode);
309 }
310
311 static
312 char get_xmm_mode_suffix(ir_mode *mode)
313 {
314         assert(mode_is_float(mode));
315         switch(get_mode_size_bits(mode)) {
316         case 32:
317                 return 's';
318         case 64:
319                 return 'd';
320         default:
321                 assert(0);
322         }
323         return '%';
324 }
325
326 void ia32_emit_xmm_mode_suffix(ia32_emit_env_t *env, const ir_node *node)
327 {
328         ir_mode *mode = get_ia32_ls_mode(node);
329         assert(mode != NULL);
330         be_emit_char(env, 's');
331         be_emit_char(env, get_xmm_mode_suffix(mode));
332 }
333
334 void ia32_emit_xmm_mode_suffix_s(ia32_emit_env_t *env, const ir_node *node)
335 {
336         ir_mode *mode = get_ia32_ls_mode(node);
337         assert(mode != NULL);
338         be_emit_char(env, get_xmm_mode_suffix(mode));
339 }
340
341 void ia32_emit_extend_suffix(ia32_emit_env_t *env, const ir_mode *mode)
342 {
343         if(get_mode_size_bits(mode) == 32)
344                 return;
345         if(mode_is_signed(mode)) {
346                 be_emit_char(env, 's');
347         } else {
348                 be_emit_char(env, 'z');
349         }
350 }
351
352 static
353 void ia32_emit_function_object(ia32_emit_env_t *env, const char *name)
354 {
355         switch (be_gas_flavour) {
356         case GAS_FLAVOUR_NORMAL:
357                 be_emit_cstring(env, "\t.type\t");
358                 be_emit_string(env, name);
359                 be_emit_cstring(env, ", @function\n");
360                 be_emit_write_line(env);
361                 break;
362         case GAS_FLAVOUR_MINGW:
363                 be_emit_cstring(env, "\t.def\t");
364                 be_emit_string(env, name);
365                 be_emit_cstring(env, ";\t.scl\t2;\t.type\t32;\t.endef\n");
366                 be_emit_write_line(env);
367                 break;
368         default:
369                 break;
370         }
371 }
372
373 static
374 void ia32_emit_function_size(ia32_emit_env_t *env, const char *name)
375 {
376         switch (be_gas_flavour) {
377         case GAS_FLAVOUR_NORMAL:
378                 be_emit_cstring(env, "\t.size\t");
379                 be_emit_string(env, name);
380                 be_emit_cstring(env, ", .-");
381                 be_emit_string(env, name);
382                 be_emit_char(env, '\n');
383                 be_emit_write_line(env);
384                 break;
385         default:
386                 break;
387         }
388 }
389
390
391 static
392 void emit_ia32_Immediate(ia32_emit_env_t *env, const ir_node *node);
393
394 /**
395  * Emits registers and/or address mode of a binary operation.
396  */
397 void ia32_emit_binop(ia32_emit_env_t *env, const ir_node *node) {
398         const ir_node *right_op;
399
400         switch(get_ia32_op_type(node)) {
401         case ia32_Normal:
402                 right_op = get_irn_n(node, 3);
403                 if(is_ia32_Immediate(right_op)) {
404                         emit_ia32_Immediate(env, right_op);
405                         be_emit_cstring(env, ", ");
406                         ia32_emit_source_register(env, node, 2);
407                         break;
408                 } else if (is_ia32_ImmConst(node) || is_ia32_ImmSymConst(node)) {
409                         ia32_emit_immediate(env, node);
410                         be_emit_cstring(env, ", ");
411                         ia32_emit_source_register(env, node, 2);
412                 } else {
413                         const arch_register_t *in1 = get_in_reg(env, node, 2);
414                         const arch_register_t *in2 = get_in_reg(env, node, 3);
415                         const arch_register_t *out = produces_result(node) ? get_out_reg(env, node, 0) : NULL;
416                         const arch_register_t *in;
417                         const char            *in_name;
418
419                         in      = out ? (REGS_ARE_EQUAL(out, in2) ? in1 : in2) : in2;
420                         out     = out ? out : in1;
421                         in_name = arch_register_get_name(in);
422
423                         if (is_ia32_emit_cl(node)) {
424                                 assert(REGS_ARE_EQUAL(&ia32_gp_regs[REG_ECX], in) && "shift operation needs ecx");
425                                 in_name = "cl";
426                         }
427
428                         be_emit_char(env, '%');
429                         be_emit_string(env, in_name);
430                         be_emit_cstring(env, ", %");
431                         be_emit_string(env, arch_register_get_name(out));
432                 }
433                 break;
434         case ia32_AddrModeS:
435                 ia32_emit_am(env, node);
436                 be_emit_cstring(env, ", ");
437                 if (is_ia32_ImmConst(node) || is_ia32_ImmSymConst(node)) {
438                         assert(!produces_result(node) && "Source AM with Const must not produce result");
439                         ia32_emit_immediate(env, node);
440                 } else if (produces_result(node)) {
441                         ia32_emit_dest_register(env, node, 0);
442                 } else {
443                         ia32_emit_source_register(env, node, 2);
444                 }
445                 break;
446         case ia32_AddrModeD:
447                 right_op = get_irn_n(node, 3);
448                 if(is_ia32_Immediate(right_op)) {
449                         emit_ia32_Immediate(env, right_op);
450                         be_emit_cstring(env, ", ");
451                         ia32_emit_am(env, node);
452                         break;
453                 } else if (is_ia32_ImmConst(node) || is_ia32_ImmSymConst(node)) {
454                         ia32_emit_immediate(env, node);
455                         be_emit_cstring(env, ", ");
456                         ia32_emit_am(env, node);
457                 } else {
458                         const arch_register_t *in1 = get_in_reg(env, node,
459                                                                     get_irn_arity(node) == 5 ? 3 : 2);
460                         ir_mode               *mode = get_ia32_ls_mode(node);
461                         const char            *in_name;
462
463                         in_name = ia32_get_reg_name_for_mode(env, mode, in1);
464
465                         if (is_ia32_emit_cl(node)) {
466                                 assert(REGS_ARE_EQUAL(&ia32_gp_regs[REG_ECX], in1) && "shift operation needs ecx");
467                                 in_name = "cl";
468                         }
469
470                         be_emit_char(env, '%');
471                         be_emit_string(env, in_name);
472                         be_emit_cstring(env, ", ");
473                         ia32_emit_am(env, node);
474                 }
475                 break;
476         default:
477                 assert(0 && "unsupported op type");
478         }
479 }
480
481 /**
482  * Emits registers and/or address mode of a binary operation.
483  */
484 void ia32_emit_x87_binop(ia32_emit_env_t *env, const ir_node *node) {
485         switch(get_ia32_op_type(node)) {
486                 case ia32_Normal:
487                         if (is_ia32_ImmConst(node) || is_ia32_ImmSymConst(node)) {
488                                 // should not happen...
489                                 assert(0);
490                         } else {
491                                 const ia32_x87_attr_t *x87_attr = get_ia32_x87_attr_const(node);
492                                 const arch_register_t *in1      = x87_attr->x87[0];
493                                 const arch_register_t *in2      = x87_attr->x87[1];
494                                 const arch_register_t *out      = x87_attr->x87[2];
495                                 const arch_register_t *in;
496
497                                 in  = out ? (REGS_ARE_EQUAL(out, in2) ? in1 : in2) : in2;
498                                 out = out ? out : in1;
499
500                                 be_emit_char(env, '%');
501                                 be_emit_string(env, arch_register_get_name(in));
502                                 be_emit_cstring(env, ", %");
503                                 be_emit_string(env, arch_register_get_name(out));
504                         }
505                         break;
506                 case ia32_AddrModeS:
507                 case ia32_AddrModeD:
508                         ia32_emit_am(env, node);
509                         break;
510                 default:
511                         assert(0 && "unsupported op type");
512         }
513 }
514
515 void ia32_emit_am_or_dest_register(ia32_emit_env_t *env, const ir_node *node,
516                                    int pos) {
517         if(get_ia32_op_type(node) == ia32_Normal) {
518                 ia32_emit_dest_register(env, node, pos);
519         } else {
520                 assert(get_ia32_op_type(node) == ia32_AddrModeD);
521                 ia32_emit_am(env, node);
522         }
523 }
524
525 /**
526  * Emits registers and/or address mode of a unary operation.
527  */
528 void ia32_emit_unop(ia32_emit_env_t *env, const ir_node *node, int pos) {
529         const ir_node *op;
530
531         switch(get_ia32_op_type(node)) {
532         case ia32_Normal:
533                 op = get_irn_n(node, pos);
534                 if (is_ia32_Immediate(op)) {
535                         emit_ia32_Immediate(env, op);
536                 } else if (is_ia32_ImmConst(node) || is_ia32_ImmSymConst(node)) {
537                         ia32_emit_immediate(env, node);
538                 } else {
539                         ia32_emit_source_register(env, node, pos);
540                 }
541                 break;
542         case ia32_AddrModeS:
543         case ia32_AddrModeD:
544                 ia32_emit_am(env, node);
545                 break;
546         default:
547                 assert(0 && "unsupported op type");
548         }
549 }
550
551 /**
552  * Emits address mode.
553  */
554 void ia32_emit_am(ia32_emit_env_t *env, const ir_node *node) {
555         ir_entity *ent       = get_ia32_am_sc(node);
556         int        offs      = get_ia32_am_offs_int(node);
557         ir_node   *base      = get_irn_n(node, 0);
558         int        has_base  = !is_ia32_NoReg_GP(base);
559         ir_node   *index     = get_irn_n(node, 1);
560         int        has_index = !is_ia32_NoReg_GP(index);
561
562         /* just to be sure... */
563         assert(!is_ia32_use_frame(node) || get_ia32_frame_ent(node) != NULL);
564
565         /* emit offset */
566         if (ent != NULL) {
567                 ident *id;
568
569                 mark_entity_visited(ent);
570                 id = get_entity_ld_ident(ent);
571                 if (is_ia32_am_sc_sign(node))
572                         be_emit_char(env, '-');
573                 be_emit_ident(env, id);
574
575                 if(get_entity_owner(ent) == get_tls_type()) {
576                         if (get_entity_visibility(ent) == visibility_external_allocated) {
577                                 be_emit_cstring(env, "@INDNTPOFF");
578                         } else {
579                                 be_emit_cstring(env, "@NTPOFF");
580                         }
581                 }
582         }
583
584         if(offs != 0) {
585                 if(ent != NULL) {
586                         be_emit_irprintf(env->emit, "%+d", offs);
587                 } else {
588                         be_emit_irprintf(env->emit, "%d", offs);
589                 }
590         }
591
592         if (has_base || has_index) {
593                 be_emit_char(env, '(');
594
595                 /* emit base */
596                 if (has_base) {
597                         ia32_emit_source_register(env, node, 0);
598                 }
599
600                 /* emit index + scale */
601                 if (has_index) {
602                         int scale;
603                         be_emit_char(env, ',');
604                         ia32_emit_source_register(env, node, 1);
605
606                         scale = get_ia32_am_scale(node);
607                         if (scale > 0) {
608                                 be_emit_irprintf(env->emit, ",%d", 1 << get_ia32_am_scale(node));
609                         }
610                 }
611                 be_emit_char(env, ')');
612         }
613 }
614
615 /*************************************************
616  *                 _ _                         _
617  *                (_) |                       | |
618  *   ___ _ __ ___  _| |_    ___ ___  _ __   __| |
619  *  / _ \ '_ ` _ \| | __|  / __/ _ \| '_ \ / _` |
620  * |  __/ | | | | | | |_  | (_| (_) | | | | (_| |
621  *  \___|_| |_| |_|_|\__|  \___\___/|_| |_|\__,_|
622  *
623  *************************************************/
624
625 #undef IA32_DO_EMIT
626 #define IA32_DO_EMIT(irn) ia32_fprintf_format(F, irn, cmd_buf, cmnt_buf)
627
628 /*
629  * coding of conditions
630  */
631 struct cmp2conditon_t {
632         const char *name;
633         pn_Cmp      num;
634 };
635
636 /*
637  * positive conditions for signed compares
638  */
639 static
640 const struct cmp2conditon_t cmp2condition_s[] = {
641         { NULL,              pn_Cmp_False },  /* always false */
642         { "e",               pn_Cmp_Eq },     /* == */
643         { "l",               pn_Cmp_Lt },     /* < */
644         { "le",              pn_Cmp_Le },     /* <= */
645         { "g",               pn_Cmp_Gt },     /* > */
646         { "ge",              pn_Cmp_Ge },     /* >= */
647         { "ne",              pn_Cmp_Lg },     /* != */
648         { NULL,              pn_Cmp_Leg},     /* Floating point: ordered */
649         { NULL,              pn_Cmp_Uo },     /* Floating point: unordered */
650         { "e",               pn_Cmp_Ue },     /* Floating point: unordered or == */
651         { "b",               pn_Cmp_Ul },     /* Floating point: unordered or < */
652         { "be",              pn_Cmp_Ule },    /* Floating point: unordered or <= */
653         { "a",               pn_Cmp_Ug },     /* Floating point: unordered or > */
654         { "ae",              pn_Cmp_Uge },    /* Floating point: unordered or >= */
655         { "ne",              pn_Cmp_Ne },     /* Floating point: unordered or != */
656         { NULL,              pn_Cmp_True },   /* always true */
657 };
658
659 /*
660  * positive conditions for unsigned compares
661  */
662 static
663 const struct cmp2conditon_t cmp2condition_u[] = {
664         { NULL,              pn_Cmp_False },  /* always false */
665         { "e",               pn_Cmp_Eq },     /* == */
666         { "b",               pn_Cmp_Lt },     /* < */
667         { "be",              pn_Cmp_Le },     /* <= */
668         { "a",               pn_Cmp_Gt },     /* > */
669         { "ae",              pn_Cmp_Ge },     /* >= */
670         { "ne",              pn_Cmp_Lg },     /* != */
671         { NULL,              pn_Cmp_True },   /* always true */
672 };
673
674 /*
675  * returns the condition code
676  */
677 static
678 const char *get_cmp_suffix(pn_Cmp cmp_code)
679 {
680         assert( (cmp2condition_s[cmp_code & 15].num) == (cmp_code & 15));
681         assert( (cmp2condition_u[cmp_code & 7].num) == (cmp_code & 7));
682
683         if((cmp_code & ia32_pn_Cmp_Unsigned)) {
684                 return cmp2condition_u[cmp_code & 7].name;
685         } else {
686                 return cmp2condition_s[cmp_code & 15].name;
687         }
688 }
689
690 void ia32_emit_cmp_suffix(ia32_emit_env_t *env, long pnc)
691 {
692         be_emit_string(env, get_cmp_suffix(pnc));
693 }
694
695
696 /**
697  * Returns the target block for a control flow node.
698  */
699 static
700 ir_node *get_cfop_target_block(const ir_node *irn) {
701         return get_irn_link(irn);
702 }
703
704 static
705 void ia32_emit_block_name(ia32_emit_env_t *env, const ir_node *block)
706 {
707         be_emit_cstring(env, BLOCK_PREFIX);
708         be_emit_irprintf(env->emit, "%d", get_irn_node_nr(block));
709 }
710
711 /**
712  * Returns the target label for a control flow node.
713  */
714 static
715 void ia32_emit_cfop_target(ia32_emit_env_t * env, const ir_node *node) {
716         ir_node *block = get_cfop_target_block(node);
717
718         ia32_emit_block_name(env, block);
719 }
720
721 /** Return the next block in Block schedule */
722 static ir_node *next_blk_sched(const ir_node *block) {
723         return get_irn_link(block);
724 }
725
726 /**
727  * Returns the Proj with projection number proj and NOT mode_M
728  */
729 static
730 ir_node *get_proj(const ir_node *node, long proj) {
731         const ir_edge_t *edge;
732         ir_node         *src;
733
734         assert(get_irn_mode(node) == mode_T && "expected mode_T node");
735
736         foreach_out_edge(node, edge) {
737                 src = get_edge_src_irn(edge);
738
739                 assert(is_Proj(src) && "Proj expected");
740                 if (get_irn_mode(src) == mode_M)
741                         continue;
742
743                 if (get_Proj_proj(src) == proj)
744                         return src;
745         }
746         return NULL;
747 }
748
749 /**
750  * Emits the jump sequence for a conditional jump (cmp + jmp_true + jmp_false)
751  */
752 static
753 void finish_CondJmp(ia32_emit_env_t *env, const ir_node *node, ir_mode *mode,
754                     long pnc) {
755         const ir_node *proj_true;
756         const ir_node *proj_false;
757         const ir_node *block;
758         const ir_node *next_block;
759         int flipped = 0;
760
761         /* get both Proj's */
762         proj_true = get_proj(node, pn_Cond_true);
763         assert(proj_true && "CondJmp without true Proj");
764
765         proj_false = get_proj(node, pn_Cond_false);
766         assert(proj_false && "CondJmp without false Proj");
767
768         /* for now, the code works for scheduled and non-schedules blocks */
769         block = get_nodes_block(node);
770
771         /* we have a block schedule */
772         next_block = next_blk_sched(block);
773
774         if (get_cfop_target_block(proj_true) == next_block) {
775                 /* exchange both proj's so the second one can be omitted */
776                 const ir_node *t = proj_true;
777
778                 proj_true  = proj_false;
779                 proj_false = t;
780                 flipped    = 1;
781                 pnc        = get_negated_pnc(pnc, mode);
782         }
783
784         /* in case of unordered compare, check for parity */
785         if (pnc & pn_Cmp_Uo) {
786                 be_emit_cstring(env, "\tjp ");
787                 ia32_emit_cfop_target(env, proj_true);
788                 be_emit_finish_line_gas(env, proj_true);
789         }
790
791         be_emit_cstring(env, "\tj");
792         ia32_emit_cmp_suffix(env, pnc);
793         be_emit_char(env, ' ');
794         ia32_emit_cfop_target(env, proj_true);
795         be_emit_finish_line_gas(env, proj_true);
796
797         /* the second Proj might be a fallthrough */
798         if (get_cfop_target_block(proj_false) != next_block) {
799                 be_emit_cstring(env, "\tjmp ");
800                 ia32_emit_cfop_target(env, proj_false);
801                 be_emit_finish_line_gas(env, proj_false);
802         } else {
803                 be_emit_cstring(env, "\t/* fallthrough to ");
804                 ia32_emit_cfop_target(env, proj_false);
805                 be_emit_cstring(env, " */");
806                 be_emit_finish_line_gas(env, proj_false);
807         }
808 }
809
810 /**
811  * Emits code for conditional jump.
812  */
813 static
814 void CondJmp_emitter(ia32_emit_env_t *env, const ir_node *node) {
815         be_emit_cstring(env, "\tcmp ");
816         ia32_emit_binop(env, node);
817         be_emit_finish_line_gas(env, node);
818
819         finish_CondJmp(env, node, mode_Iu, get_ia32_pncode(node));
820 }
821
822 /**
823  * Emits code for conditional jump with two variables.
824  */
825 static
826 void emit_ia32_CondJmp(ia32_emit_env_t *env, const ir_node *node) {
827         CondJmp_emitter(env, node);
828 }
829
830 /**
831  * Emits code for conditional test and jump.
832  */
833 static
834 void TestJmp_emitter(ia32_emit_env_t *env, const ir_node *node) {
835         if(is_ia32_ImmSymConst(node) || is_ia32_ImmConst(node)) {
836                 be_emit_cstring(env, "\ttest ");
837                 ia32_emit_immediate(env, node);
838                 be_emit_cstring(env, ", ");
839                 ia32_emit_source_register(env, node, 0);
840                 be_emit_finish_line_gas(env, node);
841         } else {
842                 be_emit_cstring(env, "\ttest ");
843                 ia32_emit_source_register(env, node, 1);
844                 be_emit_cstring(env, ", ");
845                 ia32_emit_source_register(env, node, 0);
846                 be_emit_finish_line_gas(env, node);
847         }
848         finish_CondJmp(env, node, mode_Iu, get_ia32_pncode(node));
849 }
850
851 /**
852  * Emits code for conditional test and jump with two variables.
853  */
854 static
855 void emit_ia32_TestJmp(ia32_emit_env_t *env, const ir_node *node) {
856         TestJmp_emitter(env, node);
857 }
858
859 static
860 void emit_ia32_CJmp(ia32_emit_env_t *env, const ir_node *node) {
861         be_emit_cstring(env, "/* omitted redundant test */");
862         be_emit_finish_line_gas(env, node);
863
864         finish_CondJmp(env, node, mode_Is, get_ia32_pncode(node));
865 }
866
867 static
868 void emit_ia32_CJmpAM(ia32_emit_env_t *env, const ir_node *node) {
869         be_emit_cstring(env, "/* omitted redundant test/cmp */");
870         be_emit_finish_line_gas(env, node);
871
872         finish_CondJmp(env, node, mode_Is, get_ia32_pncode(node));
873 }
874
875 /**
876  * Emits code for conditional SSE floating point jump with two variables.
877  */
878 static
879 void emit_ia32_xCondJmp(ia32_emit_env_t *env, const ir_node *node) {
880         be_emit_cstring(env, "\tucomi");
881         ia32_emit_xmm_mode_suffix(env, node);
882         be_emit_char(env, ' ');
883         ia32_emit_binop(env, node);
884         be_emit_finish_line_gas(env, node);
885
886         finish_CondJmp(env, node, mode_F, get_ia32_pncode(node));
887 }
888
889 /**
890  * Emits code for conditional x87 floating point jump with two variables.
891  */
892 static
893 void emit_ia32_x87CondJmp(ia32_emit_env_t *env, const ir_node *node) {
894         const ia32_x87_attr_t *x87_attr = get_ia32_x87_attr_const(node);
895         const char            *reg      = x87_attr->x87[1]->name;
896         long                   pnc      = get_ia32_pncode(node);
897
898         switch (get_ia32_irn_opcode(node)) {
899         case iro_ia32_fcomrJmp:
900                 pnc = get_inversed_pnc(pnc);
901                 reg = x87_attr->x87[0]->name;
902         case iro_ia32_fcomJmp:
903         default:
904                 be_emit_cstring(env, "\tfucom ");
905                 break;
906         case iro_ia32_fcomrpJmp:
907                 pnc = get_inversed_pnc(pnc);
908                 reg = x87_attr->x87[0]->name;
909         case iro_ia32_fcompJmp:
910                 be_emit_cstring(env, "\tfucomp ");
911                 break;
912         case iro_ia32_fcomrppJmp:
913                 pnc = get_inversed_pnc(pnc);
914         case iro_ia32_fcomppJmp:
915                 be_emit_cstring(env, "\tfucompp ");
916                 reg = "";
917                 break;
918         }
919
920         if(reg[0] != '\0') {
921                 be_emit_char(env, '%');
922                 be_emit_string(env, reg);
923         }
924         be_emit_finish_line_gas(env, node);
925
926         be_emit_cstring(env, "\tfnstsw %ax");
927         be_emit_finish_line_gas(env, node);
928         be_emit_cstring(env, "\tsahf");
929         be_emit_finish_line_gas(env, node);
930
931         finish_CondJmp(env, node, mode_E, pnc);
932 }
933
934 static
935 void emit_register_or_immediate(ia32_emit_env_t *env, const ir_node *node,
936                                 int pos)
937 {
938         ir_node *op = get_irn_n(node, pos);
939         if(is_ia32_Immediate(op)) {
940                 emit_ia32_Immediate(env, op);
941         } else {
942                 ia32_emit_source_register(env, node, pos);
943         }
944 }
945
946 static
947 int is_ia32_Immediate_0(const ir_node *node)
948 {
949         const ia32_immediate_attr_t *attr = get_ia32_immediate_attr_const(node);
950         tarval                      *tv   = attr->offset;
951
952         if(tv == NULL || attr->symconst != NULL)
953                 return 0;
954
955         return classify_tarval(tv) == CNST_NULL;
956 }
957
958 static
959 void CMov_emitter(ia32_emit_env_t *env, const ir_node *node)
960 {
961         long pnc = get_ia32_pncode(node);
962         const arch_register_t *in1, *in2, *out;
963
964         out = arch_get_irn_register(env->arch_env, node);
965         in1 = arch_get_irn_register(env->arch_env, get_irn_n(node, 2));
966         in2 = arch_get_irn_register(env->arch_env, get_irn_n(node, 3));
967
968         /* we have to emit the cmp first, because the destination register */
969         /* could be one of the compare registers                           */
970         if (is_ia32_CmpCMov(node)) {
971                 long pncr = pnc & ~ia32_pn_Cmp_Unsigned;
972                 ir_node *cmp_right = get_irn_n(node, 1);
973
974                 if( (pncr == pn_Cmp_Eq || pncr == pn_Cmp_Lg)
975                                 && is_ia32_Immediate(cmp_right)
976                                 && is_ia32_Immediate_0(cmp_right)) {
977                         be_emit_cstring(env, "\ttest ");
978                         ia32_emit_source_register(env, node, 0);
979                         be_emit_cstring(env, ", ");
980                         ia32_emit_source_register(env, node, 0);
981                 } else {
982                         be_emit_cstring(env, "\tcmp ");
983                         emit_register_or_immediate(env, node, 1);
984                         be_emit_cstring(env, ", ");
985                         ia32_emit_source_register(env, node, 0);
986                 }
987         } else if (is_ia32_xCmpCMov(node)) {
988                 be_emit_cstring(env, "\tucomis");
989                 ia32_emit_mode_suffix_mode(env, get_irn_mode(node));
990                 be_emit_char(env, ' ');
991                 ia32_emit_source_register(env, node, 1);
992                 be_emit_cstring(env, ", ");
993                 ia32_emit_source_register(env, node, 0);
994         } else {
995                 assert(0 && "unsupported CMov");
996         }
997         be_emit_finish_line_gas(env, node);
998
999         if (REGS_ARE_EQUAL(out, in2)) {
1000                 /* best case: default in == out -> do nothing */
1001         } else if (REGS_ARE_EQUAL(out, in1)) {
1002                 ir_node *n = (ir_node*) node;
1003                 /* true in == out -> need complement compare and exchange true and default in */
1004                 ir_node *t = get_irn_n(n, 2);
1005                 set_irn_n(n, 2, get_irn_n(n, 3));
1006                 set_irn_n(n, 3, t);
1007
1008                 pnc = get_negated_pnc(pnc, get_irn_mode(node));
1009         } else {
1010                 /* out is different from in: need copy default -> out */
1011                 be_emit_cstring(env, "\tmovl ");
1012                 ia32_emit_source_register(env, node, n_ia32_CmpCMov_val_false);
1013                 be_emit_cstring(env, ", ");
1014                 ia32_emit_dest_register(env, node, 0);
1015                 be_emit_finish_line_gas(env, node);
1016         }
1017
1018         be_emit_cstring(env, "\tcmov");
1019         ia32_emit_cmp_suffix(env, pnc);
1020         be_emit_cstring(env, "l ");
1021         ia32_emit_source_register(env, node, n_ia32_CmpCMov_val_true);
1022         be_emit_cstring(env, ", ");
1023         ia32_emit_dest_register(env, node, 0);
1024         be_emit_finish_line_gas(env, node);
1025 }
1026
1027 static
1028 void emit_ia32_CmpCMov(ia32_emit_env_t *env, const ir_node *node)
1029 {
1030         CMov_emitter(env, node);
1031 }
1032
1033 static
1034 void emit_ia32_xCmpCMov(ia32_emit_env_t *env, const ir_node *node)
1035 {
1036         CMov_emitter(env, node);
1037 }
1038
1039 static
1040 void Set_emitter(ia32_emit_env_t *env, const ir_node *node)
1041 {
1042         long pnc = get_ia32_pncode(node);
1043         const char *reg8bit;
1044         const arch_register_t *out;
1045
1046         out     = arch_get_irn_register(env->arch_env, node);
1047         reg8bit = ia32_get_mapped_reg_name(env->isa->regs_8bit, out);
1048
1049         if (is_ia32_CmpSet(node)) {
1050                 long     pncr      = pnc & ~ia32_pn_Cmp_Unsigned;
1051                 ir_node *cmp_right = get_irn_n(node, n_ia32_CmpSet_cmp_right);
1052
1053                 if( (pncr == pn_Cmp_Eq || pncr == pn_Cmp_Lg)
1054                                 && is_ia32_Immediate(cmp_right)
1055                                 && is_ia32_Immediate_0(cmp_right)) {
1056                         be_emit_cstring(env, "\ttest ");
1057                         ia32_emit_source_register(env, node, n_ia32_CmpSet_cmp_left);
1058                         be_emit_cstring(env, ", ");
1059                         ia32_emit_source_register(env, node, n_ia32_CmpSet_cmp_left);
1060                 } else {
1061                         be_emit_cstring(env, "\tcmp ");
1062                         ia32_emit_binop(env, node);
1063                 }
1064         } else if (is_ia32_xCmpSet(node)) {
1065                 be_emit_cstring(env, "\tucomis");
1066                 ia32_emit_mode_suffix_mode(env, get_irn_mode(get_irn_n(node, 2)));
1067                 be_emit_char(env, ' ');
1068                 ia32_emit_binop(env, node);
1069         } else {
1070                 assert(0 && "unsupported Set");
1071         }
1072         be_emit_finish_line_gas(env, node);
1073
1074         /* use mov to clear target because it doesn't affect the eflags */
1075         be_emit_cstring(env, "\tmovl $0, %");
1076         be_emit_string(env, arch_register_get_name(out));
1077         be_emit_finish_line_gas(env, node);
1078
1079         be_emit_cstring(env, "\tset");
1080         ia32_emit_cmp_suffix(env, pnc);
1081         be_emit_cstring(env, " %");
1082         be_emit_string(env, reg8bit);
1083         be_emit_finish_line_gas(env, node);
1084 }
1085
1086 static
1087 void emit_ia32_CmpSet(ia32_emit_env_t *env, const ir_node *node) {
1088         Set_emitter(env, node);
1089 }
1090
1091 static
1092 void emit_ia32_xCmpSet(ia32_emit_env_t *env, const ir_node *node) {
1093         Set_emitter(env, node);
1094 }
1095
1096 static
1097 void emit_ia32_xCmp(ia32_emit_env_t *env, const ir_node *node) {
1098         int  sse_pnc  = -1;
1099         long pnc      = get_ia32_pncode(node);
1100         long unord    = pnc & pn_Cmp_Uo;
1101
1102         assert( (pnc & ia32_pn_Cmp_Unsigned) == 0);
1103
1104         switch (pnc) {
1105                 case pn_Cmp_Leg: /* odered */
1106                         sse_pnc = 7;
1107                         break;
1108                 case pn_Cmp_Uo:  /* unordered */
1109                         sse_pnc = 3;
1110                         break;
1111                 case pn_Cmp_Ue:
1112                 case pn_Cmp_Eq:  /* == */
1113                         sse_pnc = 0;
1114                         break;
1115                 case pn_Cmp_Ul:
1116                 case pn_Cmp_Lt:  /* < */
1117                         sse_pnc = 1;
1118                         break;
1119                 case pn_Cmp_Ule:
1120                 case pn_Cmp_Le: /* <= */
1121                         sse_pnc = 2;
1122                         break;
1123                 case pn_Cmp_Ug:
1124                 case pn_Cmp_Gt:  /* > */
1125                         sse_pnc = 6;
1126                         break;
1127                 case pn_Cmp_Uge:
1128                 case pn_Cmp_Ge: /* >= */
1129                         sse_pnc = 5;
1130                         break;
1131                 case pn_Cmp_Ne:
1132                 case pn_Cmp_Lg:  /* != */
1133                         sse_pnc = 4;
1134                         break;
1135         }
1136
1137         assert(sse_pnc >= 0 && "unsupported compare");
1138
1139         if (unord && sse_pnc != 3) {
1140                 /*
1141                         We need a separate compare against unordered.
1142                         Quick and Dirty solution:
1143                         - get some memory on stack
1144                         - compare
1145                         - store result
1146                         - compare
1147                         - and result and stored result
1148                     - cleanup stack
1149                 */
1150                 be_emit_cstring(env, "\tsubl $8, %esp");
1151                 be_emit_finish_line_gas(env, node);
1152
1153                 be_emit_cstring(env, "\tcmpsd $3, ");
1154                 ia32_emit_binop(env, node);
1155                 be_emit_finish_line_gas(env, node);
1156
1157                 be_emit_cstring(env, "\tmovsd ");
1158                 ia32_emit_dest_register(env, node, 0);
1159                 be_emit_cstring(env, ", (%esp)");
1160                 be_emit_finish_line_gas(env, node);
1161         }
1162
1163         be_emit_cstring(env, "\tcmpsd ");
1164         be_emit_irprintf(env->emit, "%d, ", sse_pnc);
1165         ia32_emit_binop(env, node);
1166         be_emit_finish_line_gas(env, node);
1167
1168         if (unord && sse_pnc != 3) {
1169                 be_emit_cstring(env, "\tandpd (%esp), ");
1170                 ia32_emit_dest_register(env, node, 0);
1171                 be_emit_finish_line_gas(env, node);
1172
1173                 be_emit_cstring(env, "\taddl $8, %esp");
1174                 be_emit_finish_line_gas(env, node);
1175         }
1176 }
1177
1178 /*********************************************************
1179  *                 _ _       _
1180  *                (_) |     (_)
1181  *   ___ _ __ ___  _| |_     _ _   _ _ __ ___  _ __  ___
1182  *  / _ \ '_ ` _ \| | __|   | | | | | '_ ` _ \| '_ \/ __|
1183  * |  __/ | | | | | | |_    | | |_| | | | | | | |_) \__ \
1184  *  \___|_| |_| |_|_|\__|   | |\__,_|_| |_| |_| .__/|___/
1185  *                         _/ |               | |
1186  *                        |__/                |_|
1187  *********************************************************/
1188
1189 /* jump table entry (target and corresponding number) */
1190 typedef struct _branch_t {
1191         ir_node *target;
1192         int      value;
1193 } branch_t;
1194
1195 /* jump table for switch generation */
1196 typedef struct _jmp_tbl_t {
1197         ir_node  *defProj;         /**< default target */
1198         long      min_value;       /**< smallest switch case */
1199         long      max_value;       /**< largest switch case */
1200         long      num_branches;    /**< number of jumps */
1201         char     *label;           /**< label of the jump table */
1202         branch_t *branches;        /**< jump array */
1203 } jmp_tbl_t;
1204
1205 /**
1206  * Compare two variables of type branch_t. Used to sort all switch cases
1207  */
1208 static
1209 int ia32_cmp_branch_t(const void *a, const void *b) {
1210         branch_t *b1 = (branch_t *)a;
1211         branch_t *b2 = (branch_t *)b;
1212
1213         if (b1->value <= b2->value)
1214                 return -1;
1215         else
1216                 return 1;
1217 }
1218
1219 /**
1220  * Emits code for a SwitchJmp (creates a jump table if
1221  * possible otherwise a cmp-jmp cascade). Port from
1222  * cggg ia32 backend
1223  */
1224 static
1225 void emit_ia32_SwitchJmp(ia32_emit_env_t *env, const ir_node *node) {
1226         unsigned long       interval;
1227         int                 last_value, i;
1228         long                pnc;
1229         jmp_tbl_t           tbl;
1230         ir_node            *proj;
1231         const ir_edge_t    *edge;
1232
1233         /* fill the table structure */
1234         tbl.label        = xmalloc(SNPRINTF_BUF_LEN);
1235         tbl.label        = get_unique_label(tbl.label, SNPRINTF_BUF_LEN, ".TBL_");
1236         tbl.defProj      = NULL;
1237         tbl.num_branches = get_irn_n_edges(node);
1238         tbl.branches     = xcalloc(tbl.num_branches, sizeof(tbl.branches[0]));
1239         tbl.min_value    = INT_MAX;
1240         tbl.max_value    = INT_MIN;
1241
1242         i = 0;
1243         /* go over all proj's and collect them */
1244         foreach_out_edge(node, edge) {
1245                 proj = get_edge_src_irn(edge);
1246                 assert(is_Proj(proj) && "Only proj allowed at SwitchJmp");
1247
1248                 pnc = get_Proj_proj(proj);
1249
1250                 /* create branch entry */
1251                 tbl.branches[i].target = proj;
1252                 tbl.branches[i].value  = pnc;
1253
1254                 tbl.min_value = pnc < tbl.min_value ? pnc : tbl.min_value;
1255                 tbl.max_value = pnc > tbl.max_value ? pnc : tbl.max_value;
1256
1257                 /* check for default proj */
1258                 if (pnc == get_ia32_pncode(node)) {
1259                         assert(tbl.defProj == NULL && "found two defProjs at SwitchJmp");
1260                         tbl.defProj = proj;
1261                 }
1262
1263                 i++;
1264         }
1265
1266         /* sort the branches by their number */
1267         qsort(tbl.branches, tbl.num_branches, sizeof(tbl.branches[0]), ia32_cmp_branch_t);
1268
1269         /* two-complement's magic make this work without overflow */
1270         interval = tbl.max_value - tbl.min_value;
1271
1272         /* emit the table */
1273         be_emit_cstring(env, "\tcmpl $");
1274         be_emit_irprintf(env->emit, "%u, ", interval);
1275         ia32_emit_source_register(env, node, 0);
1276         be_emit_finish_line_gas(env, node);
1277
1278         be_emit_cstring(env, "\tja ");
1279         ia32_emit_cfop_target(env, tbl.defProj);
1280         be_emit_finish_line_gas(env, node);
1281
1282         if (tbl.num_branches > 1) {
1283                 /* create table */
1284                 be_emit_cstring(env, "\tjmp *");
1285                 be_emit_string(env, tbl.label);
1286                 be_emit_cstring(env, "(,");
1287                 ia32_emit_source_register(env, node, 0);
1288                 be_emit_cstring(env, ",4)");
1289                 be_emit_finish_line_gas(env, node);
1290
1291                 be_gas_emit_switch_section(env->emit, GAS_SECTION_RODATA);
1292                 be_emit_cstring(env, "\t.align 4\n");
1293                 be_emit_write_line(env);
1294
1295                 be_emit_string(env, tbl.label);
1296                 be_emit_cstring(env, ":\n");
1297                 be_emit_write_line(env);
1298
1299                 be_emit_cstring(env, ".long ");
1300                 ia32_emit_cfop_target(env, tbl.branches[0].target);
1301                 be_emit_finish_line_gas(env, NULL);
1302
1303                 last_value = tbl.branches[0].value;
1304                 for (i = 1; i < tbl.num_branches; ++i) {
1305                         while (++last_value < tbl.branches[i].value) {
1306                                 be_emit_cstring(env, ".long ");
1307                                 ia32_emit_cfop_target(env, tbl.defProj);
1308                                 be_emit_finish_line_gas(env, NULL);
1309                         }
1310                         be_emit_cstring(env, ".long ");
1311                         ia32_emit_cfop_target(env, tbl.branches[i].target);
1312                         be_emit_finish_line_gas(env, NULL);
1313                 }
1314                 be_gas_emit_switch_section(env->emit, GAS_SECTION_TEXT);
1315         } else {
1316                 /* one jump is enough */
1317                 be_emit_cstring(env, "\tjmp ");
1318                 ia32_emit_cfop_target(env, tbl.branches[0].target);
1319                 be_emit_finish_line_gas(env, node);
1320         }
1321
1322         if (tbl.label)
1323                 free(tbl.label);
1324         if (tbl.branches)
1325                 free(tbl.branches);
1326 }
1327
1328 /**
1329  * Emits code for a unconditional jump.
1330  */
1331 static
1332 void emit_Jmp(ia32_emit_env_t *env, const ir_node *node) {
1333         ir_node *block, *next_block;
1334
1335         /* for now, the code works for scheduled and non-schedules blocks */
1336         block = get_nodes_block(node);
1337
1338         /* we have a block schedule */
1339         next_block = next_blk_sched(block);
1340         if (get_cfop_target_block(node) != next_block) {
1341                 be_emit_cstring(env, "\tjmp ");
1342                 ia32_emit_cfop_target(env, node);
1343         } else {
1344                 be_emit_cstring(env, "\t/* fallthrough to ");
1345                 ia32_emit_cfop_target(env, node);
1346                 be_emit_cstring(env, " */");
1347         }
1348         be_emit_finish_line_gas(env, node);
1349 }
1350
1351 static
1352 void emit_ia32_Immediate(ia32_emit_env_t *env, const ir_node *node)
1353 {
1354         const ia32_immediate_attr_t *attr = get_ia32_immediate_attr_const(node);
1355
1356         assert(attr->symconst != NULL || attr->offset != NULL);
1357         if(attr->symconst != NULL) {
1358                 ident *id = get_entity_ld_ident(attr->symconst);
1359
1360                 if(attr->attr.data.am_sc_sign)
1361                         be_emit_char(env, '-');
1362                 be_emit_ident(env, id);
1363         }
1364         if(attr->offset != NULL) {
1365                 if(attr->symconst != NULL)
1366                         be_emit_char(env, '+');
1367                 else
1368                         be_emit_char(env, '$');
1369                 be_emit_tarval(env, attr->offset);
1370         }
1371 }
1372
1373 static
1374 const char* emit_asm_operand(ia32_emit_env_t *env, const ir_node *node,
1375                              const char *s)
1376 {
1377         const arch_register_t *reg;
1378         const char            *reg_name;
1379         char                   c;
1380         char                   modifier = 0;
1381         int                    num      = -1;
1382         const ia32_attr_t     *attr;
1383         int                    n_outs;
1384         int                    p;
1385
1386         assert(*s == '%');
1387         c = *(++s);
1388
1389         /* parse modifiers */
1390         switch(c) {
1391         case 0:
1392                 ir_fprintf(stderr, "Warning: asm text (%+F) ends with %\n", node);
1393                 be_emit_char(env, '%');
1394                 return s + 1;
1395         case '%':
1396                 be_emit_char(env, '%');
1397                 return s + 1;
1398         case 'w':
1399         case 'b':
1400         case 'h':
1401                 modifier = c;
1402                 ++s;
1403                 break;
1404         case '0':
1405         case '1':
1406         case '2':
1407         case '3':
1408         case '4':
1409         case '5':
1410         case '6':
1411         case '7':
1412         case '8':
1413         case '9':
1414                 break;
1415         default:
1416                 ir_fprintf(stderr, "Warning: asm text (%+F) contains unknown modifier "
1417                            "'%c' for asm op\n", node, c);
1418                 ++s;
1419                 break;
1420         }
1421
1422         /* parse number */
1423         sscanf(s, "%d%n", &num, &p);
1424         if(num < 0) {
1425                 ir_fprintf(stderr, "Warning: Couldn't parse assembler operand (%+F)\n",
1426                            node);
1427                 return s;
1428         } else {
1429                 s += p;
1430         }
1431
1432         /* get register */
1433         attr   = get_ia32_attr_const(node);
1434         n_outs = ARR_LEN(attr->slots);
1435         if(num < n_outs) {
1436                 reg = get_out_reg(env, node, num);
1437         } else {
1438                 ir_node *pred;
1439                 int      in = num - n_outs;
1440                 if(in >= get_irn_arity(node)) {
1441                         ir_fprintf(stderr, "Warning: Invalid input %d specified in asm "
1442                                    "op (%+F)\n", num, node);
1443                         return s;
1444                 }
1445                 pred = get_irn_n(node, in);
1446                 /* might be an immediate value */
1447                 if(is_ia32_Immediate(pred)) {
1448                         emit_ia32_Immediate(env, pred);
1449                         return s;
1450                 }
1451                 reg = get_in_reg(env, node, in);
1452         }
1453         if(reg == NULL) {
1454                 ir_fprintf(stderr, "Warning: no register assigned for %d asm op "
1455                            "(%+F)\n", num, node);
1456                 return s;
1457         }
1458
1459         /* emit it */
1460         be_emit_char(env, '%');
1461         switch(modifier) {
1462         case 0:
1463                 reg_name = arch_register_get_name(reg);
1464                 break;
1465         case 'b':
1466                 reg_name = ia32_get_mapped_reg_name(env->isa->regs_8bit, reg);
1467                 break;
1468         case 'h':
1469                 reg_name = ia32_get_mapped_reg_name(env->isa->regs_8bit_high, reg);
1470                 break;
1471         case 'w':
1472                 reg_name = ia32_get_mapped_reg_name(env->isa->regs_16bit, reg);
1473                 break;
1474         default:
1475                 panic("Invalid asm op modifier");
1476         }
1477         be_emit_string(env, reg_name);
1478
1479         return s;
1480 }
1481
1482 /**
1483  * Emits code for an ASM pseudo op.
1484  */
1485 static
1486 void emit_ia32_Asm(ia32_emit_env_t *env, const ir_node *node)
1487 {
1488         const void            *gen_attr = get_irn_generic_attr_const(node);
1489         const ia32_asm_attr_t *attr
1490                 = CONST_CAST_IA32_ATTR(ia32_asm_attr_t, gen_attr);
1491         ident                 *asm_text = attr->asm_text;
1492         const char            *s        = get_id_str(asm_text);
1493
1494         be_emit_cstring(env, "# Begin ASM \t");
1495         be_emit_finish_line_gas(env, node);
1496
1497         if (s[0] != '\t')
1498                 be_emit_char(env, '\t');
1499
1500         while(*s != 0) {
1501                 if(*s == '%') {
1502                         s = emit_asm_operand(env, node, s);
1503                         continue;
1504                 } else {
1505                         be_emit_char(env, *s);
1506                 }
1507                 ++s;
1508         }
1509
1510         be_emit_char(env, '\n');
1511         be_emit_write_line(env);
1512
1513         be_emit_cstring(env, "# End ASM\n");
1514         be_emit_write_line(env);
1515 }
1516
1517 /**********************************
1518  *   _____                  ____
1519  *  / ____|                |  _ \
1520  * | |     ___  _ __  _   _| |_) |
1521  * | |    / _ \| '_ \| | | |  _ <
1522  * | |___| (_) | |_) | |_| | |_) |
1523  *  \_____\___/| .__/ \__, |____/
1524  *             | |     __/ |
1525  *             |_|    |___/
1526  **********************************/
1527
1528 /**
1529  * Emit movsb/w instructions to make mov count divideable by 4
1530  */
1531 static
1532 void emit_CopyB_prolog(ia32_emit_env_t *env, int rem) {
1533         be_emit_cstring(env, "\tcld");
1534         be_emit_finish_line_gas(env, NULL);
1535
1536         switch(rem) {
1537         case 1:
1538                 be_emit_cstring(env, "\tmovsb");
1539                 be_emit_finish_line_gas(env, NULL);
1540                 break;
1541         case 2:
1542                 be_emit_cstring(env, "\tmovsw");
1543                 be_emit_finish_line_gas(env, NULL);
1544                 break;
1545         case 3:
1546                 be_emit_cstring(env, "\tmovsb");
1547                 be_emit_finish_line_gas(env, NULL);
1548                 be_emit_cstring(env, "\tmovsw");
1549                 be_emit_finish_line_gas(env, NULL);
1550                 break;
1551         }
1552 }
1553
1554 /**
1555  * Emit rep movsd instruction for memcopy.
1556  */
1557 static
1558 void emit_ia32_CopyB(ia32_emit_env_t *env, const ir_node *node) {
1559         tarval *tv = get_ia32_Immop_tarval(node);
1560         int    rem = get_tarval_long(tv);
1561
1562         emit_CopyB_prolog(env, rem);
1563
1564         be_emit_cstring(env, "\trep movsd");
1565         be_emit_finish_line_gas(env, node);
1566 }
1567
1568 /**
1569  * Emits unrolled memcopy.
1570  */
1571 static
1572 void emit_ia32_CopyB_i(ia32_emit_env_t *env, const ir_node *node) {
1573         tarval *tv   = get_ia32_Immop_tarval(node);
1574         int     size = get_tarval_long(tv);
1575
1576         emit_CopyB_prolog(env, size & 0x3);
1577
1578         size >>= 2;
1579         while (size--) {
1580                 be_emit_cstring(env, "\tmovsd");
1581                 be_emit_finish_line_gas(env, NULL);
1582         }
1583 }
1584
1585
1586
1587 /***************************
1588  *   _____
1589  *  / ____|
1590  * | |     ___  _ ____   __
1591  * | |    / _ \| '_ \ \ / /
1592  * | |___| (_) | | | \ V /
1593  *  \_____\___/|_| |_|\_/
1594  *
1595  ***************************/
1596
1597 /**
1598  * Emit code for conversions (I, FP), (FP, I) and (FP, FP).
1599  */
1600 static
1601 void emit_ia32_Conv_with_FP(ia32_emit_env_t *env, const ir_node *node) {
1602         ir_mode            *ls_mode = get_ia32_ls_mode(node);
1603         int                 ls_bits = get_mode_size_bits(ls_mode);
1604
1605         be_emit_cstring(env, "\tcvt");
1606
1607         if(is_ia32_Conv_I2FP(node)) {
1608                 if(ls_bits == 32) {
1609                         be_emit_cstring(env, "si2ss");
1610                 } else {
1611                         be_emit_cstring(env, "si2sd");
1612                 }
1613         } else if(is_ia32_Conv_FP2I(node)) {
1614                 if(ls_bits == 32) {
1615                         be_emit_cstring(env, "ss2si");
1616                 } else {
1617                         be_emit_cstring(env, "sd2si");
1618                 }
1619         } else {
1620                 assert(is_ia32_Conv_FP2FP(node));
1621                 if(ls_bits == 32) {
1622                         be_emit_cstring(env, "sd2ss");
1623                 } else {
1624                         be_emit_cstring(env, "ss2sd");
1625                 }
1626         }
1627         be_emit_char(env, ' ');
1628
1629         switch(get_ia32_op_type(node)) {
1630                 case ia32_Normal:
1631                         ia32_emit_source_register(env, node, 2);
1632                         be_emit_cstring(env, ", ");
1633                         ia32_emit_dest_register(env, node, 0);
1634                         break;
1635                 case ia32_AddrModeS:
1636                         ia32_emit_dest_register(env, node, 0);
1637                         be_emit_cstring(env, ", ");
1638                         ia32_emit_am(env, node);
1639                         break;
1640                 default:
1641                         assert(0 && "unsupported op type for Conv");
1642         }
1643         be_emit_finish_line_gas(env, node);
1644 }
1645
1646 static
1647 void emit_ia32_Conv_I2FP(ia32_emit_env_t *env, const ir_node *node) {
1648         emit_ia32_Conv_with_FP(env, node);
1649 }
1650
1651 static
1652 void emit_ia32_Conv_FP2I(ia32_emit_env_t *env, const ir_node *node) {
1653         emit_ia32_Conv_with_FP(env, node);
1654 }
1655
1656 static
1657 void emit_ia32_Conv_FP2FP(ia32_emit_env_t *env, const ir_node *node) {
1658         emit_ia32_Conv_with_FP(env, node);
1659 }
1660
1661 /**
1662  * Emits code for an Int conversion.
1663  */
1664 static
1665 void emit_ia32_Conv_I2I(ia32_emit_env_t *env, const ir_node *node) {
1666         const char *sign_suffix;
1667         ir_mode *smaller_mode = get_ia32_ls_mode(node);
1668         int smaller_bits = get_mode_size_bits(smaller_mode);
1669         int signed_mode;
1670         const arch_register_t *in_reg, *out_reg;
1671
1672         assert(!mode_is_float(smaller_mode));
1673         assert(smaller_bits == 8 || smaller_bits == 16 || smaller_bits == 32);
1674
1675         signed_mode = mode_is_signed(smaller_mode);
1676         if(smaller_bits == 32) {
1677                 // this should not happen as it's no convert
1678                 assert(0);
1679                 sign_suffix = "";
1680         } else {
1681                 sign_suffix = signed_mode ? "s" : "z";
1682         }
1683
1684         switch(get_ia32_op_type(node)) {
1685                 case ia32_Normal:
1686                         in_reg  = get_in_reg(env, node, 2);
1687                         out_reg = get_out_reg(env, node, 0);
1688
1689                         if (REGS_ARE_EQUAL(in_reg, &ia32_gp_regs[REG_EAX]) &&
1690                                 REGS_ARE_EQUAL(out_reg, in_reg)                &&
1691                                 signed_mode &&
1692                                 smaller_bits == 16)
1693                         {
1694                                 /* argument and result are both in EAX and */
1695                                 /* signedness is ok: -> use the smaller cwtl opcode */
1696                                 be_emit_cstring(env, "\tcwtl");
1697                         } else {
1698                                 const char *sreg = ia32_get_reg_name_for_mode(env, smaller_mode, in_reg);
1699
1700                                 be_emit_cstring(env, "\tmov");
1701                                 be_emit_string(env, sign_suffix);
1702                                 ia32_emit_mode_suffix_mode(env, smaller_mode);
1703                                 be_emit_cstring(env, "l %");
1704                                 be_emit_string(env, sreg);
1705                                 be_emit_cstring(env, ", ");
1706                                 ia32_emit_dest_register(env, node, 0);
1707                         }
1708                         break;
1709                 case ia32_AddrModeS: {
1710                         be_emit_cstring(env, "\tmov");
1711                         be_emit_string(env, sign_suffix);
1712                         ia32_emit_mode_suffix_mode(env, smaller_mode);
1713                         be_emit_cstring(env, "l %");
1714                         ia32_emit_am(env, node);
1715                         be_emit_cstring(env, ", ");
1716                         ia32_emit_dest_register(env, node, 0);
1717                         break;
1718                 }
1719                 default:
1720                         assert(0 && "unsupported op type for Conv");
1721         }
1722         be_emit_finish_line_gas(env, node);
1723 }
1724
1725 /**
1726  * Emits code for an 8Bit Int conversion.
1727  */
1728 void emit_ia32_Conv_I2I8Bit(ia32_emit_env_t *env, const ir_node *node) {
1729         emit_ia32_Conv_I2I(env, node);
1730 }
1731
1732
1733 /*******************************************
1734  *  _                          _
1735  * | |                        | |
1736  * | |__   ___ _ __   ___   __| | ___  ___
1737  * | '_ \ / _ \ '_ \ / _ \ / _` |/ _ \/ __|
1738  * | |_) |  __/ | | | (_) | (_| |  __/\__ \
1739  * |_.__/ \___|_| |_|\___/ \__,_|\___||___/
1740  *
1741  *******************************************/
1742
1743 /**
1744  * Emits a backend call
1745  */
1746 static
1747 void emit_be_Call(ia32_emit_env_t *env, const ir_node *node) {
1748         ir_entity *ent = be_Call_get_entity(node);
1749
1750         be_emit_cstring(env, "\tcall ");
1751         if (ent) {
1752                 mark_entity_visited(ent);
1753                 be_emit_string(env, get_entity_ld_name(ent));
1754         } else {
1755                 be_emit_char(env, '*');
1756                 ia32_emit_dest_register(env, get_irn_n(node, be_pos_Call_ptr), 0);
1757         }
1758         be_emit_finish_line_gas(env, node);
1759 }
1760
1761 /**
1762  * Emits code to increase stack pointer.
1763  */
1764 static
1765 void emit_be_IncSP(ia32_emit_env_t *env, const ir_node *node) {
1766         int offs = be_get_IncSP_offset(node);
1767
1768         if (offs == 0)
1769                 return;
1770
1771         if (offs > 0) {
1772                 be_emit_cstring(env, "\tsubl $");
1773                 be_emit_irprintf(env->emit, "%u, ", offs);
1774                 ia32_emit_source_register(env, node, 0);
1775         } else {
1776                 be_emit_cstring(env, "\taddl $");
1777                 be_emit_irprintf(env->emit, "%u, ", -offs);
1778                 ia32_emit_source_register(env, node, 0);
1779         }
1780         be_emit_finish_line_gas(env, node);
1781 }
1782
1783 /**
1784  * Emits code to set stack pointer.
1785  */
1786 static
1787 void emit_be_SetSP(ia32_emit_env_t *env, const ir_node *node) {
1788         be_emit_cstring(env, "\tmovl ");
1789         ia32_emit_source_register(env, node, 2);
1790         be_emit_cstring(env, ", ");
1791         ia32_emit_dest_register(env, node, 0);
1792         be_emit_finish_line_gas(env, node);
1793 }
1794
1795 /**
1796  * Emits code for Copy/CopyKeep.
1797  */
1798 static
1799 void Copy_emitter(ia32_emit_env_t *env, const ir_node *node, const ir_node *op)
1800 {
1801         const arch_env_t *aenv = env->arch_env;
1802         ir_mode *mode;
1803
1804         if (REGS_ARE_EQUAL(arch_get_irn_register(aenv, node), arch_get_irn_register(aenv, op)) ||
1805                 arch_register_type_is(arch_get_irn_register(aenv, op), virtual))
1806                 return;
1807
1808         mode = get_irn_mode(node);
1809         if (mode == mode_E) {
1810                 be_emit_cstring(env, "\tmovsd ");
1811                 ia32_emit_source_register(env, node, 0);
1812                 be_emit_cstring(env, ", ");
1813                 ia32_emit_dest_register(env, node, 0);
1814         } else {
1815                 be_emit_cstring(env, "\tmovl ");
1816                 ia32_emit_source_register(env, node, 0);
1817                 be_emit_cstring(env, ", ");
1818                 ia32_emit_dest_register(env, node, 0);
1819         }
1820         be_emit_finish_line_gas(env, node);
1821 }
1822
1823 static
1824 void emit_be_Copy(ia32_emit_env_t *env, const ir_node *node) {
1825         Copy_emitter(env, node, be_get_Copy_op(node));
1826 }
1827
1828 static
1829 void emit_be_CopyKeep(ia32_emit_env_t *env, const ir_node *node) {
1830         Copy_emitter(env, node, be_get_CopyKeep_op(node));
1831 }
1832
1833 /**
1834  * Emits code for exchange.
1835  */
1836 static
1837 void emit_be_Perm(ia32_emit_env_t *env, const ir_node *node) {
1838         const arch_register_t *in1, *in2;
1839         const arch_register_class_t *cls1, *cls2;
1840
1841         in1 = arch_get_irn_register(env->arch_env, get_irn_n(node, 0));
1842         in2 = arch_get_irn_register(env->arch_env, get_irn_n(node, 1));
1843
1844         cls1 = arch_register_get_class(in1);
1845         cls2 = arch_register_get_class(in2);
1846
1847         assert(cls1 == cls2 && "Register class mismatch at Perm");
1848
1849         if (cls1 == &ia32_reg_classes[CLASS_ia32_gp]) {
1850                 be_emit_cstring(env, "\txchg ");
1851                 ia32_emit_source_register(env, node, 1);
1852                 be_emit_cstring(env, ", ");
1853                 ia32_emit_source_register(env, node, 0);
1854                 be_emit_finish_line_gas(env, node);
1855         } else if (cls1 == &ia32_reg_classes[CLASS_ia32_xmm]) {
1856                 be_emit_cstring(env, "\txorpd ");
1857                 ia32_emit_source_register(env, node, 1);
1858                 be_emit_cstring(env, ", ");
1859                 ia32_emit_source_register(env, node, 0);
1860                 be_emit_finish_line_gas(env, NULL);
1861
1862                 be_emit_cstring(env, "\txorpd ");
1863                 ia32_emit_source_register(env, node, 0);
1864                 be_emit_cstring(env, ", ");
1865                 ia32_emit_source_register(env, node, 1);
1866                 be_emit_finish_line_gas(env, NULL);
1867
1868                 be_emit_cstring(env, "\txorpd ");
1869                 ia32_emit_source_register(env, node, 1);
1870                 be_emit_cstring(env, ", ");
1871                 ia32_emit_source_register(env, node, 0);
1872                 be_emit_finish_line_gas(env, node);
1873         } else if (cls1 == &ia32_reg_classes[CLASS_ia32_vfp]) {
1874                 /* is a NOP */
1875         } else if (cls1 == &ia32_reg_classes[CLASS_ia32_st]) {
1876                 /* is a NOP */
1877         }
1878 }
1879
1880 /**
1881  * Emits code for Constant loading.
1882  */
1883 static
1884 void emit_ia32_Const(ia32_emit_env_t *env, const ir_node *node) {
1885         ia32_immop_type_t imm_tp = get_ia32_immop_type(node);
1886
1887         if (imm_tp == ia32_ImmSymConst) {
1888                 be_emit_cstring(env, "\tmovl ");
1889                 ia32_emit_immediate(env, node);
1890                 be_emit_cstring(env, ", ");
1891                 ia32_emit_dest_register(env, node, 0);
1892         } else {
1893                 tarval *tv = get_ia32_Immop_tarval(node);
1894                 assert(get_irn_mode(node) == mode_Iu);
1895                 /* beware: in some rare cases mode is mode_b which has no tarval_null() */
1896                 if (tarval_is_null(tv)) {
1897                         if (env->isa->opt_arch == arch_pentium_4) {
1898                                 /* P4 prefers sub r, r, others xor r, r */
1899                                 be_emit_cstring(env, "\tsubl ");
1900                         } else {
1901                                 be_emit_cstring(env, "\txorl ");
1902                         }
1903                         ia32_emit_dest_register(env, node, 0);
1904                         be_emit_cstring(env, ", ");
1905                         ia32_emit_dest_register(env, node, 0);
1906                 } else {
1907                         be_emit_cstring(env, "\tmovl ");
1908                         ia32_emit_immediate(env, node);
1909                         be_emit_cstring(env, ", ");
1910                         ia32_emit_dest_register(env, node, 0);
1911                 }
1912         }
1913         be_emit_finish_line_gas(env, node);
1914 }
1915
1916 /**
1917  * Emits code to load the TLS base
1918  */
1919 static
1920 void emit_ia32_LdTls(ia32_emit_env_t *env, const ir_node *node) {
1921         be_emit_cstring(env, "\tmovl %gs:0, ");
1922         ia32_emit_dest_register(env, node, 0);
1923         be_emit_finish_line_gas(env, node);
1924 }
1925
1926 static
1927 void emit_be_Return(ia32_emit_env_t *env, const ir_node *node)
1928 {
1929         be_emit_cstring(env, "\tret");
1930         be_emit_finish_line_gas(env, node);
1931 }
1932
1933 static
1934 void emit_Nothing(ia32_emit_env_t *env, const ir_node *node)
1935 {
1936         (void) env;
1937         (void) node;
1938 }
1939
1940
1941 /***********************************************************************************
1942  *                  _          __                                             _
1943  *                 (_)        / _|                                           | |
1944  *  _ __ ___   __ _ _ _ __   | |_ _ __ __ _ _ __ ___   _____      _____  _ __| | __
1945  * | '_ ` _ \ / _` | | '_ \  |  _| '__/ _` | '_ ` _ \ / _ \ \ /\ / / _ \| '__| |/ /
1946  * | | | | | | (_| | | | | | | | | | | (_| | | | | | |  __/\ V  V / (_) | |  |   <
1947  * |_| |_| |_|\__,_|_|_| |_| |_| |_|  \__,_|_| |_| |_|\___| \_/\_/ \___/|_|  |_|\_\
1948  *
1949  ***********************************************************************************/
1950
1951 /**
1952  * Enters the emitter functions for handled nodes into the generic
1953  * pointer of an opcode.
1954  */
1955 static
1956 void ia32_register_emitters(void) {
1957
1958 #define IA32_EMIT2(a,b) op_ia32_##a->ops.generic = (op_func)emit_ia32_##b
1959 #define IA32_EMIT(a)    IA32_EMIT2(a,a)
1960 #define EMIT(a)         op_##a->ops.generic = (op_func)emit_##a
1961 #define IGN(a)                  op_##a->ops.generic = (op_func)emit_Nothing
1962 #define BE_EMIT(a)      op_be_##a->ops.generic = (op_func)emit_be_##a
1963 #define BE_IGN(a)               op_be_##a->ops.generic = (op_func)emit_Nothing
1964
1965         /* first clear the generic function pointer for all ops */
1966         clear_irp_opcodes_generic_func();
1967
1968         /* register all emitter functions defined in spec */
1969         ia32_register_spec_emitters();
1970
1971         /* other ia32 emitter functions */
1972         IA32_EMIT(Asm);
1973         IA32_EMIT(CondJmp);
1974         IA32_EMIT(TestJmp);
1975         IA32_EMIT(CJmp);
1976         IA32_EMIT(CJmpAM);
1977         IA32_EMIT(CmpCMov);
1978         IA32_EMIT(CmpSet);
1979         IA32_EMIT(SwitchJmp);
1980         IA32_EMIT(CopyB);
1981         IA32_EMIT(CopyB_i);
1982         IA32_EMIT(Conv_I2FP);
1983         IA32_EMIT(Conv_FP2I);
1984         IA32_EMIT(Conv_FP2FP);
1985         IA32_EMIT(Conv_I2I);
1986         IA32_EMIT(Conv_I2I8Bit);
1987         IA32_EMIT(Const);
1988         IA32_EMIT(LdTls);
1989         IA32_EMIT(xCmp);
1990         IA32_EMIT(xCmpSet);
1991         IA32_EMIT(xCmpCMov);
1992         IA32_EMIT(xCondJmp);
1993         IA32_EMIT2(fcomJmp, x87CondJmp);
1994         IA32_EMIT2(fcompJmp, x87CondJmp);
1995         IA32_EMIT2(fcomppJmp, x87CondJmp);
1996         IA32_EMIT2(fcomrJmp, x87CondJmp);
1997         IA32_EMIT2(fcomrpJmp, x87CondJmp);
1998         IA32_EMIT2(fcomrppJmp, x87CondJmp);
1999
2000         /* benode emitter */
2001         BE_EMIT(Call);
2002         BE_EMIT(IncSP);
2003         BE_EMIT(SetSP);
2004         BE_EMIT(Copy);
2005         BE_EMIT(CopyKeep);
2006         BE_EMIT(Perm);
2007         BE_EMIT(Return);
2008
2009         BE_IGN(RegParams);
2010         BE_IGN(Barrier);
2011         BE_IGN(Keep);
2012
2013         /* firm emitter */
2014         EMIT(Jmp);
2015         IGN(Proj);
2016         IGN(Phi);
2017         IGN(Start);
2018
2019 #undef BE_EMIT
2020 #undef EMIT
2021 #undef IGN
2022 #undef IA32_EMIT2
2023 #undef IA32_EMIT
2024 }
2025
2026 static const char *last_name = NULL;
2027 static unsigned last_line = -1;
2028 static unsigned num = -1;
2029
2030 /**
2031  * Emit the debug support for node node.
2032  */
2033 static
2034 void ia32_emit_dbg(ia32_emit_env_t *env, const ir_node *node) {
2035         dbg_info *db = get_irn_dbg_info(node);
2036         unsigned lineno;
2037         const char *fname = be_retrieve_dbg_info(db, &lineno);
2038
2039         if (! env->cg->birg->main_env->options->stabs_debug_support)
2040                 return;
2041
2042         if (fname) {
2043                 if (last_name != fname) {
2044                         last_line = -1;
2045                         be_dbg_include_begin(env->cg->birg->main_env->db_handle, fname);
2046                         last_name = fname;
2047                 }
2048                 if (last_line != lineno) {
2049                         char name[64];
2050
2051                         snprintf(name, sizeof(name), ".LM%u", ++num);
2052                         last_line = lineno;
2053                         be_dbg_line(env->cg->birg->main_env->db_handle, lineno, name);
2054                         be_emit_string(env, name);
2055                         be_emit_cstring(env, ":\n");
2056                         be_emit_write_line(env);
2057                 }
2058         }
2059 }
2060
2061 typedef void (*emit_func_ptr) (ia32_emit_env_t *, const ir_node *);
2062
2063 /**
2064  * Emits code for a node.
2065  */
2066 static
2067 void ia32_emit_node(ia32_emit_env_t *env, const ir_node *node) {
2068         ir_op *op = get_irn_op(node);
2069
2070         DBG((dbg, LEVEL_1, "emitting code for %+F\n", node));
2071
2072         if (op->ops.generic) {
2073                 emit_func_ptr func = (emit_func_ptr) op->ops.generic;
2074                 ia32_emit_dbg(env, node);
2075                 (*func) (env, node);
2076         } else {
2077                 emit_Nothing(env, node);
2078                 ir_fprintf(stderr, "Warning: No emit handler for node %+F (%+G)\n", node, node);
2079         }
2080 }
2081
2082 /**
2083  * Emits gas alignment directives
2084  */
2085 static
2086 void ia32_emit_alignment(ia32_emit_env_t *env, unsigned align, unsigned skip) {
2087         be_emit_cstring(env, "\t.p2align ");
2088         be_emit_irprintf(env->emit, "%u,,%u\n", align, skip);
2089         be_emit_write_line(env);
2090 }
2091
2092 /**
2093  * Emits gas alignment directives for Functions depended on cpu architecture.
2094  */
2095 static
2096 void ia32_emit_align_func(ia32_emit_env_t *env, cpu_support cpu) {
2097         unsigned align;
2098         unsigned maximum_skip;
2099
2100         switch (cpu) {
2101                 case arch_i386:
2102                         align = 2;
2103                         break;
2104                 case arch_i486:
2105                         align = 4;
2106                         break;
2107                 case arch_k6:
2108                         align = 5;
2109                         break;
2110                 default:
2111                         align = 4;
2112         }
2113         maximum_skip = (1 << align) - 1;
2114         ia32_emit_alignment(env, align, maximum_skip);
2115 }
2116
2117 /**
2118  * Emits gas alignment directives for Labels depended on cpu architecture.
2119  */
2120 static
2121 void ia32_emit_align_label(ia32_emit_env_t *env, cpu_support cpu) {
2122         unsigned align; unsigned maximum_skip;
2123
2124         switch (cpu) {
2125                 case arch_i386:
2126                         align = 2;
2127                         break;
2128                 case arch_i486:
2129                         align = 4;
2130                         break;
2131                 case arch_k6:
2132                         align = 5;
2133                         break;
2134                 default:
2135                         align = 4;
2136         }
2137         maximum_skip = (1 << align) - 1;
2138         ia32_emit_alignment(env, align, maximum_skip);
2139 }
2140
2141 /**
2142  * Test wether a block should be aligned.
2143  * For cpus in the P4/Athlon class it is usefull to align jump labels to
2144  * 16 bytes. However we should only do that if the alignment nops before the
2145  * label aren't executed more often than we have jumps to the label.
2146  */
2147 static
2148 int should_align_block(ia32_emit_env_t *env, ir_node *block, ir_node *prev) {
2149         static const double DELTA = .0001;
2150         ir_exec_freq *exec_freq = env->cg->birg->exec_freq;
2151         double        block_freq;
2152         double        prev_freq = 0;  /**< execfreq of the fallthrough block */
2153         double        jmp_freq  = 0;  /**< execfreq of all non-fallthrough blocks */
2154         cpu_support   cpu       = env->isa->opt_arch;
2155         int           i, n_cfgpreds;
2156
2157         if(exec_freq == NULL)
2158                 return 0;
2159         if(cpu == arch_i386 || cpu == arch_i486)
2160                 return 0;
2161
2162         block_freq = get_block_execfreq(exec_freq, block);
2163         if(block_freq < DELTA)
2164                 return 0;
2165
2166         n_cfgpreds = get_Block_n_cfgpreds(block);
2167         for(i = 0; i < n_cfgpreds; ++i) {
2168                 ir_node *pred      = get_Block_cfgpred_block(block, i);
2169                 double   pred_freq = get_block_execfreq(exec_freq, pred);
2170
2171                 if(pred == prev) {
2172                         prev_freq += pred_freq;
2173                 } else {
2174                         jmp_freq  += pred_freq;
2175                 }
2176         }
2177
2178         if(prev_freq < DELTA && !(jmp_freq < DELTA))
2179                 return 1;
2180
2181         jmp_freq /= prev_freq;
2182
2183         switch (cpu) {
2184                 case arch_athlon:
2185                 case arch_athlon_64:
2186                 case arch_k6:
2187                         return jmp_freq > 3;
2188                 default:
2189                         return jmp_freq > 2;
2190         }
2191 }
2192
2193 static
2194 void ia32_emit_block_header(ia32_emit_env_t *env, ir_node *block, ir_node *prev)
2195 {
2196         int           n_cfgpreds;
2197         int           need_label;
2198         int           i, arity;
2199         ir_exec_freq  *exec_freq = env->cg->birg->exec_freq;
2200
2201         need_label = 1;
2202         n_cfgpreds = get_Block_n_cfgpreds(block);
2203         if (n_cfgpreds == 0) {
2204                 need_label = 0;
2205         } else if (n_cfgpreds == 1) {
2206                 ir_node *pred       = get_Block_cfgpred(block, 0);
2207                 ir_node *pred_block = get_nodes_block(pred);
2208
2209                 /* we don't need labels for fallthrough blocks, however switch-jmps
2210                  * are no fallthoughs */
2211                 if(pred_block == prev &&
2212                                 !(is_Proj(pred) && is_ia32_SwitchJmp(get_Proj_pred(pred)))) {
2213                         need_label = 0;
2214                 } else {
2215                         need_label = 1;
2216                 }
2217         } else {
2218                 need_label = 1;
2219         }
2220
2221         if (should_align_block(env, block, prev)) {
2222                 assert(need_label);
2223                 ia32_emit_align_label(env, env->isa->opt_arch);
2224         }
2225
2226         if(need_label) {
2227                 ia32_emit_block_name(env, block);
2228                 be_emit_char(env, ':');
2229
2230                 be_emit_pad_comment(env);
2231                 be_emit_cstring(env, "   /* preds:");
2232
2233                 /* emit list of pred blocks in comment */
2234                 arity = get_irn_arity(block);
2235                 for (i = 0; i < arity; ++i) {
2236                         ir_node *predblock = get_Block_cfgpred_block(block, i);
2237                         be_emit_irprintf(env->emit, " %d", get_irn_node_nr(predblock));
2238                 }
2239         } else {
2240                 be_emit_cstring(env, "\t/* ");
2241                 ia32_emit_block_name(env, block);
2242                 be_emit_cstring(env, ": ");
2243         }
2244         if (exec_freq != NULL) {
2245                 be_emit_irprintf(env->emit, " freq: %f",
2246                                  get_block_execfreq(exec_freq, block));
2247         }
2248         be_emit_cstring(env, " */\n");
2249         be_emit_write_line(env);
2250 }
2251
2252 /**
2253  * Walks over the nodes in a block connected by scheduling edges
2254  * and emits code for each node.
2255  */
2256 static
2257 void ia32_gen_block(ia32_emit_env_t *env, ir_node *block, ir_node *last_block)
2258 {
2259         const ir_node *node;
2260
2261         ia32_emit_block_header(env, block, last_block);
2262
2263         /* emit the contents of the block */
2264         ia32_emit_dbg(env, block);
2265         sched_foreach(block, node) {
2266                 ia32_emit_node(env, node);
2267         }
2268 }
2269
2270 /**
2271  * Emits code for function start.
2272  */
2273 static
2274 void ia32_emit_func_prolog(ia32_emit_env_t *env, ir_graph *irg) {
2275         ir_entity  *irg_ent  = get_irg_entity(irg);
2276         const char *irg_name = get_entity_ld_name(irg_ent);
2277         cpu_support cpu      = env->isa->opt_arch;
2278         const be_irg_t *birg = env->cg->birg;
2279
2280         be_emit_write_line(env);
2281         be_gas_emit_switch_section(env->emit, GAS_SECTION_TEXT);
2282         be_dbg_method_begin(birg->main_env->db_handle, irg_ent, be_abi_get_stack_layout(birg->abi));
2283         ia32_emit_align_func(env, cpu);
2284         if (get_entity_visibility(irg_ent) == visibility_external_visible) {
2285                 be_emit_cstring(env, ".global ");
2286                 be_emit_string(env, irg_name);
2287                 be_emit_char(env, '\n');
2288                 be_emit_write_line(env);
2289         }
2290         ia32_emit_function_object(env, irg_name);
2291         be_emit_string(env, irg_name);
2292         be_emit_cstring(env, ":\n");
2293         be_emit_write_line(env);
2294 }
2295
2296 /**
2297  * Emits code for function end
2298  */
2299 static
2300 void ia32_emit_func_epilog(ia32_emit_env_t *env, ir_graph *irg) {
2301         const char *irg_name = get_entity_ld_name(get_irg_entity(irg));
2302         const be_irg_t *birg = env->cg->birg;
2303
2304         ia32_emit_function_size(env, irg_name);
2305         be_dbg_method_end(birg->main_env->db_handle);
2306         be_emit_char(env, '\n');
2307         be_emit_write_line(env);
2308 }
2309
2310 /**
2311  * Block-walker:
2312  * Sets labels for control flow nodes (jump target)
2313  */
2314 static
2315 void ia32_gen_labels(ir_node *block, void *data)
2316 {
2317         ir_node *pred;
2318         int n = get_Block_n_cfgpreds(block);
2319         (void) data;
2320
2321         for (n--; n >= 0; n--) {
2322                 pred = get_Block_cfgpred(block, n);
2323                 set_irn_link(pred, block);
2324         }
2325 }
2326
2327 /**
2328  * Emit an exception label if the current instruction can fail.
2329  */
2330 void ia32_emit_exc_label(ia32_emit_env_t *env, const ir_node *node) {
2331         if (get_ia32_exc_label(node)) {
2332                 be_emit_irprintf(env->emit, ".EXL%u\n", 0);
2333                 be_emit_write_line(env);
2334         }
2335 }
2336
2337 /**
2338  * Main driver. Emits the code for one routine.
2339  */
2340 void ia32_gen_routine(ia32_code_gen_t *cg, ir_graph *irg) {
2341         ia32_emit_env_t env;
2342         ir_node *block;
2343         ir_node *last_block = NULL;
2344         int i, n;
2345
2346         env.isa      = (ia32_isa_t *)cg->arch_env->isa;
2347         env.emit     = &env.isa->emit;
2348         env.arch_env = cg->arch_env;
2349         env.cg       = cg;
2350
2351         ia32_register_emitters();
2352
2353         ia32_emit_func_prolog(&env, irg);
2354         irg_block_walk_graph(irg, ia32_gen_labels, NULL, &env);
2355
2356         n = ARR_LEN(cg->blk_sched);
2357         for (i = 0; i < n;) {
2358                 ir_node *next_bl;
2359
2360                 block   = cg->blk_sched[i];
2361                 ++i;
2362                 next_bl = i < n ? cg->blk_sched[i] : NULL;
2363
2364                 /* set here the link. the emitter expects to find the next block here */
2365                 set_irn_link(block, next_bl);
2366                 ia32_gen_block(&env, block, last_block);
2367                 last_block = block;
2368         }
2369
2370         ia32_emit_func_epilog(&env, irg);
2371 }
2372
2373 void ia32_init_emitter(void)
2374 {
2375         FIRM_DBG_REGISTER(dbg, "firm.be.ia32.emitter");
2376 }