rewrite and improve Cond transformation
[libfirm] / ir / be / ia32 / ia32_emitter.c
1 /*
2  * Copyright (C) 1995-2007 University of Karlsruhe.  All right reserved.
3  *
4  * This file is part of libFirm.
5  *
6  * This file may be distributed and/or modified under the terms of the
7  * GNU General Public License version 2 as published by the Free Software
8  * Foundation and appearing in the file LICENSE.GPL included in the
9  * packaging of this file.
10  *
11  * Licensees holding valid libFirm Professional Edition licenses may use
12  * this file in accordance with the libFirm Commercial License.
13  * Agreement provided with the Software.
14  *
15  * This file is provided AS IS with NO WARRANTY OF ANY KIND, INCLUDING THE
16  * WARRANTY OF DESIGN, MERCHANTABILITY AND FITNESS FOR A PARTICULAR
17  * PURPOSE.
18  */
19
20 /**
21  * @file
22  * @brief       This file implements the ia32 node emitter.
23  * @author      Christian Wuerdig, Matthias Braun
24  * @version     $Id$
25  */
26 #ifdef HAVE_CONFIG_H
27 #include "config.h"
28 #endif
29
30 #include <limits.h>
31
32 #include "xmalloc.h"
33 #include "tv.h"
34 #include "iredges.h"
35 #include "debug.h"
36 #include "irgwalk.h"
37 #include "irprintf.h"
38 #include "irop_t.h"
39 #include "irargs_t.h"
40 #include "irprog_t.h"
41 #include "iredges_t.h"
42 #include "execfreq.h"
43 #include "error.h"
44 #include "raw_bitset.h"
45
46 #include "../besched_t.h"
47 #include "../benode_t.h"
48 #include "../beabi.h"
49 #include "../be_dbgout.h"
50 #include "../beemitter.h"
51 #include "../begnuas.h"
52 #include "../beirg_t.h"
53
54 #include "ia32_emitter.h"
55 #include "gen_ia32_emitter.h"
56 #include "gen_ia32_regalloc_if.h"
57 #include "ia32_nodes_attr.h"
58 #include "ia32_new_nodes.h"
59 #include "ia32_map_regs.h"
60 #include "bearch_ia32_t.h"
61
62 DEBUG_ONLY(static firm_dbg_module_t *dbg = NULL;)
63
64 #define BLOCK_PREFIX ".L"
65
66 #define SNPRINTF_BUF_LEN 128
67
68 /**
69  * Returns the register at in position pos.
70  */
71 static
72 const arch_register_t *get_in_reg(ia32_emit_env_t *env, const ir_node *irn,
73                                   int pos)
74 {
75         const arch_env_t       *arch_env = env->arch_env;
76         ir_node                *op;
77         const arch_register_t  *reg = NULL;
78
79         assert(get_irn_arity(irn) > pos && "Invalid IN position");
80
81         /* The out register of the operator at position pos is the
82            in register we need. */
83         op = get_irn_n(irn, pos);
84
85         reg = arch_get_irn_register(arch_env, op);
86
87         assert(reg && "no in register found");
88
89         /* in case of a joker register: just return a valid register */
90         if (arch_register_type_is(reg, joker)) {
91                 const arch_register_req_t *req;
92
93                 /* ask for the requirements */
94                 req = arch_get_register_req(arch_env, irn, pos);
95
96                 if (arch_register_req_is(req, limited)) {
97                         /* in case of limited requirements: get the first allowed register */
98                         unsigned idx = rbitset_next(req->limited, 0, 1);
99                         reg = arch_register_for_index(req->cls, idx);
100                 } else {
101                         /* otherwise get first register in class */
102                         reg = arch_register_for_index(req->cls, 0);
103                 }
104         }
105
106         return reg;
107 }
108
109 /**
110  * Returns the register at out position pos.
111  */
112 static
113 const arch_register_t *get_out_reg(ia32_emit_env_t *env, const ir_node *irn,
114                                    int pos)
115 {
116         const arch_env_t      *arch_env = env->arch_env;
117         ir_node               *proj;
118         const arch_register_t *reg = NULL;
119
120         /* 1st case: irn is not of mode_T, so it has only                 */
121         /*           one OUT register -> good                             */
122         /* 2nd case: irn is of mode_T -> collect all Projs and ask the    */
123         /*           Proj with the corresponding projnum for the register */
124
125         if (get_irn_mode(irn) != mode_T) {
126                 reg = arch_get_irn_register(arch_env, irn);
127         } else if (is_ia32_irn(irn)) {
128                 reg = get_ia32_out_reg(irn, pos);
129         } else {
130                 const ir_edge_t *edge;
131
132                 foreach_out_edge(irn, edge) {
133                         proj = get_edge_src_irn(edge);
134                         assert(is_Proj(proj) && "non-Proj from mode_T node");
135                         if (get_Proj_proj(proj) == pos) {
136                                 reg = arch_get_irn_register(arch_env, proj);
137                                 break;
138                         }
139                 }
140         }
141
142         assert(reg && "no out register found");
143         return reg;
144 }
145
146 /**
147  * Determine the gnu assembler suffix that indicates a mode
148  */
149 static
150 char get_mode_suffix(const ir_mode *mode) {
151         if(mode_is_float(mode)) {
152                 switch(get_mode_size_bits(mode)) {
153                 case 32:
154                         return 's';
155                 case 64:
156                         return 'l';
157                 case 80:
158                 case 96:
159                         return 't';
160                 }
161         } else {
162                 assert(mode_is_int(mode) || mode_is_reference(mode) || mode_is_character(mode));
163                 switch(get_mode_size_bits(mode)) {
164                 case 64:
165                         return 'q';
166                 case 32:
167                         return 'l';
168                 case 16:
169                         return 'w';
170                 case 8:
171                         return 'b';
172                 }
173         }
174         panic("Can't output mode_suffix for %+F\n", mode);
175 }
176
177 static
178 int produces_result(const ir_node *node) {
179         return !(is_ia32_St(node) ||
180                 is_ia32_CondJmp(node) ||
181                 is_ia32_xCondJmp(node) ||
182                 is_ia32_CmpSet(node) ||
183                 is_ia32_xCmpSet(node) ||
184                 is_ia32_SwitchJmp(node));
185 }
186
187 static
188 const char *ia32_get_reg_name_for_mode(ia32_emit_env_t *env, ir_mode *mode,
189                                        const arch_register_t *reg) {
190         switch(get_mode_size_bits(mode)) {
191                 case 8:
192                         return ia32_get_mapped_reg_name(env->isa->regs_8bit, reg);
193                 case 16:
194                         return ia32_get_mapped_reg_name(env->isa->regs_16bit, reg);
195                 default:
196                         return (char *)arch_register_get_name(reg);
197         }
198 }
199
200 /**
201  * Add a number to a prefix. This number will not be used a second time.
202  */
203 static
204 char *get_unique_label(char *buf, size_t buflen, const char *prefix) {
205         static unsigned long id = 0;
206         snprintf(buf, buflen, "%s%lu", prefix, ++id);
207         return buf;
208 }
209
210 /*************************************************************
211  *             _       _    __   _          _
212  *            (_)     | |  / _| | |        | |
213  *  _ __  _ __ _ _ __ | |_| |_  | |__   ___| |_ __   ___ _ __
214  * | '_ \| '__| | '_ \| __|  _| | '_ \ / _ \ | '_ \ / _ \ '__|
215  * | |_) | |  | | | | | |_| |   | | | |  __/ | |_) |  __/ |
216  * | .__/|_|  |_|_| |_|\__|_|   |_| |_|\___|_| .__/ \___|_|
217  * | |                                       | |
218  * |_|                                       |_|
219  *************************************************************/
220
221 // we have no C++ and can't define an implicit ia32_emit_env_t* cast to
222 // be_emit_env_t* so we cheat a bit...
223 #define be_emit_char(env,c)             be_emit_char(env->emit,c)
224 #define be_emit_string(env,s)           be_emit_string(env->emit,s)
225 #undef be_emit_cstring
226 #define be_emit_cstring(env,x)          { be_emit_string_len(env->emit, x, sizeof(x)-1); }
227 #define be_emit_ident(env,i)            be_emit_ident(env->emit,i)
228 #define be_emit_tarval(env,tv)          be_emit_tarval(env->emit,tv)
229 #define be_emit_write_line(env)         be_emit_write_line(env->emit)
230 #define be_emit_finish_line_gas(env,n)  be_emit_finish_line_gas(env->emit,n)
231 #define be_emit_pad_comment(env)        be_emit_pad_comment(env->emit)
232
233 void ia32_emit_source_register(ia32_emit_env_t *env, const ir_node *node, int pos)
234 {
235         const arch_register_t *reg = get_in_reg(env, node, pos);
236         const char *reg_name = arch_register_get_name(reg);
237
238         assert(pos < get_irn_arity(node));
239
240         be_emit_char(env, '%');
241         be_emit_string(env, reg_name);
242 }
243
244 void ia32_emit_dest_register(ia32_emit_env_t *env, const ir_node *node, int pos) {
245         const arch_register_t *reg = get_out_reg(env, node, pos);
246         const char *reg_name = arch_register_get_name(reg);
247
248         be_emit_char(env, '%');
249         be_emit_string(env, reg_name);
250 }
251
252 void ia32_emit_x87_name(ia32_emit_env_t *env, const ir_node *node, int pos)
253 {
254         const ia32_x87_attr_t *attr = get_ia32_x87_attr_const(node);
255
256         assert(pos < 3);
257         be_emit_char(env, '%');
258         be_emit_string(env, attr->x87[pos]->name);
259 }
260
261 void ia32_emit_immediate(ia32_emit_env_t *env, const ir_node *node)
262 {
263         tarval *tv;
264         ir_entity *ent;
265         ident *id;
266
267         be_emit_char(env, '$');
268
269         switch(get_ia32_immop_type(node)) {
270         case ia32_ImmConst:
271                 tv = get_ia32_Immop_tarval(node);
272                 be_emit_tarval(env, tv);
273                 return;
274         case ia32_ImmSymConst:
275                 ent = get_ia32_Immop_symconst(node);
276                 set_entity_backend_marked(ent, 1);
277                 id = get_entity_ld_ident(ent);
278                 be_emit_ident(env, id);
279                 return;
280         case ia32_ImmNone:
281                 break;
282         }
283
284         assert(0);
285         be_emit_string(env, "BAD");
286         return;
287 }
288
289 static
290 void ia32_emit_mode_suffix_mode(ia32_emit_env_t *env, const ir_mode *mode)
291 {
292         be_emit_char(env, get_mode_suffix(mode));
293 }
294
295 void ia32_emit_mode_suffix(ia32_emit_env_t *env, const ir_node *node)
296 {
297         ir_mode *mode = get_ia32_ls_mode(node);
298         if(mode == NULL)
299                 mode = mode_Iu;
300
301         ia32_emit_mode_suffix_mode(env, mode);
302 }
303
304 void ia32_emit_x87_mode_suffix(ia32_emit_env_t *env, const ir_node *node)
305 {
306         ir_mode *mode = get_ia32_ls_mode(node);
307         if(mode != NULL)
308                 ia32_emit_mode_suffix_mode(env, mode);
309 }
310
311 static
312 char get_xmm_mode_suffix(ir_mode *mode)
313 {
314         assert(mode_is_float(mode));
315         switch(get_mode_size_bits(mode)) {
316         case 32:
317                 return 's';
318         case 64:
319                 return 'd';
320         default:
321                 assert(0);
322         }
323         return '%';
324 }
325
326 void ia32_emit_xmm_mode_suffix(ia32_emit_env_t *env, const ir_node *node)
327 {
328         ir_mode *mode = get_ia32_ls_mode(node);
329         assert(mode != NULL);
330         be_emit_char(env, 's');
331         be_emit_char(env, get_xmm_mode_suffix(mode));
332 }
333
334 void ia32_emit_xmm_mode_suffix_s(ia32_emit_env_t *env, const ir_node *node)
335 {
336         ir_mode *mode = get_ia32_ls_mode(node);
337         assert(mode != NULL);
338         be_emit_char(env, get_xmm_mode_suffix(mode));
339 }
340
341 void ia32_emit_extend_suffix(ia32_emit_env_t *env, const ir_mode *mode)
342 {
343         if(get_mode_size_bits(mode) == 32)
344                 return;
345         if(mode_is_signed(mode)) {
346                 be_emit_char(env, 's');
347         } else {
348                 be_emit_char(env, 'z');
349         }
350 }
351
352 static
353 void ia32_emit_function_object(ia32_emit_env_t *env, const char *name)
354 {
355         switch (be_gas_flavour) {
356         case GAS_FLAVOUR_NORMAL:
357                 be_emit_cstring(env, "\t.type\t");
358                 be_emit_string(env, name);
359                 be_emit_cstring(env, ", @function\n");
360                 be_emit_write_line(env);
361                 break;
362         case GAS_FLAVOUR_MINGW:
363                 be_emit_cstring(env, "\t.def\t");
364                 be_emit_string(env, name);
365                 be_emit_cstring(env, ";\t.scl\t2;\t.type\t32;\t.endef\n");
366                 be_emit_write_line(env);
367                 break;
368         default:
369                 break;
370         }
371 }
372
373 static
374 void ia32_emit_function_size(ia32_emit_env_t *env, const char *name)
375 {
376         switch (be_gas_flavour) {
377         case GAS_FLAVOUR_NORMAL:
378                 be_emit_cstring(env, "\t.size\t");
379                 be_emit_string(env, name);
380                 be_emit_cstring(env, ", .-");
381                 be_emit_string(env, name);
382                 be_emit_char(env, '\n');
383                 be_emit_write_line(env);
384                 break;
385         default:
386                 break;
387         }
388 }
389
390
391 static
392 void emit_ia32_Immediate(ia32_emit_env_t *env, const ir_node *node);
393
394 /**
395  * Emits registers and/or address mode of a binary operation.
396  */
397 void ia32_emit_binop(ia32_emit_env_t *env, const ir_node *node) {
398         int            right_pos;
399         const ir_node *right_op;
400
401         switch(get_ia32_op_type(node)) {
402         case ia32_Normal:
403                 right_op = get_irn_n(node, 3);
404                 if(is_ia32_Immediate(right_op)) {
405                         emit_ia32_Immediate(env, right_op);
406                         be_emit_cstring(env, ", ");
407                         ia32_emit_source_register(env, node, 2);
408                         break;
409                 } else if (is_ia32_ImmConst(node) || is_ia32_ImmSymConst(node)) {
410                         ia32_emit_immediate(env, node);
411                         be_emit_cstring(env, ", ");
412                         ia32_emit_source_register(env, node, 2);
413                 } else {
414                         const arch_register_t *in1 = get_in_reg(env, node, 2);
415                         const arch_register_t *in2 = get_in_reg(env, node, 3);
416                         const arch_register_t *out = produces_result(node) ? get_out_reg(env, node, 0) : NULL;
417                         const arch_register_t *in;
418                         const char            *in_name;
419
420                         in      = out ? (REGS_ARE_EQUAL(out, in2) ? in1 : in2) : in2;
421                         out     = out ? out : in1;
422                         in_name = arch_register_get_name(in);
423
424                         if (is_ia32_emit_cl(node)) {
425                                 assert(REGS_ARE_EQUAL(&ia32_gp_regs[REG_ECX], in) && "shift operation needs ecx");
426                                 in_name = "cl";
427                         }
428
429                         be_emit_char(env, '%');
430                         be_emit_string(env, in_name);
431                         be_emit_cstring(env, ", %");
432                         be_emit_string(env, arch_register_get_name(out));
433                 }
434                 break;
435         case ia32_AddrModeS:
436                 ia32_emit_am(env, node);
437                 be_emit_cstring(env, ", ");
438                 if (is_ia32_ImmConst(node) || is_ia32_ImmSymConst(node)) {
439                         assert(!produces_result(node) && "Source AM with Const must not produce result");
440                         ia32_emit_immediate(env, node);
441                 } else if (produces_result(node)) {
442                         ia32_emit_dest_register(env, node, 0);
443                 } else {
444                         ia32_emit_source_register(env, node, 2);
445                 }
446                 break;
447         case ia32_AddrModeD:
448                 right_pos = get_irn_arity(node) == 5 ? 3 : 2;
449                 right_op  = get_irn_n(node, right_pos);
450                 if(is_ia32_Immediate(right_op)) {
451                         emit_ia32_Immediate(env, right_op);
452                         be_emit_cstring(env, ", ");
453                         ia32_emit_am(env, node);
454                         break;
455                 } else if (is_ia32_ImmConst(node) || is_ia32_ImmSymConst(node)) {
456                         ia32_emit_immediate(env, node);
457                         be_emit_cstring(env, ", ");
458                         ia32_emit_am(env, node);
459                 } else {
460                         const arch_register_t *in1 = get_in_reg(env, node, right_pos);
461                         ir_mode               *mode = get_ia32_ls_mode(node);
462                         const char            *in_name;
463
464                         in_name = ia32_get_reg_name_for_mode(env, mode, in1);
465
466                         if (is_ia32_emit_cl(node)) {
467                                 assert(REGS_ARE_EQUAL(&ia32_gp_regs[REG_ECX], in1) && "shift operation needs ecx");
468                                 in_name = "cl";
469                         }
470
471                         be_emit_char(env, '%');
472                         be_emit_string(env, in_name);
473                         be_emit_cstring(env, ", ");
474                         ia32_emit_am(env, node);
475                 }
476                 break;
477         default:
478                 assert(0 && "unsupported op type");
479         }
480 }
481
482 /**
483  * Emits registers and/or address mode of a binary operation.
484  */
485 void ia32_emit_x87_binop(ia32_emit_env_t *env, const ir_node *node) {
486         switch(get_ia32_op_type(node)) {
487                 case ia32_Normal:
488                         if (is_ia32_ImmConst(node) || is_ia32_ImmSymConst(node)) {
489                                 // should not happen...
490                                 assert(0);
491                         } else {
492                                 const ia32_x87_attr_t *x87_attr = get_ia32_x87_attr_const(node);
493                                 const arch_register_t *in1      = x87_attr->x87[0];
494                                 const arch_register_t *in2      = x87_attr->x87[1];
495                                 const arch_register_t *out      = x87_attr->x87[2];
496                                 const arch_register_t *in;
497
498                                 in  = out ? (REGS_ARE_EQUAL(out, in2) ? in1 : in2) : in2;
499                                 out = out ? out : in1;
500
501                                 be_emit_char(env, '%');
502                                 be_emit_string(env, arch_register_get_name(in));
503                                 be_emit_cstring(env, ", %");
504                                 be_emit_string(env, arch_register_get_name(out));
505                         }
506                         break;
507                 case ia32_AddrModeS:
508                 case ia32_AddrModeD:
509                         ia32_emit_am(env, node);
510                         break;
511                 default:
512                         assert(0 && "unsupported op type");
513         }
514 }
515
516 void ia32_emit_am_or_dest_register(ia32_emit_env_t *env, const ir_node *node,
517                                    int pos) {
518         if(get_ia32_op_type(node) == ia32_Normal) {
519                 ia32_emit_dest_register(env, node, pos);
520         } else {
521                 assert(get_ia32_op_type(node) == ia32_AddrModeD);
522                 ia32_emit_am(env, node);
523         }
524 }
525
526 /**
527  * Emits registers and/or address mode of a unary operation.
528  */
529 void ia32_emit_unop(ia32_emit_env_t *env, const ir_node *node, int pos) {
530         const ir_node *op;
531
532         switch(get_ia32_op_type(node)) {
533         case ia32_Normal:
534                 op = get_irn_n(node, pos);
535                 if (is_ia32_Immediate(op)) {
536                         emit_ia32_Immediate(env, op);
537                 } else if (is_ia32_ImmConst(node) || is_ia32_ImmSymConst(node)) {
538                         ia32_emit_immediate(env, node);
539                 } else {
540                         ia32_emit_source_register(env, node, pos);
541                 }
542                 break;
543         case ia32_AddrModeS:
544         case ia32_AddrModeD:
545                 ia32_emit_am(env, node);
546                 break;
547         default:
548                 assert(0 && "unsupported op type");
549         }
550 }
551
552 /**
553  * Emits address mode.
554  */
555 void ia32_emit_am(ia32_emit_env_t *env, const ir_node *node) {
556         ir_entity *ent       = get_ia32_am_sc(node);
557         int        offs      = get_ia32_am_offs_int(node);
558         ir_node   *base      = get_irn_n(node, 0);
559         int        has_base  = !is_ia32_NoReg_GP(base);
560         ir_node   *index     = get_irn_n(node, 1);
561         int        has_index = !is_ia32_NoReg_GP(index);
562
563         /* just to be sure... */
564         assert(!is_ia32_use_frame(node) || get_ia32_frame_ent(node) != NULL);
565
566         /* emit offset */
567         if (ent != NULL) {
568                 ident *id;
569
570                 set_entity_backend_marked(ent, 1);
571                 id = get_entity_ld_ident(ent);
572                 if (is_ia32_am_sc_sign(node))
573                         be_emit_char(env, '-');
574                 be_emit_ident(env, id);
575
576                 if(get_entity_owner(ent) == get_tls_type()) {
577                         if (get_entity_visibility(ent) == visibility_external_allocated) {
578                                 be_emit_cstring(env, "@INDNTPOFF");
579                         } else {
580                                 be_emit_cstring(env, "@NTPOFF");
581                         }
582                 }
583         }
584
585         if(offs != 0) {
586                 if(ent != NULL) {
587                         be_emit_irprintf(env->emit, "%+d", offs);
588                 } else {
589                         be_emit_irprintf(env->emit, "%d", offs);
590                 }
591         }
592
593         if (has_base || has_index) {
594                 be_emit_char(env, '(');
595
596                 /* emit base */
597                 if (has_base) {
598                         ia32_emit_source_register(env, node, 0);
599                 }
600
601                 /* emit index + scale */
602                 if (has_index) {
603                         int scale;
604                         be_emit_char(env, ',');
605                         ia32_emit_source_register(env, node, 1);
606
607                         scale = get_ia32_am_scale(node);
608                         if (scale > 0) {
609                                 be_emit_irprintf(env->emit, ",%d", 1 << get_ia32_am_scale(node));
610                         }
611                 }
612                 be_emit_char(env, ')');
613         }
614 }
615
616 /*************************************************
617  *                 _ _                         _
618  *                (_) |                       | |
619  *   ___ _ __ ___  _| |_    ___ ___  _ __   __| |
620  *  / _ \ '_ ` _ \| | __|  / __/ _ \| '_ \ / _` |
621  * |  __/ | | | | | | |_  | (_| (_) | | | | (_| |
622  *  \___|_| |_| |_|_|\__|  \___\___/|_| |_|\__,_|
623  *
624  *************************************************/
625
626 #undef IA32_DO_EMIT
627 #define IA32_DO_EMIT(irn) ia32_fprintf_format(F, irn, cmd_buf, cmnt_buf)
628
629 /*
630  * coding of conditions
631  */
632 struct cmp2conditon_t {
633         const char *name;
634         pn_Cmp      num;
635 };
636
637 /*
638  * positive conditions for signed compares
639  */
640 static
641 const struct cmp2conditon_t cmp2condition_s[] = {
642         { NULL,              pn_Cmp_False },  /* always false */
643         { "e",               pn_Cmp_Eq },     /* == */
644         { "l",               pn_Cmp_Lt },     /* < */
645         { "le",              pn_Cmp_Le },     /* <= */
646         { "g",               pn_Cmp_Gt },     /* > */
647         { "ge",              pn_Cmp_Ge },     /* >= */
648         { "ne",              pn_Cmp_Lg },     /* != */
649         { NULL,              pn_Cmp_Leg},     /* Floating point: ordered */
650         { NULL,              pn_Cmp_Uo },     /* Floating point: unordered */
651         { "e",               pn_Cmp_Ue },     /* Floating point: unordered or == */
652         { "b",               pn_Cmp_Ul },     /* Floating point: unordered or < */
653         { "be",              pn_Cmp_Ule },    /* Floating point: unordered or <= */
654         { "a",               pn_Cmp_Ug },     /* Floating point: unordered or > */
655         { "ae",              pn_Cmp_Uge },    /* Floating point: unordered or >= */
656         { "ne",              pn_Cmp_Ne },     /* Floating point: unordered or != */
657         { NULL,              pn_Cmp_True },   /* always true */
658 };
659
660 /*
661  * positive conditions for unsigned compares
662  */
663 static
664 const struct cmp2conditon_t cmp2condition_u[] = {
665         { NULL,              pn_Cmp_False },  /* always false */
666         { "e",               pn_Cmp_Eq },     /* == */
667         { "b",               pn_Cmp_Lt },     /* < */
668         { "be",              pn_Cmp_Le },     /* <= */
669         { "a",               pn_Cmp_Gt },     /* > */
670         { "ae",              pn_Cmp_Ge },     /* >= */
671         { "ne",              pn_Cmp_Lg },     /* != */
672         { NULL,              pn_Cmp_True },   /* always true */
673 };
674
675 /*
676  * returns the condition code
677  */
678 static
679 const char *get_cmp_suffix(pn_Cmp cmp_code)
680 {
681         assert( (cmp2condition_s[cmp_code & 15].num) == (cmp_code & 15));
682         assert( (cmp2condition_u[cmp_code & 7].num) == (cmp_code & 7));
683
684         if((cmp_code & ia32_pn_Cmp_Unsigned)) {
685                 return cmp2condition_u[cmp_code & 7].name;
686         } else {
687                 return cmp2condition_s[cmp_code & 15].name;
688         }
689 }
690
691 void ia32_emit_cmp_suffix(ia32_emit_env_t *env, long pnc)
692 {
693         be_emit_string(env, get_cmp_suffix(pnc));
694 }
695
696
697 /**
698  * Returns the target block for a control flow node.
699  */
700 static
701 ir_node *get_cfop_target_block(const ir_node *irn) {
702         return get_irn_link(irn);
703 }
704
705 /**
706  * Emits a block label for the given block.
707  */
708 static
709 void ia32_emit_block_name(ia32_emit_env_t *env, const ir_node *block)
710 {
711         be_emit_cstring(env, BLOCK_PREFIX);
712         be_emit_irprintf(env->emit, "%d", get_irn_node_nr(block));
713 }
714
715 /**
716  * Emits the target label for a control flow node.
717  */
718 static
719 void ia32_emit_cfop_target(ia32_emit_env_t * env, const ir_node *node) {
720         ir_node *block = get_cfop_target_block(node);
721
722         ia32_emit_block_name(env, block);
723 }
724
725 /** Return the next block in Block schedule */
726 static ir_node *next_blk_sched(const ir_node *block) {
727         return get_irn_link(block);
728 }
729
730 /**
731  * Returns the Proj with projection number proj and NOT mode_M
732  */
733 static
734 ir_node *get_proj(const ir_node *node, long proj) {
735         const ir_edge_t *edge;
736         ir_node         *src;
737
738         assert(get_irn_mode(node) == mode_T && "expected mode_T node");
739
740         foreach_out_edge(node, edge) {
741                 src = get_edge_src_irn(edge);
742
743                 assert(is_Proj(src) && "Proj expected");
744                 if (get_irn_mode(src) == mode_M)
745                         continue;
746
747                 if (get_Proj_proj(src) == proj)
748                         return src;
749         }
750         return NULL;
751 }
752
753 /**
754  * Emits the jump sequence for a conditional jump (cmp + jmp_true + jmp_false)
755  */
756 static
757 void finish_CondJmp(ia32_emit_env_t *env, const ir_node *node, ir_mode *mode,
758                     long pnc) {
759         const ir_node *proj_true;
760         const ir_node *proj_false;
761         const ir_node *block;
762         const ir_node *next_block;
763         int flipped = 0;
764
765         /* get both Proj's */
766         proj_true = get_proj(node, pn_Cond_true);
767         assert(proj_true && "CondJmp without true Proj");
768
769         proj_false = get_proj(node, pn_Cond_false);
770         assert(proj_false && "CondJmp without false Proj");
771
772         /* for now, the code works for scheduled and non-schedules blocks */
773         block = get_nodes_block(node);
774
775         /* we have a block schedule */
776         next_block = next_blk_sched(block);
777
778         if (get_cfop_target_block(proj_true) == next_block) {
779                 /* exchange both proj's so the second one can be omitted */
780                 const ir_node *t = proj_true;
781
782                 proj_true  = proj_false;
783                 proj_false = t;
784                 flipped    = 1;
785                 pnc        = get_negated_pnc(pnc, mode);
786         }
787
788         /* in case of unordered compare, check for parity */
789         if (pnc & pn_Cmp_Uo) {
790                 be_emit_cstring(env, "\tjp ");
791                 ia32_emit_cfop_target(env, proj_true);
792                 be_emit_finish_line_gas(env, proj_true);
793         }
794
795         be_emit_cstring(env, "\tj");
796         ia32_emit_cmp_suffix(env, pnc);
797         be_emit_char(env, ' ');
798         ia32_emit_cfop_target(env, proj_true);
799         be_emit_finish_line_gas(env, proj_true);
800
801         /* the second Proj might be a fallthrough */
802         if (get_cfop_target_block(proj_false) != next_block) {
803                 be_emit_cstring(env, "\tjmp ");
804                 ia32_emit_cfop_target(env, proj_false);
805                 be_emit_finish_line_gas(env, proj_false);
806         } else {
807                 be_emit_cstring(env, "\t/* fallthrough to ");
808                 ia32_emit_cfop_target(env, proj_false);
809                 be_emit_cstring(env, " */");
810                 be_emit_finish_line_gas(env, proj_false);
811         }
812 }
813
814 /**
815  * Emits code for conditional jump.
816  */
817 static
818 void CondJmp_emitter(ia32_emit_env_t *env, const ir_node *node) {
819         be_emit_cstring(env, "\tcmp ");
820         ia32_emit_binop(env, node);
821         be_emit_finish_line_gas(env, node);
822
823         finish_CondJmp(env, node, mode_Iu, get_ia32_pncode(node));
824 }
825
826 /**
827  * Emits code for conditional jump with two variables.
828  */
829 static
830 void emit_ia32_CondJmp(ia32_emit_env_t *env, const ir_node *node) {
831         CondJmp_emitter(env, node);
832 }
833
834 /**
835  * Emits code for conditional test and jump.
836  */
837 static
838 void TestJmp_emitter(ia32_emit_env_t *env, const ir_node *node) {
839         be_emit_cstring(env, "\ttest ");
840         ia32_emit_binop(env, node);
841         be_emit_finish_line_gas(env, node);
842
843         finish_CondJmp(env, node, mode_Iu, get_ia32_pncode(node));
844 }
845
846 /**
847  * Emits code for conditional test and jump with two variables.
848  */
849 static
850 void emit_ia32_TestJmp(ia32_emit_env_t *env, const ir_node *node) {
851         TestJmp_emitter(env, node);
852 }
853
854 static
855 void emit_ia32_CJmp(ia32_emit_env_t *env, const ir_node *node) {
856         be_emit_cstring(env, "/* omitted redundant test */");
857         be_emit_finish_line_gas(env, node);
858
859         finish_CondJmp(env, node, mode_Is, get_ia32_pncode(node));
860 }
861
862 static
863 void emit_ia32_CJmpAM(ia32_emit_env_t *env, const ir_node *node) {
864         be_emit_cstring(env, "/* omitted redundant test/cmp */");
865         be_emit_finish_line_gas(env, node);
866
867         finish_CondJmp(env, node, mode_Is, get_ia32_pncode(node));
868 }
869
870 /**
871  * Emits code for conditional SSE floating point jump with two variables.
872  */
873 static
874 void emit_ia32_xCondJmp(ia32_emit_env_t *env, const ir_node *node) {
875         be_emit_cstring(env, "\tucomi");
876         ia32_emit_xmm_mode_suffix(env, node);
877         be_emit_char(env, ' ');
878         ia32_emit_binop(env, node);
879         be_emit_finish_line_gas(env, node);
880
881         finish_CondJmp(env, node, mode_F, get_ia32_pncode(node));
882 }
883
884 /**
885  * Emits code for conditional x87 floating point jump with two variables.
886  */
887 static
888 void emit_ia32_x87CondJmp(ia32_emit_env_t *env, const ir_node *node) {
889         const ia32_x87_attr_t *x87_attr = get_ia32_x87_attr_const(node);
890         const char            *reg      = x87_attr->x87[1]->name;
891         long                   pnc      = get_ia32_pncode(node);
892
893         switch (get_ia32_irn_opcode(node)) {
894         case iro_ia32_fcomrJmp:
895                 pnc = get_inversed_pnc(pnc);
896                 reg = x87_attr->x87[0]->name;
897         case iro_ia32_fcomJmp:
898         default:
899                 be_emit_cstring(env, "\tfucom ");
900                 break;
901         case iro_ia32_fcomrpJmp:
902                 pnc = get_inversed_pnc(pnc);
903                 reg = x87_attr->x87[0]->name;
904         case iro_ia32_fcompJmp:
905                 be_emit_cstring(env, "\tfucomp ");
906                 break;
907         case iro_ia32_fcomrppJmp:
908                 pnc = get_inversed_pnc(pnc);
909         case iro_ia32_fcomppJmp:
910                 be_emit_cstring(env, "\tfucompp ");
911                 reg = "";
912                 break;
913         }
914
915         if(reg[0] != '\0') {
916                 be_emit_char(env, '%');
917                 be_emit_string(env, reg);
918         }
919         be_emit_finish_line_gas(env, node);
920
921         be_emit_cstring(env, "\tfnstsw %ax");
922         be_emit_finish_line_gas(env, node);
923         be_emit_cstring(env, "\tsahf");
924         be_emit_finish_line_gas(env, node);
925
926         finish_CondJmp(env, node, mode_E, pnc);
927 }
928
929 static
930 void emit_register_or_immediate(ia32_emit_env_t *env, const ir_node *node,
931                                 int pos)
932 {
933         ir_node *op = get_irn_n(node, pos);
934         if(is_ia32_Immediate(op)) {
935                 emit_ia32_Immediate(env, op);
936         } else {
937                 ia32_emit_source_register(env, node, pos);
938         }
939 }
940
941 static
942 int is_ia32_Immediate_0(const ir_node *node)
943 {
944         const ia32_immediate_attr_t *attr = get_ia32_immediate_attr_const(node);
945
946         return attr->offset == 0 && attr->symconst == NULL;
947 }
948
949 static
950 void CMov_emitter(ia32_emit_env_t *env, const ir_node *node)
951 {
952         long pnc = get_ia32_pncode(node);
953         const arch_register_t *in1, *in2, *out;
954
955         out = arch_get_irn_register(env->arch_env, node);
956         in1 = arch_get_irn_register(env->arch_env, get_irn_n(node, 2));
957         in2 = arch_get_irn_register(env->arch_env, get_irn_n(node, 3));
958
959         /* we have to emit the cmp first, because the destination register */
960         /* could be one of the compare registers                           */
961         if (is_ia32_CmpCMov(node)) {
962                 long pncr = pnc & ~ia32_pn_Cmp_Unsigned;
963                 ir_node *cmp_right = get_irn_n(node, 1);
964
965                 if( (pncr == pn_Cmp_Eq || pncr == pn_Cmp_Lg)
966                                 && is_ia32_Immediate(cmp_right)
967                                 && is_ia32_Immediate_0(cmp_right)) {
968                         be_emit_cstring(env, "\ttest ");
969                         ia32_emit_source_register(env, node, 0);
970                         be_emit_cstring(env, ", ");
971                         ia32_emit_source_register(env, node, 0);
972                 } else {
973                         be_emit_cstring(env, "\tcmp ");
974                         emit_register_or_immediate(env, node, 1);
975                         be_emit_cstring(env, ", ");
976                         ia32_emit_source_register(env, node, 0);
977                 }
978         } else if (is_ia32_xCmpCMov(node)) {
979                 be_emit_cstring(env, "\tucomis");
980                 ia32_emit_mode_suffix_mode(env, get_irn_mode(node));
981                 be_emit_char(env, ' ');
982                 ia32_emit_source_register(env, node, 1);
983                 be_emit_cstring(env, ", ");
984                 ia32_emit_source_register(env, node, 0);
985         } else {
986                 assert(0 && "unsupported CMov");
987         }
988         be_emit_finish_line_gas(env, node);
989
990         if (REGS_ARE_EQUAL(out, in2)) {
991                 /* best case: default in == out -> do nothing */
992         } else if (REGS_ARE_EQUAL(out, in1)) {
993                 ir_node *n = (ir_node*) node;
994                 /* true in == out -> need complement compare and exchange true and default in */
995                 ir_node *t = get_irn_n(n, 2);
996                 set_irn_n(n, 2, get_irn_n(n, 3));
997                 set_irn_n(n, 3, t);
998
999                 pnc = get_negated_pnc(pnc, get_irn_mode(node));
1000         } else {
1001                 /* out is different from in: need copy default -> out */
1002                 be_emit_cstring(env, "\tmovl ");
1003                 ia32_emit_source_register(env, node, n_ia32_CmpCMov_val_false);
1004                 be_emit_cstring(env, ", ");
1005                 ia32_emit_dest_register(env, node, 0);
1006                 be_emit_finish_line_gas(env, node);
1007         }
1008
1009         be_emit_cstring(env, "\tcmov");
1010         ia32_emit_cmp_suffix(env, pnc);
1011         be_emit_cstring(env, "l ");
1012         ia32_emit_source_register(env, node, n_ia32_CmpCMov_val_true);
1013         be_emit_cstring(env, ", ");
1014         ia32_emit_dest_register(env, node, 0);
1015         be_emit_finish_line_gas(env, node);
1016 }
1017
1018 static
1019 void emit_ia32_CmpCMov(ia32_emit_env_t *env, const ir_node *node)
1020 {
1021         CMov_emitter(env, node);
1022 }
1023
1024 static
1025 void emit_ia32_xCmpCMov(ia32_emit_env_t *env, const ir_node *node)
1026 {
1027         CMov_emitter(env, node);
1028 }
1029
1030 static
1031 void Set_emitter(ia32_emit_env_t *env, const ir_node *node)
1032 {
1033         long pnc = get_ia32_pncode(node);
1034         const char *reg8bit;
1035         const arch_register_t *out;
1036
1037         out     = arch_get_irn_register(env->arch_env, node);
1038         reg8bit = ia32_get_mapped_reg_name(env->isa->regs_8bit, out);
1039
1040         if (is_ia32_CmpSet(node)) {
1041                 long     pncr      = pnc & ~ia32_pn_Cmp_Unsigned;
1042                 ir_node *cmp_right = get_irn_n(node, n_ia32_CmpSet_cmp_right);
1043
1044                 if( (pncr == pn_Cmp_Eq || pncr == pn_Cmp_Lg)
1045                                 && is_ia32_Immediate(cmp_right)
1046                                 && is_ia32_Immediate_0(cmp_right)) {
1047                         be_emit_cstring(env, "\ttest ");
1048                         ia32_emit_source_register(env, node, n_ia32_CmpSet_cmp_left);
1049                         be_emit_cstring(env, ", ");
1050                         ia32_emit_source_register(env, node, n_ia32_CmpSet_cmp_left);
1051                 } else {
1052                         be_emit_cstring(env, "\tcmp ");
1053                         ia32_emit_binop(env, node);
1054                 }
1055         } else if (is_ia32_xCmpSet(node)) {
1056                 be_emit_cstring(env, "\tucomis");
1057                 ia32_emit_mode_suffix_mode(env, get_irn_mode(get_irn_n(node, 2)));
1058                 be_emit_char(env, ' ');
1059                 ia32_emit_binop(env, node);
1060         } else {
1061                 assert(0 && "unsupported Set");
1062         }
1063         be_emit_finish_line_gas(env, node);
1064
1065         /* use mov to clear target because it doesn't affect the eflags */
1066         be_emit_cstring(env, "\tmovl $0, %");
1067         be_emit_string(env, arch_register_get_name(out));
1068         be_emit_finish_line_gas(env, node);
1069
1070         be_emit_cstring(env, "\tset");
1071         ia32_emit_cmp_suffix(env, pnc);
1072         be_emit_cstring(env, " %");
1073         be_emit_string(env, reg8bit);
1074         be_emit_finish_line_gas(env, node);
1075 }
1076
1077 static
1078 void emit_ia32_CmpSet(ia32_emit_env_t *env, const ir_node *node) {
1079         Set_emitter(env, node);
1080 }
1081
1082 static
1083 void emit_ia32_xCmpSet(ia32_emit_env_t *env, const ir_node *node) {
1084         Set_emitter(env, node);
1085 }
1086
1087 static
1088 void emit_ia32_xCmp(ia32_emit_env_t *env, const ir_node *node) {
1089         int  sse_pnc  = -1;
1090         long pnc      = get_ia32_pncode(node);
1091         long unord    = pnc & pn_Cmp_Uo;
1092
1093         assert( (pnc & ia32_pn_Cmp_Unsigned) == 0);
1094
1095         switch (pnc) {
1096                 case pn_Cmp_Leg: /* odered */
1097                         sse_pnc = 7;
1098                         break;
1099                 case pn_Cmp_Uo:  /* unordered */
1100                         sse_pnc = 3;
1101                         break;
1102                 case pn_Cmp_Ue:
1103                 case pn_Cmp_Eq:  /* == */
1104                         sse_pnc = 0;
1105                         break;
1106                 case pn_Cmp_Ul:
1107                 case pn_Cmp_Lt:  /* < */
1108                         sse_pnc = 1;
1109                         break;
1110                 case pn_Cmp_Ule:
1111                 case pn_Cmp_Le: /* <= */
1112                         sse_pnc = 2;
1113                         break;
1114                 case pn_Cmp_Ug:
1115                 case pn_Cmp_Gt:  /* > */
1116                         sse_pnc = 6;
1117                         break;
1118                 case pn_Cmp_Uge:
1119                 case pn_Cmp_Ge: /* >= */
1120                         sse_pnc = 5;
1121                         break;
1122                 case pn_Cmp_Ne:
1123                 case pn_Cmp_Lg:  /* != */
1124                         sse_pnc = 4;
1125                         break;
1126         }
1127
1128         assert(sse_pnc >= 0 && "unsupported compare");
1129
1130         if (unord && sse_pnc != 3) {
1131                 /*
1132                         We need a separate compare against unordered.
1133                         Quick and Dirty solution:
1134                         - get some memory on stack
1135                         - compare
1136                         - store result
1137                         - compare
1138                         - and result and stored result
1139                     - cleanup stack
1140                 */
1141                 be_emit_cstring(env, "\tsubl $8, %esp");
1142                 be_emit_finish_line_gas(env, node);
1143
1144                 be_emit_cstring(env, "\tcmpsd $3, ");
1145                 ia32_emit_binop(env, node);
1146                 be_emit_finish_line_gas(env, node);
1147
1148                 be_emit_cstring(env, "\tmovsd ");
1149                 ia32_emit_dest_register(env, node, 0);
1150                 be_emit_cstring(env, ", (%esp)");
1151                 be_emit_finish_line_gas(env, node);
1152         }
1153
1154         be_emit_cstring(env, "\tcmpsd ");
1155         be_emit_irprintf(env->emit, "%d, ", sse_pnc);
1156         ia32_emit_binop(env, node);
1157         be_emit_finish_line_gas(env, node);
1158
1159         if (unord && sse_pnc != 3) {
1160                 be_emit_cstring(env, "\tandpd (%esp), ");
1161                 ia32_emit_dest_register(env, node, 0);
1162                 be_emit_finish_line_gas(env, node);
1163
1164                 be_emit_cstring(env, "\taddl $8, %esp");
1165                 be_emit_finish_line_gas(env, node);
1166         }
1167 }
1168
1169 /*********************************************************
1170  *                 _ _       _
1171  *                (_) |     (_)
1172  *   ___ _ __ ___  _| |_     _ _   _ _ __ ___  _ __  ___
1173  *  / _ \ '_ ` _ \| | __|   | | | | | '_ ` _ \| '_ \/ __|
1174  * |  __/ | | | | | | |_    | | |_| | | | | | | |_) \__ \
1175  *  \___|_| |_| |_|_|\__|   | |\__,_|_| |_| |_| .__/|___/
1176  *                         _/ |               | |
1177  *                        |__/                |_|
1178  *********************************************************/
1179
1180 /* jump table entry (target and corresponding number) */
1181 typedef struct _branch_t {
1182         ir_node *target;
1183         int      value;
1184 } branch_t;
1185
1186 /* jump table for switch generation */
1187 typedef struct _jmp_tbl_t {
1188         ir_node  *defProj;         /**< default target */
1189         long      min_value;       /**< smallest switch case */
1190         long      max_value;       /**< largest switch case */
1191         long      num_branches;    /**< number of jumps */
1192         char     *label;           /**< label of the jump table */
1193         branch_t *branches;        /**< jump array */
1194 } jmp_tbl_t;
1195
1196 /**
1197  * Compare two variables of type branch_t. Used to sort all switch cases
1198  */
1199 static
1200 int ia32_cmp_branch_t(const void *a, const void *b) {
1201         branch_t *b1 = (branch_t *)a;
1202         branch_t *b2 = (branch_t *)b;
1203
1204         if (b1->value <= b2->value)
1205                 return -1;
1206         else
1207                 return 1;
1208 }
1209
1210 /**
1211  * Emits code for a SwitchJmp (creates a jump table if
1212  * possible otherwise a cmp-jmp cascade). Port from
1213  * cggg ia32 backend
1214  */
1215 static
1216 void emit_ia32_SwitchJmp(ia32_emit_env_t *env, const ir_node *node) {
1217         unsigned long       interval;
1218         int                 last_value, i;
1219         long                pnc;
1220         jmp_tbl_t           tbl;
1221         ir_node            *proj;
1222         const ir_edge_t    *edge;
1223
1224         /* fill the table structure */
1225         tbl.label        = xmalloc(SNPRINTF_BUF_LEN);
1226         tbl.label        = get_unique_label(tbl.label, SNPRINTF_BUF_LEN, ".TBL_");
1227         tbl.defProj      = NULL;
1228         tbl.num_branches = get_irn_n_edges(node);
1229         tbl.branches     = xcalloc(tbl.num_branches, sizeof(tbl.branches[0]));
1230         tbl.min_value    = INT_MAX;
1231         tbl.max_value    = INT_MIN;
1232
1233         i = 0;
1234         /* go over all proj's and collect them */
1235         foreach_out_edge(node, edge) {
1236                 proj = get_edge_src_irn(edge);
1237                 assert(is_Proj(proj) && "Only proj allowed at SwitchJmp");
1238
1239                 pnc = get_Proj_proj(proj);
1240
1241                 /* create branch entry */
1242                 tbl.branches[i].target = proj;
1243                 tbl.branches[i].value  = pnc;
1244
1245                 tbl.min_value = pnc < tbl.min_value ? pnc : tbl.min_value;
1246                 tbl.max_value = pnc > tbl.max_value ? pnc : tbl.max_value;
1247
1248                 /* check for default proj */
1249                 if (pnc == get_ia32_pncode(node)) {
1250                         assert(tbl.defProj == NULL && "found two defProjs at SwitchJmp");
1251                         tbl.defProj = proj;
1252                 }
1253
1254                 i++;
1255         }
1256
1257         /* sort the branches by their number */
1258         qsort(tbl.branches, tbl.num_branches, sizeof(tbl.branches[0]), ia32_cmp_branch_t);
1259
1260         /* two-complement's magic make this work without overflow */
1261         interval = tbl.max_value - tbl.min_value;
1262
1263         /* emit the table */
1264         be_emit_cstring(env, "\tcmpl $");
1265         be_emit_irprintf(env->emit, "%u, ", interval);
1266         ia32_emit_source_register(env, node, 0);
1267         be_emit_finish_line_gas(env, node);
1268
1269         be_emit_cstring(env, "\tja ");
1270         ia32_emit_cfop_target(env, tbl.defProj);
1271         be_emit_finish_line_gas(env, node);
1272
1273         if (tbl.num_branches > 1) {
1274                 /* create table */
1275                 be_emit_cstring(env, "\tjmp *");
1276                 be_emit_string(env, tbl.label);
1277                 be_emit_cstring(env, "(,");
1278                 ia32_emit_source_register(env, node, 0);
1279                 be_emit_cstring(env, ",4)");
1280                 be_emit_finish_line_gas(env, node);
1281
1282                 be_gas_emit_switch_section(env->emit, GAS_SECTION_RODATA);
1283                 be_emit_cstring(env, "\t.align 4\n");
1284                 be_emit_write_line(env);
1285
1286                 be_emit_string(env, tbl.label);
1287                 be_emit_cstring(env, ":\n");
1288                 be_emit_write_line(env);
1289
1290                 be_emit_cstring(env, ".long ");
1291                 ia32_emit_cfop_target(env, tbl.branches[0].target);
1292                 be_emit_finish_line_gas(env, NULL);
1293
1294                 last_value = tbl.branches[0].value;
1295                 for (i = 1; i < tbl.num_branches; ++i) {
1296                         while (++last_value < tbl.branches[i].value) {
1297                                 be_emit_cstring(env, ".long ");
1298                                 ia32_emit_cfop_target(env, tbl.defProj);
1299                                 be_emit_finish_line_gas(env, NULL);
1300                         }
1301                         be_emit_cstring(env, ".long ");
1302                         ia32_emit_cfop_target(env, tbl.branches[i].target);
1303                         be_emit_finish_line_gas(env, NULL);
1304                 }
1305                 be_gas_emit_switch_section(env->emit, GAS_SECTION_TEXT);
1306         } else {
1307                 /* one jump is enough */
1308                 be_emit_cstring(env, "\tjmp ");
1309                 ia32_emit_cfop_target(env, tbl.branches[0].target);
1310                 be_emit_finish_line_gas(env, node);
1311         }
1312
1313         if (tbl.label)
1314                 free(tbl.label);
1315         if (tbl.branches)
1316                 free(tbl.branches);
1317 }
1318
1319 /**
1320  * Emits code for a unconditional jump.
1321  */
1322 static
1323 void emit_Jmp(ia32_emit_env_t *env, const ir_node *node) {
1324         ir_node *block, *next_block;
1325
1326         /* for now, the code works for scheduled and non-schedules blocks */
1327         block = get_nodes_block(node);
1328
1329         /* we have a block schedule */
1330         next_block = next_blk_sched(block);
1331         if (get_cfop_target_block(node) != next_block) {
1332                 be_emit_cstring(env, "\tjmp ");
1333                 ia32_emit_cfop_target(env, node);
1334         } else {
1335                 be_emit_cstring(env, "\t/* fallthrough to ");
1336                 ia32_emit_cfop_target(env, node);
1337                 be_emit_cstring(env, " */");
1338         }
1339         be_emit_finish_line_gas(env, node);
1340 }
1341
1342 static
1343 void emit_ia32_Immediate(ia32_emit_env_t *env, const ir_node *node)
1344 {
1345         const ia32_immediate_attr_t *attr = get_ia32_immediate_attr_const(node);
1346
1347         be_emit_char(env, '$');
1348         if(attr->symconst != NULL) {
1349                 ident *id = get_entity_ld_ident(attr->symconst);
1350
1351                 if(attr->attr.data.am_sc_sign)
1352                         be_emit_char(env, '-');
1353                 be_emit_ident(env, id);
1354         }
1355         if(attr->symconst == NULL || attr->offset != 0) {
1356                 if(attr->symconst != NULL)
1357                         be_emit_char(env, '+');
1358                 be_emit_irprintf(env->emit, "%d", attr->offset);
1359         }
1360 }
1361
1362 static
1363 const char* emit_asm_operand(ia32_emit_env_t *env, const ir_node *node,
1364                              const char *s)
1365 {
1366         const arch_register_t *reg;
1367         const char            *reg_name;
1368         char                   c;
1369         char                   modifier = 0;
1370         int                    num      = -1;
1371         const ia32_attr_t     *attr;
1372         int                    n_outs;
1373         int                    p;
1374
1375         assert(*s == '%');
1376         c = *(++s);
1377
1378         /* parse modifiers */
1379         switch(c) {
1380         case 0:
1381                 ir_fprintf(stderr, "Warning: asm text (%+F) ends with %\n", node);
1382                 be_emit_char(env, '%');
1383                 return s + 1;
1384         case '%':
1385                 be_emit_char(env, '%');
1386                 return s + 1;
1387         case 'w':
1388         case 'b':
1389         case 'h':
1390                 modifier = c;
1391                 ++s;
1392                 break;
1393         case '0':
1394         case '1':
1395         case '2':
1396         case '3':
1397         case '4':
1398         case '5':
1399         case '6':
1400         case '7':
1401         case '8':
1402         case '9':
1403                 break;
1404         default:
1405                 ir_fprintf(stderr, "Warning: asm text (%+F) contains unknown modifier "
1406                            "'%c' for asm op\n", node, c);
1407                 ++s;
1408                 break;
1409         }
1410
1411         /* parse number */
1412         sscanf(s, "%d%n", &num, &p);
1413         if(num < 0) {
1414                 ir_fprintf(stderr, "Warning: Couldn't parse assembler operand (%+F)\n",
1415                            node);
1416                 return s;
1417         } else {
1418                 s += p;
1419         }
1420
1421         /* get register */
1422         attr   = get_ia32_attr_const(node);
1423         n_outs = ARR_LEN(attr->slots);
1424         if(num < n_outs) {
1425                 reg = get_out_reg(env, node, num);
1426         } else {
1427                 ir_node *pred;
1428                 int      in = num - n_outs;
1429                 if(in >= get_irn_arity(node)) {
1430                         ir_fprintf(stderr, "Warning: Invalid input %d specified in asm "
1431                                    "op (%+F)\n", num, node);
1432                         return s;
1433                 }
1434                 pred = get_irn_n(node, in);
1435                 /* might be an immediate value */
1436                 if(is_ia32_Immediate(pred)) {
1437                         emit_ia32_Immediate(env, pred);
1438                         return s;
1439                 }
1440                 reg = get_in_reg(env, node, in);
1441         }
1442         if(reg == NULL) {
1443                 ir_fprintf(stderr, "Warning: no register assigned for %d asm op "
1444                            "(%+F)\n", num, node);
1445                 return s;
1446         }
1447
1448         /* emit it */
1449         be_emit_char(env, '%');
1450         switch(modifier) {
1451         case 0:
1452                 reg_name = arch_register_get_name(reg);
1453                 break;
1454         case 'b':
1455                 reg_name = ia32_get_mapped_reg_name(env->isa->regs_8bit, reg);
1456                 break;
1457         case 'h':
1458                 reg_name = ia32_get_mapped_reg_name(env->isa->regs_8bit_high, reg);
1459                 break;
1460         case 'w':
1461                 reg_name = ia32_get_mapped_reg_name(env->isa->regs_16bit, reg);
1462                 break;
1463         default:
1464                 panic("Invalid asm op modifier");
1465         }
1466         be_emit_string(env, reg_name);
1467
1468         return s;
1469 }
1470
1471 /**
1472  * Emits code for an ASM pseudo op.
1473  */
1474 static
1475 void emit_ia32_Asm(ia32_emit_env_t *env, const ir_node *node)
1476 {
1477         const void            *gen_attr = get_irn_generic_attr_const(node);
1478         const ia32_asm_attr_t *attr
1479                 = CONST_CAST_IA32_ATTR(ia32_asm_attr_t, gen_attr);
1480         ident                 *asm_text = attr->asm_text;
1481         const char            *s        = get_id_str(asm_text);
1482
1483         be_emit_cstring(env, "# Begin ASM \t");
1484         be_emit_finish_line_gas(env, node);
1485
1486         if (s[0] != '\t')
1487                 be_emit_char(env, '\t');
1488
1489         while(*s != 0) {
1490                 if(*s == '%') {
1491                         s = emit_asm_operand(env, node, s);
1492                         continue;
1493                 } else {
1494                         be_emit_char(env, *s);
1495                 }
1496                 ++s;
1497         }
1498
1499         be_emit_char(env, '\n');
1500         be_emit_write_line(env);
1501
1502         be_emit_cstring(env, "# End ASM\n");
1503         be_emit_write_line(env);
1504 }
1505
1506 /**********************************
1507  *   _____                  ____
1508  *  / ____|                |  _ \
1509  * | |     ___  _ __  _   _| |_) |
1510  * | |    / _ \| '_ \| | | |  _ <
1511  * | |___| (_) | |_) | |_| | |_) |
1512  *  \_____\___/| .__/ \__, |____/
1513  *             | |     __/ |
1514  *             |_|    |___/
1515  **********************************/
1516
1517 /**
1518  * Emit movsb/w instructions to make mov count divideable by 4
1519  */
1520 static
1521 void emit_CopyB_prolog(ia32_emit_env_t *env, int rem) {
1522         be_emit_cstring(env, "\tcld");
1523         be_emit_finish_line_gas(env, NULL);
1524
1525         switch(rem) {
1526         case 1:
1527                 be_emit_cstring(env, "\tmovsb");
1528                 be_emit_finish_line_gas(env, NULL);
1529                 break;
1530         case 2:
1531                 be_emit_cstring(env, "\tmovsw");
1532                 be_emit_finish_line_gas(env, NULL);
1533                 break;
1534         case 3:
1535                 be_emit_cstring(env, "\tmovsb");
1536                 be_emit_finish_line_gas(env, NULL);
1537                 be_emit_cstring(env, "\tmovsw");
1538                 be_emit_finish_line_gas(env, NULL);
1539                 break;
1540         }
1541 }
1542
1543 /**
1544  * Emit rep movsd instruction for memcopy.
1545  */
1546 static
1547 void emit_ia32_CopyB(ia32_emit_env_t *env, const ir_node *node) {
1548         tarval *tv = get_ia32_Immop_tarval(node);
1549         int    rem = get_tarval_long(tv);
1550
1551         emit_CopyB_prolog(env, rem);
1552
1553         be_emit_cstring(env, "\trep movsd");
1554         be_emit_finish_line_gas(env, node);
1555 }
1556
1557 /**
1558  * Emits unrolled memcopy.
1559  */
1560 static
1561 void emit_ia32_CopyB_i(ia32_emit_env_t *env, const ir_node *node) {
1562         tarval *tv   = get_ia32_Immop_tarval(node);
1563         int     size = get_tarval_long(tv);
1564
1565         emit_CopyB_prolog(env, size & 0x3);
1566
1567         size >>= 2;
1568         while (size--) {
1569                 be_emit_cstring(env, "\tmovsd");
1570                 be_emit_finish_line_gas(env, NULL);
1571         }
1572 }
1573
1574
1575
1576 /***************************
1577  *   _____
1578  *  / ____|
1579  * | |     ___  _ ____   __
1580  * | |    / _ \| '_ \ \ / /
1581  * | |___| (_) | | | \ V /
1582  *  \_____\___/|_| |_|\_/
1583  *
1584  ***************************/
1585
1586 /**
1587  * Emit code for conversions (I, FP), (FP, I) and (FP, FP).
1588  */
1589 static
1590 void emit_ia32_Conv_with_FP(ia32_emit_env_t *env, const ir_node *node) {
1591         ir_mode            *ls_mode = get_ia32_ls_mode(node);
1592         int                 ls_bits = get_mode_size_bits(ls_mode);
1593
1594         be_emit_cstring(env, "\tcvt");
1595
1596         if(is_ia32_Conv_I2FP(node)) {
1597                 if(ls_bits == 32) {
1598                         be_emit_cstring(env, "si2ss");
1599                 } else {
1600                         be_emit_cstring(env, "si2sd");
1601                 }
1602         } else if(is_ia32_Conv_FP2I(node)) {
1603                 if(ls_bits == 32) {
1604                         be_emit_cstring(env, "ss2si");
1605                 } else {
1606                         be_emit_cstring(env, "sd2si");
1607                 }
1608         } else {
1609                 assert(is_ia32_Conv_FP2FP(node));
1610                 if(ls_bits == 32) {
1611                         be_emit_cstring(env, "sd2ss");
1612                 } else {
1613                         be_emit_cstring(env, "ss2sd");
1614                 }
1615         }
1616         be_emit_char(env, ' ');
1617
1618         switch(get_ia32_op_type(node)) {
1619                 case ia32_Normal:
1620                         ia32_emit_source_register(env, node, 2);
1621                         be_emit_cstring(env, ", ");
1622                         ia32_emit_dest_register(env, node, 0);
1623                         break;
1624                 case ia32_AddrModeS:
1625                         ia32_emit_dest_register(env, node, 0);
1626                         be_emit_cstring(env, ", ");
1627                         ia32_emit_am(env, node);
1628                         break;
1629                 default:
1630                         assert(0 && "unsupported op type for Conv");
1631         }
1632         be_emit_finish_line_gas(env, node);
1633 }
1634
1635 static
1636 void emit_ia32_Conv_I2FP(ia32_emit_env_t *env, const ir_node *node) {
1637         emit_ia32_Conv_with_FP(env, node);
1638 }
1639
1640 static
1641 void emit_ia32_Conv_FP2I(ia32_emit_env_t *env, const ir_node *node) {
1642         emit_ia32_Conv_with_FP(env, node);
1643 }
1644
1645 static
1646 void emit_ia32_Conv_FP2FP(ia32_emit_env_t *env, const ir_node *node) {
1647         emit_ia32_Conv_with_FP(env, node);
1648 }
1649
1650 /**
1651  * Emits code for an Int conversion.
1652  */
1653 static
1654 void emit_ia32_Conv_I2I(ia32_emit_env_t *env, const ir_node *node) {
1655         const char *sign_suffix;
1656         ir_mode *smaller_mode = get_ia32_ls_mode(node);
1657         int smaller_bits = get_mode_size_bits(smaller_mode);
1658         int signed_mode;
1659         const arch_register_t *in_reg, *out_reg;
1660
1661         assert(!mode_is_float(smaller_mode));
1662         assert(smaller_bits == 8 || smaller_bits == 16 || smaller_bits == 32);
1663
1664         signed_mode = mode_is_signed(smaller_mode);
1665         if(smaller_bits == 32) {
1666                 // this should not happen as it's no convert
1667                 assert(0);
1668                 sign_suffix = "";
1669         } else {
1670                 sign_suffix = signed_mode ? "s" : "z";
1671         }
1672
1673         switch(get_ia32_op_type(node)) {
1674                 case ia32_Normal:
1675                         in_reg  = get_in_reg(env, node, 2);
1676                         out_reg = get_out_reg(env, node, 0);
1677
1678                         if (REGS_ARE_EQUAL(in_reg, &ia32_gp_regs[REG_EAX]) &&
1679                                 REGS_ARE_EQUAL(out_reg, in_reg)                &&
1680                                 signed_mode &&
1681                                 smaller_bits == 16)
1682                         {
1683                                 /* argument and result are both in EAX and */
1684                                 /* signedness is ok: -> use the smaller cwtl opcode */
1685                                 be_emit_cstring(env, "\tcwtl");
1686                         } else {
1687                                 const char *sreg = ia32_get_reg_name_for_mode(env, smaller_mode, in_reg);
1688
1689                                 be_emit_cstring(env, "\tmov");
1690                                 be_emit_string(env, sign_suffix);
1691                                 ia32_emit_mode_suffix_mode(env, smaller_mode);
1692                                 be_emit_cstring(env, "l %");
1693                                 be_emit_string(env, sreg);
1694                                 be_emit_cstring(env, ", ");
1695                                 ia32_emit_dest_register(env, node, 0);
1696                         }
1697                         break;
1698                 case ia32_AddrModeS: {
1699                         be_emit_cstring(env, "\tmov");
1700                         be_emit_string(env, sign_suffix);
1701                         ia32_emit_mode_suffix_mode(env, smaller_mode);
1702                         be_emit_cstring(env, "l %");
1703                         ia32_emit_am(env, node);
1704                         be_emit_cstring(env, ", ");
1705                         ia32_emit_dest_register(env, node, 0);
1706                         break;
1707                 }
1708                 default:
1709                         assert(0 && "unsupported op type for Conv");
1710         }
1711         be_emit_finish_line_gas(env, node);
1712 }
1713
1714 /**
1715  * Emits code for an 8Bit Int conversion.
1716  */
1717 void emit_ia32_Conv_I2I8Bit(ia32_emit_env_t *env, const ir_node *node) {
1718         emit_ia32_Conv_I2I(env, node);
1719 }
1720
1721
1722 /*******************************************
1723  *  _                          _
1724  * | |                        | |
1725  * | |__   ___ _ __   ___   __| | ___  ___
1726  * | '_ \ / _ \ '_ \ / _ \ / _` |/ _ \/ __|
1727  * | |_) |  __/ | | | (_) | (_| |  __/\__ \
1728  * |_.__/ \___|_| |_|\___/ \__,_|\___||___/
1729  *
1730  *******************************************/
1731
1732 /**
1733  * Emits a backend call
1734  */
1735 static
1736 void emit_be_Call(ia32_emit_env_t *env, const ir_node *node) {
1737         ir_entity *ent = be_Call_get_entity(node);
1738
1739         be_emit_cstring(env, "\tcall ");
1740         if (ent) {
1741                 set_entity_backend_marked(ent, 1);
1742                 be_emit_string(env, get_entity_ld_name(ent));
1743         } else {
1744                 be_emit_char(env, '*');
1745                 ia32_emit_dest_register(env, get_irn_n(node, be_pos_Call_ptr), 0);
1746         }
1747         be_emit_finish_line_gas(env, node);
1748 }
1749
1750 /**
1751  * Emits code to increase stack pointer.
1752  */
1753 static
1754 void emit_be_IncSP(ia32_emit_env_t *env, const ir_node *node) {
1755         int offs = be_get_IncSP_offset(node);
1756
1757         if (offs == 0)
1758                 return;
1759
1760         if (offs > 0) {
1761                 be_emit_cstring(env, "\tsubl $");
1762                 be_emit_irprintf(env->emit, "%u, ", offs);
1763                 ia32_emit_source_register(env, node, 0);
1764         } else {
1765                 be_emit_cstring(env, "\taddl $");
1766                 be_emit_irprintf(env->emit, "%u, ", -offs);
1767                 ia32_emit_source_register(env, node, 0);
1768         }
1769         be_emit_finish_line_gas(env, node);
1770 }
1771
1772 /**
1773  * Emits code to set stack pointer.
1774  */
1775 static
1776 void emit_be_SetSP(ia32_emit_env_t *env, const ir_node *node) {
1777         be_emit_cstring(env, "\tmovl ");
1778         ia32_emit_source_register(env, node, 2);
1779         be_emit_cstring(env, ", ");
1780         ia32_emit_dest_register(env, node, 0);
1781         be_emit_finish_line_gas(env, node);
1782 }
1783
1784 /**
1785  * Emits code for Copy/CopyKeep.
1786  */
1787 static
1788 void Copy_emitter(ia32_emit_env_t *env, const ir_node *node, const ir_node *op)
1789 {
1790         const arch_env_t *aenv = env->arch_env;
1791         ir_mode *mode;
1792
1793         if (REGS_ARE_EQUAL(arch_get_irn_register(aenv, node), arch_get_irn_register(aenv, op)) ||
1794                 arch_register_type_is(arch_get_irn_register(aenv, op), virtual))
1795                 return;
1796
1797         mode = get_irn_mode(node);
1798         if (mode == mode_E) {
1799                 be_emit_cstring(env, "\tmovsd ");
1800                 ia32_emit_source_register(env, node, 0);
1801                 be_emit_cstring(env, ", ");
1802                 ia32_emit_dest_register(env, node, 0);
1803         } else {
1804                 be_emit_cstring(env, "\tmovl ");
1805                 ia32_emit_source_register(env, node, 0);
1806                 be_emit_cstring(env, ", ");
1807                 ia32_emit_dest_register(env, node, 0);
1808         }
1809         be_emit_finish_line_gas(env, node);
1810 }
1811
1812 static
1813 void emit_be_Copy(ia32_emit_env_t *env, const ir_node *node) {
1814         Copy_emitter(env, node, be_get_Copy_op(node));
1815 }
1816
1817 static
1818 void emit_be_CopyKeep(ia32_emit_env_t *env, const ir_node *node) {
1819         Copy_emitter(env, node, be_get_CopyKeep_op(node));
1820 }
1821
1822 /**
1823  * Emits code for exchange.
1824  */
1825 static
1826 void emit_be_Perm(ia32_emit_env_t *env, const ir_node *node) {
1827         const arch_register_t *in1, *in2;
1828         const arch_register_class_t *cls1, *cls2;
1829
1830         in1 = arch_get_irn_register(env->arch_env, get_irn_n(node, 0));
1831         in2 = arch_get_irn_register(env->arch_env, get_irn_n(node, 1));
1832
1833         cls1 = arch_register_get_class(in1);
1834         cls2 = arch_register_get_class(in2);
1835
1836         assert(cls1 == cls2 && "Register class mismatch at Perm");
1837
1838         if (cls1 == &ia32_reg_classes[CLASS_ia32_gp]) {
1839                 be_emit_cstring(env, "\txchg ");
1840                 ia32_emit_source_register(env, node, 1);
1841                 be_emit_cstring(env, ", ");
1842                 ia32_emit_source_register(env, node, 0);
1843                 be_emit_finish_line_gas(env, node);
1844         } else if (cls1 == &ia32_reg_classes[CLASS_ia32_xmm]) {
1845                 be_emit_cstring(env, "\txorpd ");
1846                 ia32_emit_source_register(env, node, 1);
1847                 be_emit_cstring(env, ", ");
1848                 ia32_emit_source_register(env, node, 0);
1849                 be_emit_finish_line_gas(env, NULL);
1850
1851                 be_emit_cstring(env, "\txorpd ");
1852                 ia32_emit_source_register(env, node, 0);
1853                 be_emit_cstring(env, ", ");
1854                 ia32_emit_source_register(env, node, 1);
1855                 be_emit_finish_line_gas(env, NULL);
1856
1857                 be_emit_cstring(env, "\txorpd ");
1858                 ia32_emit_source_register(env, node, 1);
1859                 be_emit_cstring(env, ", ");
1860                 ia32_emit_source_register(env, node, 0);
1861                 be_emit_finish_line_gas(env, node);
1862         } else if (cls1 == &ia32_reg_classes[CLASS_ia32_vfp]) {
1863                 /* is a NOP */
1864         } else if (cls1 == &ia32_reg_classes[CLASS_ia32_st]) {
1865                 /* is a NOP */
1866         }
1867 }
1868
1869 /**
1870  * Emits code for Constant loading.
1871  */
1872 static
1873 void emit_ia32_Const(ia32_emit_env_t *env, const ir_node *node) {
1874         ia32_immop_type_t imm_tp = get_ia32_immop_type(node);
1875
1876         if (imm_tp == ia32_ImmSymConst) {
1877                 be_emit_cstring(env, "\tmovl ");
1878                 ia32_emit_immediate(env, node);
1879                 be_emit_cstring(env, ", ");
1880                 ia32_emit_dest_register(env, node, 0);
1881         } else {
1882                 tarval *tv = get_ia32_Immop_tarval(node);
1883                 assert(get_irn_mode(node) == mode_Iu);
1884                 /* beware: in some rare cases mode is mode_b which has no tarval_null() */
1885                 if (tarval_is_null(tv)) {
1886                         if (env->isa->opt_arch == arch_pentium_4) {
1887                                 /* P4 prefers sub r, r, others xor r, r */
1888                                 be_emit_cstring(env, "\tsubl ");
1889                         } else {
1890                                 be_emit_cstring(env, "\txorl ");
1891                         }
1892                         ia32_emit_dest_register(env, node, 0);
1893                         be_emit_cstring(env, ", ");
1894                         ia32_emit_dest_register(env, node, 0);
1895                 } else {
1896                         be_emit_cstring(env, "\tmovl ");
1897                         ia32_emit_immediate(env, node);
1898                         be_emit_cstring(env, ", ");
1899                         ia32_emit_dest_register(env, node, 0);
1900                 }
1901         }
1902         be_emit_finish_line_gas(env, node);
1903 }
1904
1905 /**
1906  * Emits code to load the TLS base
1907  */
1908 static
1909 void emit_ia32_LdTls(ia32_emit_env_t *env, const ir_node *node) {
1910         be_emit_cstring(env, "\tmovl %gs:0, ");
1911         ia32_emit_dest_register(env, node, 0);
1912         be_emit_finish_line_gas(env, node);
1913 }
1914
1915 static
1916 void emit_be_Return(ia32_emit_env_t *env, const ir_node *node)
1917 {
1918         be_emit_cstring(env, "\tret");
1919         be_emit_finish_line_gas(env, node);
1920 }
1921
1922 static
1923 void emit_Nothing(ia32_emit_env_t *env, const ir_node *node)
1924 {
1925         (void) env;
1926         (void) node;
1927 }
1928
1929
1930 /***********************************************************************************
1931  *                  _          __                                             _
1932  *                 (_)        / _|                                           | |
1933  *  _ __ ___   __ _ _ _ __   | |_ _ __ __ _ _ __ ___   _____      _____  _ __| | __
1934  * | '_ ` _ \ / _` | | '_ \  |  _| '__/ _` | '_ ` _ \ / _ \ \ /\ / / _ \| '__| |/ /
1935  * | | | | | | (_| | | | | | | | | | | (_| | | | | | |  __/\ V  V / (_) | |  |   <
1936  * |_| |_| |_|\__,_|_|_| |_| |_| |_|  \__,_|_| |_| |_|\___| \_/\_/ \___/|_|  |_|\_\
1937  *
1938  ***********************************************************************************/
1939
1940 /**
1941  * Enters the emitter functions for handled nodes into the generic
1942  * pointer of an opcode.
1943  */
1944 static
1945 void ia32_register_emitters(void) {
1946
1947 #define IA32_EMIT2(a,b) op_ia32_##a->ops.generic = (op_func)emit_ia32_##b
1948 #define IA32_EMIT(a)    IA32_EMIT2(a,a)
1949 #define EMIT(a)         op_##a->ops.generic = (op_func)emit_##a
1950 #define IGN(a)                  op_##a->ops.generic = (op_func)emit_Nothing
1951 #define BE_EMIT(a)      op_be_##a->ops.generic = (op_func)emit_be_##a
1952 #define BE_IGN(a)               op_be_##a->ops.generic = (op_func)emit_Nothing
1953
1954         /* first clear the generic function pointer for all ops */
1955         clear_irp_opcodes_generic_func();
1956
1957         /* register all emitter functions defined in spec */
1958         ia32_register_spec_emitters();
1959
1960         /* other ia32 emitter functions */
1961         IA32_EMIT(Asm);
1962         IA32_EMIT(CondJmp);
1963         IA32_EMIT(TestJmp);
1964         IA32_EMIT(CJmp);
1965         IA32_EMIT(CJmpAM);
1966         IA32_EMIT(CmpCMov);
1967         IA32_EMIT(CmpSet);
1968         IA32_EMIT(SwitchJmp);
1969         IA32_EMIT(CopyB);
1970         IA32_EMIT(CopyB_i);
1971         IA32_EMIT(Conv_I2FP);
1972         IA32_EMIT(Conv_FP2I);
1973         IA32_EMIT(Conv_FP2FP);
1974         IA32_EMIT(Conv_I2I);
1975         IA32_EMIT(Conv_I2I8Bit);
1976         IA32_EMIT(Const);
1977         IA32_EMIT(LdTls);
1978         IA32_EMIT(xCmp);
1979         IA32_EMIT(xCmpSet);
1980         IA32_EMIT(xCmpCMov);
1981         IA32_EMIT(xCondJmp);
1982         IA32_EMIT2(fcomJmp, x87CondJmp);
1983         IA32_EMIT2(fcompJmp, x87CondJmp);
1984         IA32_EMIT2(fcomppJmp, x87CondJmp);
1985         IA32_EMIT2(fcomrJmp, x87CondJmp);
1986         IA32_EMIT2(fcomrpJmp, x87CondJmp);
1987         IA32_EMIT2(fcomrppJmp, x87CondJmp);
1988
1989         /* benode emitter */
1990         BE_EMIT(Call);
1991         BE_EMIT(IncSP);
1992         BE_EMIT(SetSP);
1993         BE_EMIT(Copy);
1994         BE_EMIT(CopyKeep);
1995         BE_EMIT(Perm);
1996         BE_EMIT(Return);
1997
1998         BE_IGN(RegParams);
1999         BE_IGN(Barrier);
2000         BE_IGN(Keep);
2001
2002         /* firm emitter */
2003         EMIT(Jmp);
2004         IGN(Proj);
2005         IGN(Phi);
2006         IGN(Start);
2007
2008 #undef BE_EMIT
2009 #undef EMIT
2010 #undef IGN
2011 #undef IA32_EMIT2
2012 #undef IA32_EMIT
2013 }
2014
2015 static const char *last_name = NULL;
2016 static unsigned last_line = -1;
2017 static unsigned num = -1;
2018
2019 /**
2020  * Emit the debug support for node node.
2021  */
2022 static
2023 void ia32_emit_dbg(ia32_emit_env_t *env, const ir_node *node) {
2024         dbg_info *db = get_irn_dbg_info(node);
2025         unsigned lineno;
2026         const char *fname = be_retrieve_dbg_info(db, &lineno);
2027
2028         if (! env->cg->birg->main_env->options->stabs_debug_support)
2029                 return;
2030
2031         if (fname) {
2032                 if (last_name != fname) {
2033                         last_line = -1;
2034                         be_dbg_include_begin(env->cg->birg->main_env->db_handle, fname);
2035                         last_name = fname;
2036                 }
2037                 if (last_line != lineno) {
2038                         char name[64];
2039
2040                         snprintf(name, sizeof(name), ".LM%u", ++num);
2041                         last_line = lineno;
2042                         be_dbg_line(env->cg->birg->main_env->db_handle, lineno, name);
2043                         be_emit_string(env, name);
2044                         be_emit_cstring(env, ":\n");
2045                         be_emit_write_line(env);
2046                 }
2047         }
2048 }
2049
2050 typedef void (*emit_func_ptr) (ia32_emit_env_t *, const ir_node *);
2051
2052 /**
2053  * Emits code for a node.
2054  */
2055 static
2056 void ia32_emit_node(ia32_emit_env_t *env, const ir_node *node) {
2057         ir_op *op = get_irn_op(node);
2058
2059         DBG((dbg, LEVEL_1, "emitting code for %+F\n", node));
2060
2061         if (op->ops.generic) {
2062                 emit_func_ptr func = (emit_func_ptr) op->ops.generic;
2063                 ia32_emit_dbg(env, node);
2064                 (*func) (env, node);
2065         } else {
2066                 emit_Nothing(env, node);
2067                 ir_fprintf(stderr, "Warning: No emit handler for node %+F (%+G)\n", node, node);
2068         }
2069 }
2070
2071 /**
2072  * Emits gas alignment directives
2073  */
2074 static
2075 void ia32_emit_alignment(ia32_emit_env_t *env, unsigned align, unsigned skip) {
2076         be_emit_cstring(env, "\t.p2align ");
2077         be_emit_irprintf(env->emit, "%u,,%u\n", align, skip);
2078         be_emit_write_line(env);
2079 }
2080
2081 /**
2082  * Emits gas alignment directives for Functions depended on cpu architecture.
2083  */
2084 static
2085 void ia32_emit_align_func(ia32_emit_env_t *env, cpu_support cpu) {
2086         unsigned align;
2087         unsigned maximum_skip;
2088
2089         switch (cpu) {
2090                 case arch_i386:
2091                         align = 2;
2092                         break;
2093                 case arch_i486:
2094                         align = 4;
2095                         break;
2096                 case arch_k6:
2097                         align = 5;
2098                         break;
2099                 default:
2100                         align = 4;
2101         }
2102         maximum_skip = (1 << align) - 1;
2103         ia32_emit_alignment(env, align, maximum_skip);
2104 }
2105
2106 /**
2107  * Emits gas alignment directives for Labels depended on cpu architecture.
2108  */
2109 static
2110 void ia32_emit_align_label(ia32_emit_env_t *env, cpu_support cpu) {
2111         unsigned align; unsigned maximum_skip;
2112
2113         switch (cpu) {
2114                 case arch_i386:
2115                         align = 2;
2116                         break;
2117                 case arch_i486:
2118                         align = 4;
2119                         break;
2120                 case arch_k6:
2121                         align = 5;
2122                         break;
2123                 default:
2124                         align = 4;
2125         }
2126         maximum_skip = (1 << align) - 1;
2127         ia32_emit_alignment(env, align, maximum_skip);
2128 }
2129
2130 /**
2131  * Test wether a block should be aligned.
2132  * For cpus in the P4/Athlon class it is usefull to align jump labels to
2133  * 16 bytes. However we should only do that if the alignment nops before the
2134  * label aren't executed more often than we have jumps to the label.
2135  */
2136 static
2137 int should_align_block(ia32_emit_env_t *env, ir_node *block, ir_node *prev) {
2138         static const double DELTA = .0001;
2139         ir_exec_freq *exec_freq = env->cg->birg->exec_freq;
2140         double        block_freq;
2141         double        prev_freq = 0;  /**< execfreq of the fallthrough block */
2142         double        jmp_freq  = 0;  /**< execfreq of all non-fallthrough blocks */
2143         cpu_support   cpu       = env->isa->opt_arch;
2144         int           i, n_cfgpreds;
2145
2146         if(exec_freq == NULL)
2147                 return 0;
2148         if(cpu == arch_i386 || cpu == arch_i486)
2149                 return 0;
2150
2151         block_freq = get_block_execfreq(exec_freq, block);
2152         if(block_freq < DELTA)
2153                 return 0;
2154
2155         n_cfgpreds = get_Block_n_cfgpreds(block);
2156         for(i = 0; i < n_cfgpreds; ++i) {
2157                 ir_node *pred      = get_Block_cfgpred_block(block, i);
2158                 double   pred_freq = get_block_execfreq(exec_freq, pred);
2159
2160                 if(pred == prev) {
2161                         prev_freq += pred_freq;
2162                 } else {
2163                         jmp_freq  += pred_freq;
2164                 }
2165         }
2166
2167         if(prev_freq < DELTA && !(jmp_freq < DELTA))
2168                 return 1;
2169
2170         jmp_freq /= prev_freq;
2171
2172         switch (cpu) {
2173                 case arch_athlon:
2174                 case arch_athlon_64:
2175                 case arch_k6:
2176                         return jmp_freq > 3;
2177                 default:
2178                         return jmp_freq > 2;
2179         }
2180 }
2181
2182 static
2183 void ia32_emit_block_header(ia32_emit_env_t *env, ir_node *block, ir_node *prev)
2184 {
2185         int           n_cfgpreds;
2186         int           need_label;
2187         int           i, arity;
2188         ir_exec_freq  *exec_freq = env->cg->birg->exec_freq;
2189
2190         need_label = 1;
2191         n_cfgpreds = get_Block_n_cfgpreds(block);
2192         if (n_cfgpreds == 0) {
2193                 need_label = 0;
2194         } else if (n_cfgpreds == 1) {
2195                 ir_node *pred       = get_Block_cfgpred(block, 0);
2196                 ir_node *pred_block = get_nodes_block(pred);
2197
2198                 /* we don't need labels for fallthrough blocks, however switch-jmps
2199                  * are no fallthroughs */
2200                 if(pred_block == prev &&
2201                                 !(is_Proj(pred) && is_ia32_SwitchJmp(get_Proj_pred(pred)))) {
2202                         need_label = 0;
2203                 } else {
2204                         need_label = 1;
2205                 }
2206         } else {
2207                 need_label = 1;
2208         }
2209
2210         if (should_align_block(env, block, prev)) {
2211                 assert(need_label);
2212                 ia32_emit_align_label(env, env->isa->opt_arch);
2213         }
2214
2215         if(need_label) {
2216                 ia32_emit_block_name(env, block);
2217                 be_emit_char(env, ':');
2218
2219                 be_emit_pad_comment(env);
2220                 be_emit_cstring(env, "   /* preds:");
2221
2222                 /* emit list of pred blocks in comment */
2223                 arity = get_irn_arity(block);
2224                 for (i = 0; i < arity; ++i) {
2225                         ir_node *predblock = get_Block_cfgpred_block(block, i);
2226                         be_emit_irprintf(env->emit, " %d", get_irn_node_nr(predblock));
2227                 }
2228         } else {
2229                 be_emit_cstring(env, "\t/* ");
2230                 ia32_emit_block_name(env, block);
2231                 be_emit_cstring(env, ": ");
2232         }
2233         if (exec_freq != NULL) {
2234                 be_emit_irprintf(env->emit, " freq: %f",
2235                                  get_block_execfreq(exec_freq, block));
2236         }
2237         be_emit_cstring(env, " */\n");
2238         be_emit_write_line(env);
2239 }
2240
2241 /**
2242  * Walks over the nodes in a block connected by scheduling edges
2243  * and emits code for each node.
2244  */
2245 static
2246 void ia32_gen_block(ia32_emit_env_t *env, ir_node *block, ir_node *last_block)
2247 {
2248         const ir_node *node;
2249
2250         ia32_emit_block_header(env, block, last_block);
2251
2252         /* emit the contents of the block */
2253         ia32_emit_dbg(env, block);
2254         sched_foreach(block, node) {
2255                 ia32_emit_node(env, node);
2256         }
2257 }
2258
2259 /**
2260  * Emits code for function start.
2261  */
2262 static
2263 void ia32_emit_func_prolog(ia32_emit_env_t *env, ir_graph *irg) {
2264         ir_entity  *irg_ent  = get_irg_entity(irg);
2265         const char *irg_name = get_entity_ld_name(irg_ent);
2266         cpu_support cpu      = env->isa->opt_arch;
2267         const be_irg_t *birg = env->cg->birg;
2268
2269         be_emit_write_line(env);
2270         be_gas_emit_switch_section(env->emit, GAS_SECTION_TEXT);
2271         be_dbg_method_begin(birg->main_env->db_handle, irg_ent, be_abi_get_stack_layout(birg->abi));
2272         ia32_emit_align_func(env, cpu);
2273         if (get_entity_visibility(irg_ent) == visibility_external_visible) {
2274                 be_emit_cstring(env, ".global ");
2275                 be_emit_string(env, irg_name);
2276                 be_emit_char(env, '\n');
2277                 be_emit_write_line(env);
2278         }
2279         ia32_emit_function_object(env, irg_name);
2280         be_emit_string(env, irg_name);
2281         be_emit_cstring(env, ":\n");
2282         be_emit_write_line(env);
2283 }
2284
2285 /**
2286  * Emits code for function end
2287  */
2288 static
2289 void ia32_emit_func_epilog(ia32_emit_env_t *env, ir_graph *irg) {
2290         const char *irg_name = get_entity_ld_name(get_irg_entity(irg));
2291         const be_irg_t *birg = env->cg->birg;
2292
2293         ia32_emit_function_size(env, irg_name);
2294         be_dbg_method_end(birg->main_env->db_handle);
2295         be_emit_char(env, '\n');
2296         be_emit_write_line(env);
2297 }
2298
2299 /**
2300  * Block-walker:
2301  * Sets labels for control flow nodes (jump target)
2302  */
2303 static
2304 void ia32_gen_labels(ir_node *block, void *data)
2305 {
2306         ir_node *pred;
2307         int n = get_Block_n_cfgpreds(block);
2308         (void) data;
2309
2310         for (n--; n >= 0; n--) {
2311                 pred = get_Block_cfgpred(block, n);
2312                 set_irn_link(pred, block);
2313         }
2314 }
2315
2316 /**
2317  * Emit an exception label if the current instruction can fail.
2318  */
2319 void ia32_emit_exc_label(ia32_emit_env_t *env, const ir_node *node) {
2320         if (get_ia32_exc_label(node)) {
2321                 be_emit_irprintf(env->emit, ".EXL%u\n", 0);
2322                 be_emit_write_line(env);
2323         }
2324 }
2325
2326 /**
2327  * Main driver. Emits the code for one routine.
2328  */
2329 void ia32_gen_routine(ia32_code_gen_t *cg, ir_graph *irg) {
2330         ia32_emit_env_t env;
2331         ir_node *block;
2332         ir_node *last_block = NULL;
2333         int i, n;
2334
2335         env.isa      = (ia32_isa_t *)cg->arch_env->isa;
2336         env.emit     = &env.isa->emit;
2337         env.arch_env = cg->arch_env;
2338         env.cg       = cg;
2339
2340         ia32_register_emitters();
2341
2342         ia32_emit_func_prolog(&env, irg);
2343         irg_block_walk_graph(irg, ia32_gen_labels, NULL, &env);
2344
2345         n = ARR_LEN(cg->blk_sched);
2346         for (i = 0; i < n;) {
2347                 ir_node *next_bl;
2348
2349                 block   = cg->blk_sched[i];
2350                 ++i;
2351                 next_bl = i < n ? cg->blk_sched[i] : NULL;
2352
2353                 /* set here the link. the emitter expects to find the next block here */
2354                 set_irn_link(block, next_bl);
2355                 ia32_gen_block(&env, block, last_block);
2356                 last_block = block;
2357         }
2358
2359         ia32_emit_func_epilog(&env, irg);
2360 }
2361
2362 void ia32_init_emitter(void)
2363 {
2364         FIRM_DBG_REGISTER(dbg, "firm.be.ia32.emitter");
2365 }