cbtw does NOT upcast 8 to 32 bits
[libfirm] / ir / be / ia32 / ia32_emitter.c
1 /*
2  * Copyright (C) 1995-2007 University of Karlsruhe.  All right reserved.
3  *
4  * This file is part of libFirm.
5  *
6  * This file may be distributed and/or modified under the terms of the
7  * GNU General Public License version 2 as published by the Free Software
8  * Foundation and appearing in the file LICENSE.GPL included in the
9  * packaging of this file.
10  *
11  * Licensees holding valid libFirm Professional Edition licenses may use
12  * this file in accordance with the libFirm Commercial License.
13  * Agreement provided with the Software.
14  *
15  * This file is provided AS IS with NO WARRANTY OF ANY KIND, INCLUDING THE
16  * WARRANTY OF DESIGN, MERCHANTABILITY AND FITNESS FOR A PARTICULAR
17  * PURPOSE.
18  */
19
20 /**
21  * @file
22  * @brief       This file implements the ia32 node emitter.
23  * @author      Christian Wuerdig, Matthias Braun
24  * @version     $Id$
25  */
26 #ifdef HAVE_CONFIG_H
27 #include "config.h"
28 #endif
29
30 #include <limits.h>
31
32 #include "xmalloc.h"
33 #include "tv.h"
34 #include "iredges.h"
35 #include "debug.h"
36 #include "irgwalk.h"
37 #include "irprintf.h"
38 #include "irop_t.h"
39 #include "irargs_t.h"
40 #include "irprog_t.h"
41 #include "iredges_t.h"
42 #include "execfreq.h"
43 #include "error.h"
44 #include "raw_bitset.h"
45
46 #include "../besched_t.h"
47 #include "../benode_t.h"
48 #include "../beabi.h"
49 #include "../be_dbgout.h"
50 #include "../beemitter.h"
51 #include "../begnuas.h"
52 #include "../beirg_t.h"
53
54 #include "ia32_emitter.h"
55 #include "gen_ia32_emitter.h"
56 #include "gen_ia32_regalloc_if.h"
57 #include "ia32_nodes_attr.h"
58 #include "ia32_new_nodes.h"
59 #include "ia32_map_regs.h"
60 #include "bearch_ia32_t.h"
61
62 DEBUG_ONLY(static firm_dbg_module_t *dbg = NULL;)
63
64 #define BLOCK_PREFIX ".L"
65
66 #define SNPRINTF_BUF_LEN 128
67
68 /**
69  * Returns the register at in position pos.
70  */
71 static
72 const arch_register_t *get_in_reg(ia32_emit_env_t *env, const ir_node *irn,
73                                   int pos)
74 {
75         const arch_env_t       *arch_env = env->arch_env;
76         ir_node                *op;
77         const arch_register_t  *reg = NULL;
78
79         assert(get_irn_arity(irn) > pos && "Invalid IN position");
80
81         /* The out register of the operator at position pos is the
82            in register we need. */
83         op = get_irn_n(irn, pos);
84
85         reg = arch_get_irn_register(arch_env, op);
86
87         assert(reg && "no in register found");
88
89         /* in case of a joker register: just return a valid register */
90         if (arch_register_type_is(reg, joker)) {
91                 const arch_register_req_t *req;
92
93                 /* ask for the requirements */
94                 req = arch_get_register_req(arch_env, irn, pos);
95
96                 if (arch_register_req_is(req, limited)) {
97                         /* in case of limited requirements: get the first allowed register */
98                         unsigned idx = rbitset_next(req->limited, 0, 1);
99                         reg = arch_register_for_index(req->cls, idx);
100                 } else {
101                         /* otherwise get first register in class */
102                         reg = arch_register_for_index(req->cls, 0);
103                 }
104         }
105
106         return reg;
107 }
108
109 /**
110  * Returns the register at out position pos.
111  */
112 static
113 const arch_register_t *get_out_reg(ia32_emit_env_t *env, const ir_node *irn,
114                                    int pos)
115 {
116         const arch_env_t      *arch_env = env->arch_env;
117         ir_node               *proj;
118         const arch_register_t *reg = NULL;
119
120         /* 1st case: irn is not of mode_T, so it has only                 */
121         /*           one OUT register -> good                             */
122         /* 2nd case: irn is of mode_T -> collect all Projs and ask the    */
123         /*           Proj with the corresponding projnum for the register */
124
125         if (get_irn_mode(irn) != mode_T) {
126                 reg = arch_get_irn_register(arch_env, irn);
127         } else if (is_ia32_irn(irn)) {
128                 reg = get_ia32_out_reg(irn, pos);
129         } else {
130                 const ir_edge_t *edge;
131
132                 foreach_out_edge(irn, edge) {
133                         proj = get_edge_src_irn(edge);
134                         assert(is_Proj(proj) && "non-Proj from mode_T node");
135                         if (get_Proj_proj(proj) == pos) {
136                                 reg = arch_get_irn_register(arch_env, proj);
137                                 break;
138                         }
139                 }
140         }
141
142         assert(reg && "no out register found");
143         return reg;
144 }
145
146 /**
147  * Determine the gnu assembler suffix that indicates a mode
148  */
149 static
150 char get_mode_suffix(const ir_mode *mode) {
151         if(mode_is_float(mode)) {
152                 switch(get_mode_size_bits(mode)) {
153                 case 32:
154                         return 's';
155                 case 64:
156                         return 'l';
157                 case 80:
158                         return 't';
159                 }
160         } else {
161                 assert(mode_is_int(mode) || mode_is_reference(mode) || mode_is_character(mode));
162                 switch(get_mode_size_bits(mode)) {
163                 case 64:
164                         return 'q';
165                 case 32:
166                         return 'l';
167                 case 16:
168                         return 'w';
169                 case 8:
170                         return 'b';
171                 }
172         }
173         panic("Can't output mode_suffix for %+F\n", mode);
174 }
175
176 static
177 int produces_result(const ir_node *node) {
178         return !(is_ia32_St(node) ||
179                 is_ia32_CondJmp(node) ||
180                 is_ia32_xCondJmp(node) ||
181                 is_ia32_CmpSet(node) ||
182                 is_ia32_xCmpSet(node) ||
183                 is_ia32_SwitchJmp(node));
184 }
185
186 static
187 const char *ia32_get_reg_name_for_mode(ia32_emit_env_t *env, ir_mode *mode,
188                                        const arch_register_t *reg) {
189         switch(get_mode_size_bits(mode)) {
190                 case 8:
191                         return ia32_get_mapped_reg_name(env->isa->regs_8bit, reg);
192                 case 16:
193                         return ia32_get_mapped_reg_name(env->isa->regs_16bit, reg);
194                 default:
195                         return (char *)arch_register_get_name(reg);
196         }
197 }
198
199 /**
200  * Add a number to a prefix. This number will not be used a second time.
201  */
202 static
203 char *get_unique_label(char *buf, size_t buflen, const char *prefix) {
204         static unsigned long id = 0;
205         snprintf(buf, buflen, "%s%lu", prefix, ++id);
206         return buf;
207 }
208
209 /*************************************************************
210  *             _       _    __   _          _
211  *            (_)     | |  / _| | |        | |
212  *  _ __  _ __ _ _ __ | |_| |_  | |__   ___| |_ __   ___ _ __
213  * | '_ \| '__| | '_ \| __|  _| | '_ \ / _ \ | '_ \ / _ \ '__|
214  * | |_) | |  | | | | | |_| |   | | | |  __/ | |_) |  __/ |
215  * | .__/|_|  |_|_| |_|\__|_|   |_| |_|\___|_| .__/ \___|_|
216  * | |                                       | |
217  * |_|                                       |_|
218  *************************************************************/
219
220 // we have no C++ and can't define an implicit ia32_emit_env_t* cast to
221 // be_emit_env_t* so we cheat a bit...
222 #define be_emit_char(env,c)             be_emit_char(env->emit,c)
223 #define be_emit_string(env,s)           be_emit_string(env->emit,s)
224 #undef be_emit_cstring
225 #define be_emit_cstring(env,x)          { be_emit_string_len(env->emit, x, sizeof(x)-1); }
226 #define be_emit_ident(env,i)            be_emit_ident(env->emit,i)
227 #define be_emit_tarval(env,tv)          be_emit_tarval(env->emit,tv)
228 #define be_emit_write_line(env)         be_emit_write_line(env->emit)
229 #define be_emit_finish_line_gas(env,n)  be_emit_finish_line_gas(env->emit,n)
230 #define be_emit_pad_comment(env)        be_emit_pad_comment(env->emit)
231
232 void ia32_emit_source_register(ia32_emit_env_t *env, const ir_node *node, int pos)
233 {
234         const arch_register_t *reg = get_in_reg(env, node, pos);
235         const char *reg_name = arch_register_get_name(reg);
236
237         assert(pos < get_irn_arity(node));
238
239         be_emit_char(env, '%');
240         be_emit_string(env, reg_name);
241 }
242
243 void ia32_emit_dest_register(ia32_emit_env_t *env, const ir_node *node, int pos) {
244         const arch_register_t *reg = get_out_reg(env, node, pos);
245         const char *reg_name = arch_register_get_name(reg);
246
247         be_emit_char(env, '%');
248         be_emit_string(env, reg_name);
249 }
250
251 void ia32_emit_x87_name(ia32_emit_env_t *env, const ir_node *node, int pos)
252 {
253         const ia32_x87_attr_t *attr = get_ia32_x87_attr_const(node);
254
255         assert(pos < 3);
256         be_emit_char(env, '%');
257         be_emit_string(env, attr->x87[pos]->name);
258 }
259
260 void ia32_emit_immediate(ia32_emit_env_t *env, const ir_node *node)
261 {
262         tarval *tv;
263         ir_entity *ent;
264         ident *id;
265
266         be_emit_char(env, '$');
267
268         switch(get_ia32_immop_type(node)) {
269         case ia32_ImmConst:
270                 tv = get_ia32_Immop_tarval(node);
271                 be_emit_tarval(env, tv);
272                 return;
273         case ia32_ImmSymConst:
274                 ent = get_ia32_Immop_symconst(node);
275                 mark_entity_visited(ent);
276                 id = get_entity_ld_ident(ent);
277                 be_emit_ident(env, id);
278                 return;
279         case ia32_ImmNone:
280                 break;
281         }
282
283         assert(0);
284         be_emit_string(env, "BAD");
285         return;
286 }
287
288 static
289 void ia32_emit_mode_suffix_mode(ia32_emit_env_t *env, const ir_mode *mode)
290 {
291         be_emit_char(env, get_mode_suffix(mode));
292 }
293
294 void ia32_emit_mode_suffix(ia32_emit_env_t *env, const ir_node *node)
295 {
296         ir_mode *mode = get_ia32_ls_mode(node);
297         if(mode == NULL)
298                 mode = mode_Iu;
299
300         ia32_emit_mode_suffix_mode(env, mode);
301 }
302
303 void ia32_emit_x87_mode_suffix(ia32_emit_env_t *env, const ir_node *node)
304 {
305         ir_mode *mode = get_ia32_ls_mode(node);
306         if(mode != NULL)
307                 ia32_emit_mode_suffix_mode(env, mode);
308 }
309
310 static
311 char get_xmm_mode_suffix(ir_mode *mode)
312 {
313         assert(mode_is_float(mode));
314         switch(get_mode_size_bits(mode)) {
315         case 32:
316                 return 's';
317         case 64:
318                 return 'd';
319         default:
320                 assert(0);
321         }
322         return '%';
323 }
324
325 void ia32_emit_xmm_mode_suffix(ia32_emit_env_t *env, const ir_node *node)
326 {
327         ir_mode *mode = get_ia32_ls_mode(node);
328         assert(mode != NULL);
329         be_emit_char(env, 's');
330         be_emit_char(env, get_xmm_mode_suffix(mode));
331 }
332
333 void ia32_emit_xmm_mode_suffix_s(ia32_emit_env_t *env, const ir_node *node)
334 {
335         ir_mode *mode = get_ia32_ls_mode(node);
336         assert(mode != NULL);
337         be_emit_char(env, get_xmm_mode_suffix(mode));
338 }
339
340 void ia32_emit_extend_suffix(ia32_emit_env_t *env, const ir_mode *mode)
341 {
342         if(get_mode_size_bits(mode) == 32)
343                 return;
344         if(mode_is_signed(mode)) {
345                 be_emit_char(env, 's');
346         } else {
347                 be_emit_char(env, 'z');
348         }
349 }
350
351 static
352 void ia32_emit_function_object(ia32_emit_env_t *env, const char *name)
353 {
354         switch (be_gas_flavour) {
355         case GAS_FLAVOUR_NORMAL:
356                 be_emit_cstring(env, "\t.type\t");
357                 be_emit_string(env, name);
358                 be_emit_cstring(env, ", @function\n");
359                 be_emit_write_line(env);
360                 break;
361         case GAS_FLAVOUR_MINGW:
362                 be_emit_cstring(env, "\t.def\t");
363                 be_emit_string(env, name);
364                 be_emit_cstring(env, ";\t.scl\t2;\t.type\t32;\t.endef\n");
365                 be_emit_write_line(env);
366                 break;
367         default:
368                 break;
369         }
370 }
371
372 static
373 void ia32_emit_function_size(ia32_emit_env_t *env, const char *name)
374 {
375         switch (be_gas_flavour) {
376         case GAS_FLAVOUR_NORMAL:
377                 be_emit_cstring(env, "\t.size\t");
378                 be_emit_string(env, name);
379                 be_emit_cstring(env, ", .-");
380                 be_emit_string(env, name);
381                 be_emit_char(env, '\n');
382                 be_emit_write_line(env);
383                 break;
384         default:
385                 break;
386         }
387 }
388
389
390
391 /**
392  * Emits registers and/or address mode of a binary operation.
393  */
394 void ia32_emit_binop(ia32_emit_env_t *env, const ir_node *node) {
395         switch(get_ia32_op_type(node)) {
396                 case ia32_Normal:
397                         if (is_ia32_ImmConst(node) || is_ia32_ImmSymConst(node)) {
398                                 ia32_emit_immediate(env, node);
399                                 be_emit_cstring(env, ", ");
400                                 ia32_emit_source_register(env, node, 2);
401                         } else {
402                                 const arch_register_t *in1 = get_in_reg(env, node, 2);
403                                 const arch_register_t *in2 = get_in_reg(env, node, 3);
404                                 const arch_register_t *out = produces_result(node) ? get_out_reg(env, node, 0) : NULL;
405                                 const arch_register_t *in;
406                                 const char            *in_name;
407
408                                 in      = out ? (REGS_ARE_EQUAL(out, in2) ? in1 : in2) : in2;
409                                 out     = out ? out : in1;
410                                 in_name = arch_register_get_name(in);
411
412                                 if (is_ia32_emit_cl(node)) {
413                                         assert(REGS_ARE_EQUAL(&ia32_gp_regs[REG_ECX], in) && "shift operation needs ecx");
414                                         in_name = "cl";
415                                 }
416
417                                 be_emit_char(env, '%');
418                                 be_emit_string(env, in_name);
419                                 be_emit_cstring(env, ", %");
420                                 be_emit_string(env, arch_register_get_name(out));
421                         }
422                         break;
423                 case ia32_AddrModeS:
424                         ia32_emit_am(env, node);
425                         be_emit_cstring(env, ", ");
426                         if (is_ia32_ImmConst(node) || is_ia32_ImmSymConst(node)) {
427                                 assert(!produces_result(node) && "Source AM with Const must not produce result");
428                                 ia32_emit_immediate(env, node);
429                         } else if (produces_result(node)) {
430                                 ia32_emit_dest_register(env, node, 0);
431                         } else {
432                                 ia32_emit_source_register(env, node, 2);
433                         }
434                         break;
435                 case ia32_AddrModeD:
436                         if (is_ia32_ImmConst(node) || is_ia32_ImmSymConst(node)) {
437                                 ia32_emit_immediate(env, node);
438                                 be_emit_cstring(env, ", ");
439                                 ia32_emit_am(env, node);
440                         } else {
441                                 const arch_register_t *in1 = get_in_reg(env, node,
442                                                                         get_irn_arity(node) == 5 ? 3 : 2);
443                                 ir_mode               *mode = get_ia32_ls_mode(node);
444                                 const char            *in_name;
445
446                                 in_name = ia32_get_reg_name_for_mode(env, mode, in1);
447
448                                 if (is_ia32_emit_cl(node)) {
449                                         assert(REGS_ARE_EQUAL(&ia32_gp_regs[REG_ECX], in1) && "shift operation needs ecx");
450                                         in_name = "cl";
451                                 }
452
453                                 be_emit_char(env, '%');
454                                 be_emit_string(env, in_name);
455                                 be_emit_cstring(env, ", ");
456                                 ia32_emit_am(env, node);
457                         }
458                         break;
459                 default:
460                         assert(0 && "unsupported op type");
461         }
462 }
463
464 /**
465  * Emits registers and/or address mode of a binary operation.
466  */
467 void ia32_emit_x87_binop(ia32_emit_env_t *env, const ir_node *node) {
468         switch(get_ia32_op_type(node)) {
469                 case ia32_Normal:
470                         if (is_ia32_ImmConst(node) || is_ia32_ImmSymConst(node)) {
471                                 // should not happen...
472                                 assert(0);
473                         } else {
474                                 const ia32_x87_attr_t *x87_attr = get_ia32_x87_attr_const(node);
475                                 const arch_register_t *in1      = x87_attr->x87[0];
476                                 const arch_register_t *in2      = x87_attr->x87[1];
477                                 const arch_register_t *out      = x87_attr->x87[2];
478                                 const arch_register_t *in;
479
480                                 in  = out ? (REGS_ARE_EQUAL(out, in2) ? in1 : in2) : in2;
481                                 out = out ? out : in1;
482
483                                 be_emit_char(env, '%');
484                                 be_emit_string(env, arch_register_get_name(in));
485                                 be_emit_cstring(env, ", %");
486                                 be_emit_string(env, arch_register_get_name(out));
487                         }
488                         break;
489                 case ia32_AddrModeS:
490                 case ia32_AddrModeD:
491                         ia32_emit_am(env, node);
492                         break;
493                 default:
494                         assert(0 && "unsupported op type");
495         }
496 }
497
498 /**
499  * Emits registers and/or address mode of a unary operation.
500  */
501 void ia32_emit_unop(ia32_emit_env_t *env, const ir_node *node) {
502         switch(get_ia32_op_type(node)) {
503                 case ia32_Normal:
504                         if (is_ia32_ImmConst(node) || is_ia32_ImmSymConst(node)) {
505                                 ia32_emit_immediate(env, node);
506                         } else {
507                                 if (is_ia32_Mul(node) || is_ia32_IMul1OP(node)) {
508                                         ia32_emit_source_register(env, node, 3);
509                                 } else if(is_ia32_IDiv(node) || is_ia32_Div(node)) {
510                                         ia32_emit_source_register(env, node, 4);
511                                 } else if(is_ia32_Push(node)) {
512                                         ia32_emit_source_register(env, node, 2);
513                                 } else if(is_ia32_Pop(node)) {
514                                         ia32_emit_dest_register(env, node, 1);
515                                 } else {
516                                         ia32_emit_dest_register(env, node, 0);
517                                 }
518                         }
519                         break;
520                 case ia32_AddrModeS:
521                 case ia32_AddrModeD:
522                         ia32_emit_am(env, node);
523                         break;
524                 default:
525                         assert(0 && "unsupported op type");
526         }
527 }
528
529 /**
530  * Emits address mode.
531  */
532 void ia32_emit_am(ia32_emit_env_t *env, const ir_node *node) {
533         ir_entity *ent       = get_ia32_am_sc(node);
534         int        offs      = get_ia32_am_offs_int(node);
535         ir_node   *base      = get_irn_n(node, 0);
536         int        has_base  = !is_ia32_NoReg_GP(base);
537         ir_node   *index     = get_irn_n(node, 1);
538         int        has_index = !is_ia32_NoReg_GP(index);
539
540         /* just to be sure... */
541         assert(!is_ia32_use_frame(node) || get_ia32_frame_ent(node) != NULL);
542
543         /* emit offset */
544         if (ent != NULL) {
545                 ident *id;
546
547                 mark_entity_visited(ent);
548                 id = get_entity_ld_ident(ent);
549                 if (is_ia32_am_sc_sign(node))
550                         be_emit_char(env, '-');
551                 be_emit_ident(env, id);
552
553                 if(get_entity_owner(ent) == get_tls_type()) {
554                         if (get_entity_visibility(ent) == visibility_external_allocated) {
555                                 be_emit_cstring(env, "@INDNTPOFF");
556                         } else {
557                                 be_emit_cstring(env, "@NTPOFF");
558                         }
559                 }
560         }
561
562         if(offs != 0) {
563                 if(ent != NULL) {
564                         be_emit_irprintf(env->emit, "%+d", offs);
565                 } else {
566                         be_emit_irprintf(env->emit, "%d", offs);
567                 }
568         }
569
570         if (has_base || has_index) {
571                 be_emit_char(env, '(');
572
573                 /* emit base */
574                 if (has_base) {
575                         ia32_emit_source_register(env, node, 0);
576                 }
577
578                 /* emit index + scale */
579                 if (has_index) {
580                         int scale;
581                         be_emit_char(env, ',');
582                         ia32_emit_source_register(env, node, 1);
583
584                         scale = get_ia32_am_scale(node);
585                         if (scale > 0) {
586                                 be_emit_irprintf(env->emit, ",%d", 1 << get_ia32_am_scale(node));
587                         }
588                 }
589                 be_emit_char(env, ')');
590         }
591 }
592
593 /*************************************************
594  *                 _ _                         _
595  *                (_) |                       | |
596  *   ___ _ __ ___  _| |_    ___ ___  _ __   __| |
597  *  / _ \ '_ ` _ \| | __|  / __/ _ \| '_ \ / _` |
598  * |  __/ | | | | | | |_  | (_| (_) | | | | (_| |
599  *  \___|_| |_| |_|_|\__|  \___\___/|_| |_|\__,_|
600  *
601  *************************************************/
602
603 #undef IA32_DO_EMIT
604 #define IA32_DO_EMIT(irn) ia32_fprintf_format(F, irn, cmd_buf, cmnt_buf)
605
606 /*
607  * coding of conditions
608  */
609 struct cmp2conditon_t {
610         const char *name;
611         pn_Cmp      num;
612 };
613
614 /*
615  * positive conditions for signed compares
616  */
617 static
618 const struct cmp2conditon_t cmp2condition_s[] = {
619         { NULL,              pn_Cmp_False },  /* always false */
620         { "e",               pn_Cmp_Eq },     /* == */
621         { "l",               pn_Cmp_Lt },     /* < */
622         { "le",              pn_Cmp_Le },     /* <= */
623         { "g",               pn_Cmp_Gt },     /* > */
624         { "ge",              pn_Cmp_Ge },     /* >= */
625         { "ne",              pn_Cmp_Lg },     /* != */
626         { NULL,              pn_Cmp_Leg},     /* Floating point: ordered */
627         { NULL,              pn_Cmp_Uo },     /* Floating point: unordered */
628         { "e",               pn_Cmp_Ue },     /* Floating point: unordered or == */
629         { "b",               pn_Cmp_Ul },     /* Floating point: unordered or < */
630         { "be",              pn_Cmp_Ule },    /* Floating point: unordered or <= */
631         { "a",               pn_Cmp_Ug },     /* Floating point: unordered or > */
632         { "ae",              pn_Cmp_Uge },    /* Floating point: unordered or >= */
633         { "ne",              pn_Cmp_Ne },     /* Floating point: unordered or != */
634         { NULL,              pn_Cmp_True },   /* always true */
635 };
636
637 /*
638  * positive conditions for unsigned compares
639  */
640 static
641 const struct cmp2conditon_t cmp2condition_u[] = {
642         { NULL,              pn_Cmp_False },  /* always false */
643         { "e",               pn_Cmp_Eq },     /* == */
644         { "b",               pn_Cmp_Lt },     /* < */
645         { "be",              pn_Cmp_Le },     /* <= */
646         { "a",               pn_Cmp_Gt },     /* > */
647         { "ae",              pn_Cmp_Ge },     /* >= */
648         { "ne",              pn_Cmp_Lg },     /* != */
649         { NULL,              pn_Cmp_True },   /* always true */
650 };
651
652 /*
653  * returns the condition code
654  */
655 static
656 const char *get_cmp_suffix(int cmp_code)
657 {
658         assert( (cmp2condition_s[cmp_code & 15].num) == (cmp_code & 15));
659         assert( (cmp2condition_u[cmp_code & 7].num) == (cmp_code & 7));
660
661         if((cmp_code & ia32_pn_Cmp_Unsigned)) {
662                 return cmp2condition_u[cmp_code & 7].name;
663         } else {
664                 return cmp2condition_s[cmp_code & 15].name;
665         }
666 }
667
668 void ia32_emit_cmp_suffix(ia32_emit_env_t *env, long pnc)
669 {
670         be_emit_string(env, get_cmp_suffix(pnc));
671 }
672
673
674 /**
675  * Returns the target block for a control flow node.
676  */
677 static
678 ir_node *get_cfop_target_block(const ir_node *irn) {
679         return get_irn_link(irn);
680 }
681
682 static
683 void ia32_emit_block_name(ia32_emit_env_t *env, const ir_node *block)
684 {
685         be_emit_cstring(env, BLOCK_PREFIX);
686         be_emit_irprintf(env->emit, "%d", get_irn_node_nr(block));
687 }
688
689 /**
690  * Returns the target label for a control flow node.
691  */
692 static
693 void ia32_emit_cfop_target(ia32_emit_env_t * env, const ir_node *node) {
694         ir_node *block = get_cfop_target_block(node);
695
696         ia32_emit_block_name(env, block);
697 }
698
699 /** Return the next block in Block schedule */
700 static ir_node *next_blk_sched(const ir_node *block) {
701         return get_irn_link(block);
702 }
703
704 /**
705  * Returns the Proj with projection number proj and NOT mode_M
706  */
707 static
708 ir_node *get_proj(const ir_node *node, long proj) {
709         const ir_edge_t *edge;
710         ir_node         *src;
711
712         assert(get_irn_mode(node) == mode_T && "expected mode_T node");
713
714         foreach_out_edge(node, edge) {
715                 src = get_edge_src_irn(edge);
716
717                 assert(is_Proj(src) && "Proj expected");
718                 if (get_irn_mode(src) == mode_M)
719                         continue;
720
721                 if (get_Proj_proj(src) == proj)
722                         return src;
723         }
724         return NULL;
725 }
726
727 /**
728  * Emits the jump sequence for a conditional jump (cmp + jmp_true + jmp_false)
729  */
730 static
731 void finish_CondJmp(ia32_emit_env_t *env, const ir_node *node, ir_mode *mode,
732                     long pnc) {
733         const ir_node *proj_true;
734         const ir_node *proj_false;
735         const ir_node *block;
736         const ir_node *next_block;
737         int flipped = 0;
738
739         /* get both Proj's */
740         proj_true = get_proj(node, pn_Cond_true);
741         assert(proj_true && "CondJmp without true Proj");
742
743         proj_false = get_proj(node, pn_Cond_false);
744         assert(proj_false && "CondJmp without false Proj");
745
746         /* for now, the code works for scheduled and non-schedules blocks */
747         block = get_nodes_block(node);
748
749         /* we have a block schedule */
750         next_block = next_blk_sched(block);
751
752         if (get_cfop_target_block(proj_true) == next_block) {
753                 /* exchange both proj's so the second one can be omitted */
754                 const ir_node *t = proj_true;
755
756                 proj_true  = proj_false;
757                 proj_false = t;
758                 flipped    = 1;
759                 pnc        = get_negated_pnc(pnc, mode);
760         }
761
762         /* in case of unordered compare, check for parity */
763         if (pnc & pn_Cmp_Uo) {
764                 be_emit_cstring(env, "\tjp ");
765                 ia32_emit_cfop_target(env, proj_true);
766                 be_emit_finish_line_gas(env, proj_true);
767         }
768
769         be_emit_cstring(env, "\tj");
770         ia32_emit_cmp_suffix(env, pnc);
771         be_emit_char(env, ' ');
772         ia32_emit_cfop_target(env, proj_true);
773         be_emit_finish_line_gas(env, proj_true);
774
775         /* the second Proj might be a fallthrough */
776         if (get_cfop_target_block(proj_false) != next_block) {
777                 be_emit_cstring(env, "\tjmp ");
778                 ia32_emit_cfop_target(env, proj_false);
779                 be_emit_finish_line_gas(env, proj_false);
780         } else {
781                 be_emit_cstring(env, "\t/* fallthrough to ");
782                 ia32_emit_cfop_target(env, proj_false);
783                 be_emit_cstring(env, " */");
784                 be_emit_finish_line_gas(env, proj_false);
785         }
786 }
787
788 /**
789  * Emits code for conditional jump.
790  */
791 static
792 void CondJmp_emitter(ia32_emit_env_t *env, const ir_node *node) {
793         be_emit_cstring(env, "\tcmp ");
794         ia32_emit_binop(env, node);
795         be_emit_finish_line_gas(env, node);
796
797         finish_CondJmp(env, node, mode_Iu, get_ia32_pncode(node));
798 }
799
800 /**
801  * Emits code for conditional jump with two variables.
802  */
803 static
804 void emit_ia32_CondJmp(ia32_emit_env_t *env, const ir_node *node) {
805         CondJmp_emitter(env, node);
806 }
807
808 /**
809  * Emits code for conditional test and jump.
810  */
811 static
812 void TestJmp_emitter(ia32_emit_env_t *env, const ir_node *node) {
813         if(is_ia32_ImmSymConst(node) || is_ia32_ImmConst(node)) {
814                 be_emit_cstring(env, "\ttest ");
815                 ia32_emit_immediate(env, node);
816                 be_emit_cstring(env, ", ");
817                 ia32_emit_source_register(env, node, 0);
818                 be_emit_finish_line_gas(env, node);
819         } else {
820                 be_emit_cstring(env, "\ttest ");
821                 ia32_emit_source_register(env, node, 1);
822                 be_emit_cstring(env, ", ");
823                 ia32_emit_source_register(env, node, 0);
824                 be_emit_finish_line_gas(env, node);
825         }
826         finish_CondJmp(env, node, mode_Iu, get_ia32_pncode(node));
827 }
828
829 /**
830  * Emits code for conditional test and jump with two variables.
831  */
832 static
833 void emit_ia32_TestJmp(ia32_emit_env_t *env, const ir_node *node) {
834         TestJmp_emitter(env, node);
835 }
836
837 static
838 void emit_ia32_CJmp(ia32_emit_env_t *env, const ir_node *node) {
839         be_emit_cstring(env, "/* omitted redundant test */");
840         be_emit_finish_line_gas(env, node);
841
842         finish_CondJmp(env, node, mode_Is, get_ia32_pncode(node));
843 }
844
845 static
846 void emit_ia32_CJmpAM(ia32_emit_env_t *env, const ir_node *node) {
847         be_emit_cstring(env, "/* omitted redundant test/cmp */");
848         be_emit_finish_line_gas(env, node);
849
850         finish_CondJmp(env, node, mode_Is, get_ia32_pncode(node));
851 }
852
853 /**
854  * Emits code for conditional SSE floating point jump with two variables.
855  */
856 static
857 void emit_ia32_xCondJmp(ia32_emit_env_t *env, const ir_node *node) {
858         be_emit_cstring(env, "\tucomi");
859         ia32_emit_xmm_mode_suffix(env, node);
860         be_emit_char(env, ' ');
861         ia32_emit_binop(env, node);
862         be_emit_finish_line_gas(env, node);
863
864         finish_CondJmp(env, node, mode_F, get_ia32_pncode(node));
865 }
866
867 /**
868  * Emits code for conditional x87 floating point jump with two variables.
869  */
870 static
871 void emit_ia32_x87CondJmp(ia32_emit_env_t *env, const ir_node *node) {
872         const ia32_x87_attr_t *x87_attr = get_ia32_x87_attr_const(node);
873         const char            *reg      = x87_attr->x87[1]->name;
874         long                   pnc      = get_ia32_pncode(node);
875
876         switch (get_ia32_irn_opcode(node)) {
877         case iro_ia32_fcomrJmp:
878                 pnc = get_inversed_pnc(pnc);
879                 reg = x87_attr->x87[0]->name;
880         case iro_ia32_fcomJmp:
881         default:
882                 be_emit_cstring(env, "\tfucom ");
883                 break;
884         case iro_ia32_fcomrpJmp:
885                 pnc = get_inversed_pnc(pnc);
886                 reg = x87_attr->x87[0]->name;
887         case iro_ia32_fcompJmp:
888                 be_emit_cstring(env, "\tfucomp ");
889                 break;
890         case iro_ia32_fcomrppJmp:
891                 pnc = get_inversed_pnc(pnc);
892         case iro_ia32_fcomppJmp:
893                 be_emit_cstring(env, "\tfucompp ");
894                 reg = "";
895                 break;
896         }
897
898         if(reg[0] != '\0') {
899                 be_emit_char(env, '%');
900                 be_emit_string(env, reg);
901         }
902         be_emit_finish_line_gas(env, node);
903
904         be_emit_cstring(env, "\tfnstsw %ax");
905         be_emit_finish_line_gas(env, node);
906         be_emit_cstring(env, "\tsahf");
907         be_emit_finish_line_gas(env, node);
908
909         finish_CondJmp(env, node, mode_E, pnc);
910 }
911
912 static
913 void CMov_emitter(ia32_emit_env_t *env, const ir_node *node) {
914         long pnc = get_ia32_pncode(node);
915         int is_PsiCondCMov = is_ia32_PsiCondCMov(node);
916         int idx_left  = 2 - is_PsiCondCMov;
917         int idx_right = 3 - is_PsiCondCMov;
918         const arch_register_t *in1, *in2, *out;
919
920         out = arch_get_irn_register(env->arch_env, node);
921         in1 = arch_get_irn_register(env->arch_env, get_irn_n(node, idx_left));
922         in2 = arch_get_irn_register(env->arch_env, get_irn_n(node, idx_right));
923
924         /* we have to emit the cmp first, because the destination register */
925         /* could be one of the compare registers                           */
926         if (is_ia32_CmpCMov(node)) {
927                 be_emit_cstring(env, "\tcmp ");
928                 ia32_emit_source_register(env, node, 1);
929                 be_emit_cstring(env, ", ");
930                 ia32_emit_source_register(env, node, 0);
931         } else if (is_ia32_xCmpCMov(node)) {
932                 be_emit_cstring(env, "\tucomis");
933                 ia32_emit_mode_suffix_mode(env, get_irn_mode(node));
934                 be_emit_char(env, ' ');
935                 ia32_emit_source_register(env, node, 1);
936                 be_emit_cstring(env, ", ");
937                 ia32_emit_source_register(env, node, 0);
938         } else if (is_PsiCondCMov) {
939                 /* omit compare because flags are already set by And/Or */
940                 be_emit_cstring(env, "\ttest ");
941                 ia32_emit_source_register(env, node, 0);
942                 be_emit_cstring(env, ", ");
943                 ia32_emit_source_register(env, node, 0);
944         } else {
945                 assert(0 && "unsupported CMov");
946         }
947         be_emit_finish_line_gas(env, node);
948
949         if (REGS_ARE_EQUAL(out, in2)) {
950                 /* best case: default in == out -> do nothing */
951         } else if (REGS_ARE_EQUAL(out, in1)) {
952                 ir_node *n = (ir_node*) node;
953                 /* true in == out -> need complement compare and exchange true and default in */
954                 ir_node *t = get_irn_n(n, idx_left);
955                 set_irn_n(n, idx_left, get_irn_n(n, idx_right));
956                 set_irn_n(n, idx_right, t);
957
958                 pnc = get_negated_pnc(pnc, get_irn_mode(node));
959         } else {
960                 /* out is different from in: need copy default -> out */
961                 if (is_PsiCondCMov) {
962                         be_emit_cstring(env, "\tmovl ");
963                         ia32_emit_dest_register(env, node, 2);
964                         be_emit_cstring(env, ", ");
965                         ia32_emit_dest_register(env, node, 0);
966                 } else {
967                         be_emit_cstring(env, "\tmovl ");
968                         ia32_emit_source_register(env, node, 3);
969                         be_emit_cstring(env, ", ");
970                         ia32_emit_dest_register(env, node, 0);
971                 }
972                 be_emit_finish_line_gas(env, node);
973         }
974
975         if (is_PsiCondCMov) {
976                 be_emit_cstring(env, "\tcmov");
977                 ia32_emit_cmp_suffix(env, pnc);
978                 be_emit_cstring(env, "l ");
979                 ia32_emit_source_register(env, node, 1);
980                 be_emit_cstring(env, ", ");
981                 ia32_emit_dest_register(env, node, 0);
982         } else {
983                 be_emit_cstring(env, "\tcmov");
984                 ia32_emit_cmp_suffix(env, pnc);
985                 be_emit_cstring(env, "l ");
986                 ia32_emit_source_register(env, node, 2);
987                 be_emit_cstring(env, ", ");
988                 ia32_emit_dest_register(env, node, 0);
989         }
990         be_emit_finish_line_gas(env, node);
991 }
992
993 static
994 void emit_ia32_CmpCMov(ia32_emit_env_t *env, const ir_node *node) {
995         CMov_emitter(env, node);
996 }
997
998 static
999 void emit_ia32_PsiCondCMov(ia32_emit_env_t *env, const ir_node *node) {
1000         CMov_emitter(env, node);
1001 }
1002
1003 static
1004 void emit_ia32_xCmpCMov(ia32_emit_env_t *env, const ir_node *node) {
1005         CMov_emitter(env, node);
1006 }
1007
1008 static
1009 void Set_emitter(ia32_emit_env_t *env, const ir_node *node, ir_mode *mode) {
1010         int pnc = get_ia32_pncode(node);
1011         const char *reg8bit;
1012         const arch_register_t *out;
1013
1014         out     = arch_get_irn_register(env->arch_env, node);
1015         reg8bit = ia32_get_mapped_reg_name(env->isa->regs_8bit, out);
1016
1017         if (is_ia32_CmpSet(node)) {
1018                 be_emit_cstring(env, "\tcmp ");
1019                 ia32_emit_binop(env, node);
1020         } else if (is_ia32_xCmpSet(node)) {
1021                 be_emit_cstring(env, "\tucomis");
1022                 ia32_emit_mode_suffix_mode(env, get_irn_mode(get_irn_n(node, 2)));
1023                 be_emit_char(env, ' ');
1024                 ia32_emit_binop(env, node);
1025         } else if (is_ia32_PsiCondSet(node)) {
1026                 be_emit_cstring(env, "\tcmp $0, ");
1027                 ia32_emit_source_register(env, node, 0);
1028         } else {
1029                 assert(0 && "unsupported Set");
1030         }
1031         be_emit_finish_line_gas(env, node);
1032
1033         /* use mov to clear target because it doesn't affect the eflags */
1034         be_emit_cstring(env, "\tmovl $0, %");
1035         be_emit_string(env, arch_register_get_name(out));
1036         be_emit_finish_line_gas(env, node);
1037
1038         be_emit_cstring(env, "\tset");
1039         ia32_emit_cmp_suffix(env, pnc);
1040         be_emit_cstring(env, " %");
1041         be_emit_string(env, reg8bit);
1042         be_emit_finish_line_gas(env, node);
1043 }
1044
1045 static
1046 void emit_ia32_CmpSet(ia32_emit_env_t *env, const ir_node *node) {
1047         Set_emitter(env, node, get_irn_mode(get_irn_n(node, 2)));
1048 }
1049
1050 static
1051 void emit_ia32_PsiCondSet(ia32_emit_env_t *env, const ir_node *node) {
1052         Set_emitter(env, node, get_irn_mode(get_irn_n(node, 0)));
1053 }
1054
1055 static
1056 void emit_ia32_xCmpSet(ia32_emit_env_t *env, const ir_node *node) {
1057         Set_emitter(env, node, get_irn_mode(get_irn_n(node, 2)));
1058 }
1059
1060 static
1061 void emit_ia32_xCmp(ia32_emit_env_t *env, const ir_node *node) {
1062         int  sse_pnc  = -1;
1063         long pnc      = get_ia32_pncode(node);
1064         long unord    = pnc & pn_Cmp_Uo;
1065
1066         assert( (pnc & ia32_pn_Cmp_Unsigned) == 0);
1067
1068         switch (pnc) {
1069                 case pn_Cmp_Leg: /* odered */
1070                         sse_pnc = 7;
1071                         break;
1072                 case pn_Cmp_Uo:  /* unordered */
1073                         sse_pnc = 3;
1074                         break;
1075                 case pn_Cmp_Ue:
1076                 case pn_Cmp_Eq:  /* == */
1077                         sse_pnc = 0;
1078                         break;
1079                 case pn_Cmp_Ul:
1080                 case pn_Cmp_Lt:  /* < */
1081                         sse_pnc = 1;
1082                         break;
1083                 case pn_Cmp_Ule:
1084                 case pn_Cmp_Le: /* <= */
1085                         sse_pnc = 2;
1086                         break;
1087                 case pn_Cmp_Ug:
1088                 case pn_Cmp_Gt:  /* > */
1089                         sse_pnc = 6;
1090                         break;
1091                 case pn_Cmp_Uge:
1092                 case pn_Cmp_Ge: /* >= */
1093                         sse_pnc = 5;
1094                         break;
1095                 case pn_Cmp_Ne:
1096                 case pn_Cmp_Lg:  /* != */
1097                         sse_pnc = 4;
1098                         break;
1099         }
1100
1101         assert(sse_pnc >= 0 && "unsupported compare");
1102
1103         if (unord && sse_pnc != 3) {
1104                 /*
1105                         We need a separate compare against unordered.
1106                         Quick and Dirty solution:
1107                         - get some memory on stack
1108                         - compare
1109                         - store result
1110                         - compare
1111                         - and result and stored result
1112                     - cleanup stack
1113                 */
1114                 be_emit_cstring(env, "\tsubl $8, %esp");
1115                 be_emit_finish_line_gas(env, node);
1116
1117                 be_emit_cstring(env, "\tcmpsd $3, ");
1118                 ia32_emit_binop(env, node);
1119                 be_emit_finish_line_gas(env, node);
1120
1121                 be_emit_cstring(env, "\tmovsd ");
1122                 ia32_emit_dest_register(env, node, 0);
1123                 be_emit_cstring(env, ", (%esp)");
1124                 be_emit_finish_line_gas(env, node);
1125         }
1126
1127         be_emit_cstring(env, "\tcmpsd ");
1128         be_emit_irprintf(env->emit, "%d, ", sse_pnc);
1129         ia32_emit_binop(env, node);
1130         be_emit_finish_line_gas(env, node);
1131
1132         if (unord && sse_pnc != 3) {
1133                 be_emit_cstring(env, "\tandpd (%esp), ");
1134                 ia32_emit_dest_register(env, node, 0);
1135                 be_emit_finish_line_gas(env, node);
1136
1137                 be_emit_cstring(env, "\taddl $8, %esp");
1138                 be_emit_finish_line_gas(env, node);
1139         }
1140 }
1141
1142 /*********************************************************
1143  *                 _ _       _
1144  *                (_) |     (_)
1145  *   ___ _ __ ___  _| |_     _ _   _ _ __ ___  _ __  ___
1146  *  / _ \ '_ ` _ \| | __|   | | | | | '_ ` _ \| '_ \/ __|
1147  * |  __/ | | | | | | |_    | | |_| | | | | | | |_) \__ \
1148  *  \___|_| |_| |_|_|\__|   | |\__,_|_| |_| |_| .__/|___/
1149  *                         _/ |               | |
1150  *                        |__/                |_|
1151  *********************************************************/
1152
1153 /* jump table entry (target and corresponding number) */
1154 typedef struct _branch_t {
1155         ir_node *target;
1156         int      value;
1157 } branch_t;
1158
1159 /* jump table for switch generation */
1160 typedef struct _jmp_tbl_t {
1161         ir_node  *defProj;         /**< default target */
1162         int       min_value;       /**< smallest switch case */
1163         int       max_value;       /**< largest switch case */
1164         int       num_branches;    /**< number of jumps */
1165         char     *label;           /**< label of the jump table */
1166         branch_t *branches;        /**< jump array */
1167 } jmp_tbl_t;
1168
1169 /**
1170  * Compare two variables of type branch_t. Used to sort all switch cases
1171  */
1172 static
1173 int ia32_cmp_branch_t(const void *a, const void *b) {
1174         branch_t *b1 = (branch_t *)a;
1175         branch_t *b2 = (branch_t *)b;
1176
1177         if (b1->value <= b2->value)
1178                 return -1;
1179         else
1180                 return 1;
1181 }
1182
1183 /**
1184  * Emits code for a SwitchJmp (creates a jump table if
1185  * possible otherwise a cmp-jmp cascade). Port from
1186  * cggg ia32 backend
1187  */
1188 static
1189 void emit_ia32_SwitchJmp(ia32_emit_env_t *env, const ir_node *node) {
1190         unsigned long       interval;
1191         int                 last_value, i;
1192         long                pnc;
1193         jmp_tbl_t           tbl;
1194         ir_node            *proj;
1195         const ir_edge_t    *edge;
1196
1197         /* fill the table structure */
1198         tbl.label        = xmalloc(SNPRINTF_BUF_LEN);
1199         tbl.label        = get_unique_label(tbl.label, SNPRINTF_BUF_LEN, ".TBL_");
1200         tbl.defProj      = NULL;
1201         tbl.num_branches = get_irn_n_edges(node);
1202         tbl.branches     = xcalloc(tbl.num_branches, sizeof(tbl.branches[0]));
1203         tbl.min_value    = INT_MAX;
1204         tbl.max_value    = INT_MIN;
1205
1206         i = 0;
1207         /* go over all proj's and collect them */
1208         foreach_out_edge(node, edge) {
1209                 proj = get_edge_src_irn(edge);
1210                 assert(is_Proj(proj) && "Only proj allowed at SwitchJmp");
1211
1212                 pnc = get_Proj_proj(proj);
1213
1214                 /* create branch entry */
1215                 tbl.branches[i].target = proj;
1216                 tbl.branches[i].value  = pnc;
1217
1218                 tbl.min_value = pnc < tbl.min_value ? pnc : tbl.min_value;
1219                 tbl.max_value = pnc > tbl.max_value ? pnc : tbl.max_value;
1220
1221                 /* check for default proj */
1222                 if (pnc == get_ia32_pncode(node)) {
1223                         assert(tbl.defProj == NULL && "found two defProjs at SwitchJmp");
1224                         tbl.defProj = proj;
1225                 }
1226
1227                 i++;
1228         }
1229
1230         /* sort the branches by their number */
1231         qsort(tbl.branches, tbl.num_branches, sizeof(tbl.branches[0]), ia32_cmp_branch_t);
1232
1233         /* two-complement's magic make this work without overflow */
1234         interval = tbl.max_value - tbl.min_value;
1235
1236         /* emit the table */
1237         be_emit_cstring(env, "\tcmpl $");
1238         be_emit_irprintf(env->emit, "%u, ", interval);
1239         ia32_emit_source_register(env, node, 0);
1240         be_emit_finish_line_gas(env, node);
1241
1242         be_emit_cstring(env, "\tja ");
1243         ia32_emit_cfop_target(env, tbl.defProj);
1244         be_emit_finish_line_gas(env, node);
1245
1246         if (tbl.num_branches > 1) {
1247                 /* create table */
1248                 be_emit_cstring(env, "\tjmp *");
1249                 be_emit_string(env, tbl.label);
1250                 be_emit_cstring(env, "(,");
1251                 ia32_emit_source_register(env, node, 0);
1252                 be_emit_cstring(env, ",4)");
1253                 be_emit_finish_line_gas(env, node);
1254
1255                 be_gas_emit_switch_section(env->emit, GAS_SECTION_RODATA);
1256                 be_emit_cstring(env, "\t.align 4\n");
1257                 be_emit_write_line(env);
1258
1259                 be_emit_string(env, tbl.label);
1260                 be_emit_cstring(env, ":\n");
1261                 be_emit_write_line(env);
1262
1263                 be_emit_cstring(env, ".long ");
1264                 ia32_emit_cfop_target(env, tbl.branches[0].target);
1265                 be_emit_finish_line_gas(env, NULL);
1266
1267                 last_value = tbl.branches[0].value;
1268                 for (i = 1; i < tbl.num_branches; ++i) {
1269                         while (++last_value < tbl.branches[i].value) {
1270                                 be_emit_cstring(env, ".long ");
1271                                 ia32_emit_cfop_target(env, tbl.defProj);
1272                                 be_emit_finish_line_gas(env, NULL);
1273                         }
1274                         be_emit_cstring(env, ".long ");
1275                         ia32_emit_cfop_target(env, tbl.branches[i].target);
1276                         be_emit_finish_line_gas(env, NULL);
1277                 }
1278                 be_gas_emit_switch_section(env->emit, GAS_SECTION_TEXT);
1279         } else {
1280                 /* one jump is enough */
1281                 be_emit_cstring(env, "\tjmp ");
1282                 ia32_emit_cfop_target(env, tbl.branches[0].target);
1283                 be_emit_finish_line_gas(env, node);
1284         }
1285
1286         if (tbl.label)
1287                 free(tbl.label);
1288         if (tbl.branches)
1289                 free(tbl.branches);
1290 }
1291
1292 /**
1293  * Emits code for a unconditional jump.
1294  */
1295 static
1296 void emit_Jmp(ia32_emit_env_t *env, const ir_node *node) {
1297         ir_node *block, *next_block;
1298
1299         /* for now, the code works for scheduled and non-schedules blocks */
1300         block = get_nodes_block(node);
1301
1302         /* we have a block schedule */
1303         next_block = next_blk_sched(block);
1304         if (get_cfop_target_block(node) != next_block) {
1305                 be_emit_cstring(env, "\tjmp ");
1306                 ia32_emit_cfop_target(env, node);
1307         } else {
1308                 be_emit_cstring(env, "\t/* fallthrough to ");
1309                 ia32_emit_cfop_target(env, node);
1310                 be_emit_cstring(env, " */");
1311         }
1312         be_emit_finish_line_gas(env, node);
1313 }
1314
1315 static
1316 void emit_ia32_Immediate(ia32_emit_env_t *env, const ir_node *node)
1317 {
1318         const ia32_attr_t *attr = get_ia32_attr_const(node);
1319
1320         if(attr->am_sc != NULL) {
1321                 ident *id = get_entity_ld_ident(attr->am_sc);
1322
1323                 if(attr->data.am_sc_sign)
1324                         be_emit_char(env, '-');
1325                 be_emit_ident(env, id);
1326         }
1327         if(attr->cnst_val.tv != NULL) {
1328                 if(attr->am_sc != NULL)
1329                         be_emit_char(env, '+');
1330                 else
1331                         be_emit_char(env, '$');
1332                 be_emit_tarval(env, attr->cnst_val.tv);
1333         }
1334 }
1335
1336 static
1337 const char* emit_asm_operand(ia32_emit_env_t *env, const ir_node *node,
1338                              const char *s)
1339 {
1340         const arch_register_t *reg;
1341         const char            *reg_name;
1342         char                   c;
1343         char                   modifier = 0;
1344         int                    num      = -1;
1345         const ia32_attr_t     *attr;
1346         int                    n_outs;
1347         int                    p;
1348
1349         assert(*s == '%');
1350         c = *(++s);
1351
1352         /* parse modifiers */
1353         switch(c) {
1354         case 0:
1355                 ir_fprintf(stderr, "Warning: asm text (%+F) ends with %\n", node);
1356                 be_emit_char(env, '%');
1357                 return s + 1;
1358         case '%':
1359                 be_emit_char(env, '%');
1360                 return s + 1;
1361         case 'w':
1362         case 'b':
1363         case 'h':
1364                 modifier = c;
1365                 ++s;
1366                 break;
1367         case '0':
1368         case '1':
1369         case '2':
1370         case '3':
1371         case '4':
1372         case '5':
1373         case '6':
1374         case '7':
1375         case '8':
1376         case '9':
1377                 break;
1378         default:
1379                 ir_fprintf(stderr, "Warning: asm text (%+F) contains unknown modifier "
1380                            "'%c' for asm op\n", node, c);
1381                 ++s;
1382                 break;
1383         }
1384
1385         /* parse number */
1386         sscanf(s, "%d%n", &num, &p);
1387         if(num < 0) {
1388                 ir_fprintf(stderr, "Warning: Couldn't parse assembler operand (%+F)\n",
1389                            node);
1390                 return s;
1391         } else {
1392                 s += p;
1393         }
1394
1395         /* get register */
1396         attr   = get_ia32_attr_const(node);
1397         n_outs = ARR_LEN(attr->slots);
1398         if(num < n_outs) {
1399                 reg = get_out_reg(env, node, num);
1400         } else {
1401                 ir_node *pred;
1402                 int      in = num - n_outs;
1403                 if(in >= get_irn_arity(node)) {
1404                         ir_fprintf(stderr, "Warning: Invalid input %d specified in asm "
1405                                    "op (%+F)\n", num, node);
1406                         return s;
1407                 }
1408                 pred = get_irn_n(node, in);
1409                 /* might be an immediate value */
1410                 if(is_ia32_Immediate(pred)) {
1411                         emit_ia32_Immediate(env, pred);
1412                         return s;
1413                 }
1414                 reg = get_in_reg(env, node, in);
1415         }
1416         if(reg == NULL) {
1417                 ir_fprintf(stderr, "Warning: no register assigned for %d asm op "
1418                            "(%+F)\n", num, node);
1419                 return s;
1420         }
1421
1422         /* emit it */
1423         be_emit_char(env, '%');
1424         switch(modifier) {
1425         case 0:
1426                 reg_name = arch_register_get_name(reg);
1427                 break;
1428         case 'b':
1429                 reg_name = ia32_get_mapped_reg_name(env->isa->regs_8bit, reg);
1430                 break;
1431         case 'h':
1432                 reg_name = ia32_get_mapped_reg_name(env->isa->regs_8bit_high, reg);
1433                 break;
1434         case 'w':
1435                 reg_name = ia32_get_mapped_reg_name(env->isa->regs_16bit, reg);
1436                 break;
1437         default:
1438                 panic("Invalid asm op modifier");
1439         }
1440         be_emit_string(env, reg_name);
1441
1442         return s;
1443 }
1444
1445 /**
1446  * Emits code for an ASM pseudo op.
1447  */
1448 static
1449 void emit_ia32_Asm(ia32_emit_env_t *env, const ir_node *node)
1450 {
1451         const void            *gen_attr = get_irn_generic_attr_const(node);
1452         const ia32_asm_attr_t *attr
1453                 = CONST_CAST_IA32_ATTR(ia32_asm_attr_t, gen_attr);
1454         ident                 *asm_text = attr->asm_text;
1455         const char            *s        = get_id_str(asm_text);
1456
1457         be_emit_cstring(env, "# Begin ASM \t");
1458         be_emit_finish_line_gas(env, node);
1459
1460         if (s[0] != '\t')
1461                 be_emit_char(env, '\t');
1462
1463         while(*s != 0) {
1464                 if(*s == '%') {
1465                         s = emit_asm_operand(env, node, s);
1466                         continue;
1467                 } else {
1468                         be_emit_char(env, *s);
1469                 }
1470                 ++s;
1471         }
1472
1473         be_emit_char(env, '\n');
1474         be_emit_write_line(env);
1475
1476         be_emit_cstring(env, "# End ASM\n");
1477         be_emit_write_line(env);
1478 }
1479
1480 /**********************************
1481  *   _____                  ____
1482  *  / ____|                |  _ \
1483  * | |     ___  _ __  _   _| |_) |
1484  * | |    / _ \| '_ \| | | |  _ <
1485  * | |___| (_) | |_) | |_| | |_) |
1486  *  \_____\___/| .__/ \__, |____/
1487  *             | |     __/ |
1488  *             |_|    |___/
1489  **********************************/
1490
1491 /**
1492  * Emit movsb/w instructions to make mov count divideable by 4
1493  */
1494 static
1495 void emit_CopyB_prolog(ia32_emit_env_t *env, int rem) {
1496         be_emit_cstring(env, "\tcld");
1497         be_emit_finish_line_gas(env, NULL);
1498
1499         switch(rem) {
1500         case 1:
1501                 be_emit_cstring(env, "\tmovsb");
1502                 be_emit_finish_line_gas(env, NULL);
1503                 break;
1504         case 2:
1505                 be_emit_cstring(env, "\tmovsw");
1506                 be_emit_finish_line_gas(env, NULL);
1507                 break;
1508         case 3:
1509                 be_emit_cstring(env, "\tmovsb");
1510                 be_emit_finish_line_gas(env, NULL);
1511                 be_emit_cstring(env, "\tmovsw");
1512                 be_emit_finish_line_gas(env, NULL);
1513                 break;
1514         }
1515 }
1516
1517 /**
1518  * Emit rep movsd instruction for memcopy.
1519  */
1520 static
1521 void emit_ia32_CopyB(ia32_emit_env_t *env, const ir_node *node) {
1522         tarval *tv = get_ia32_Immop_tarval(node);
1523         int    rem = get_tarval_long(tv);
1524
1525         emit_CopyB_prolog(env, rem);
1526
1527         be_emit_cstring(env, "\trep movsd");
1528         be_emit_finish_line_gas(env, node);
1529 }
1530
1531 /**
1532  * Emits unrolled memcopy.
1533  */
1534 static
1535 void emit_ia32_CopyB_i(ia32_emit_env_t *env, const ir_node *node) {
1536         tarval *tv   = get_ia32_Immop_tarval(node);
1537         int     size = get_tarval_long(tv);
1538
1539         emit_CopyB_prolog(env, size & 0x3);
1540
1541         size >>= 2;
1542         while (size--) {
1543                 be_emit_cstring(env, "\tmovsd");
1544                 be_emit_finish_line_gas(env, NULL);
1545         }
1546 }
1547
1548
1549
1550 /***************************
1551  *   _____
1552  *  / ____|
1553  * | |     ___  _ ____   __
1554  * | |    / _ \| '_ \ \ / /
1555  * | |___| (_) | | | \ V /
1556  *  \_____\___/|_| |_|\_/
1557  *
1558  ***************************/
1559
1560 /**
1561  * Emit code for conversions (I, FP), (FP, I) and (FP, FP).
1562  */
1563 static
1564 void emit_ia32_Conv_with_FP(ia32_emit_env_t *env, const ir_node *node) {
1565         ir_mode            *ls_mode = get_ia32_ls_mode(node);
1566         int                 ls_bits = get_mode_size_bits(ls_mode);
1567
1568         be_emit_cstring(env, "\tcvt");
1569
1570         if(is_ia32_Conv_I2FP(node)) {
1571                 if(ls_bits == 32) {
1572                         be_emit_cstring(env, "si2ss");
1573                 } else {
1574                         be_emit_cstring(env, "si2sd");
1575                 }
1576         } else if(is_ia32_Conv_FP2I(node)) {
1577                 if(ls_bits == 32) {
1578                         be_emit_cstring(env, "ss2si");
1579                 } else {
1580                         be_emit_cstring(env, "sd2si");
1581                 }
1582         } else {
1583                 assert(is_ia32_Conv_FP2FP(node));
1584                 if(ls_bits == 32) {
1585                         be_emit_cstring(env, "sd2ss");
1586                 } else {
1587                         be_emit_cstring(env, "ss2sd");
1588                 }
1589         }
1590         be_emit_char(env, ' ');
1591
1592         switch(get_ia32_op_type(node)) {
1593                 case ia32_Normal:
1594                         ia32_emit_source_register(env, node, 2);
1595                         be_emit_cstring(env, ", ");
1596                         ia32_emit_dest_register(env, node, 0);
1597                         break;
1598                 case ia32_AddrModeS:
1599                         ia32_emit_dest_register(env, node, 0);
1600                         be_emit_cstring(env, ", ");
1601                         ia32_emit_am(env, node);
1602                         break;
1603                 default:
1604                         assert(0 && "unsupported op type for Conv");
1605         }
1606         be_emit_finish_line_gas(env, node);
1607 }
1608
1609 static
1610 void emit_ia32_Conv_I2FP(ia32_emit_env_t *env, const ir_node *node) {
1611         emit_ia32_Conv_with_FP(env, node);
1612 }
1613
1614 static
1615 void emit_ia32_Conv_FP2I(ia32_emit_env_t *env, const ir_node *node) {
1616         emit_ia32_Conv_with_FP(env, node);
1617 }
1618
1619 static
1620 void emit_ia32_Conv_FP2FP(ia32_emit_env_t *env, const ir_node *node) {
1621         emit_ia32_Conv_with_FP(env, node);
1622 }
1623
1624 /**
1625  * Emits code for an Int conversion.
1626  */
1627 static
1628 void emit_ia32_Conv_I2I(ia32_emit_env_t *env, const ir_node *node) {
1629         const char *sign_suffix;
1630         ir_mode *smaller_mode = get_ia32_ls_mode(node);
1631         int smaller_bits = get_mode_size_bits(smaller_mode);
1632         int signed_mode;
1633         const arch_register_t *in_reg, *out_reg;
1634
1635         assert(!mode_is_float(smaller_mode));
1636         assert(smaller_bits == 8 || smaller_bits == 16 || smaller_bits == 32);
1637
1638         signed_mode = mode_is_signed(smaller_mode);
1639         if(smaller_bits == 32) {
1640                 // this should not happen as it's no convert
1641                 assert(0);
1642                 sign_suffix = "";
1643         } else {
1644                 sign_suffix = signed_mode ? "s" : "z";
1645         }
1646
1647         switch(get_ia32_op_type(node)) {
1648                 case ia32_Normal:
1649                         in_reg  = get_in_reg(env, node, 2);
1650                         out_reg = get_out_reg(env, node, 0);
1651
1652                         if (REGS_ARE_EQUAL(in_reg, &ia32_gp_regs[REG_EAX]) &&
1653                                 REGS_ARE_EQUAL(out_reg, in_reg)                &&
1654                                 signed_mode &&
1655                                 smaller_bits == 16)
1656                         {
1657                                 /* argument and result are both in EAX and */
1658                                 /* signedness is ok: -> use the smaller cwtl opcode */
1659                                 be_emit_cstring(env, "\tcwtl");
1660                         } else {
1661                                 const char *sreg = ia32_get_reg_name_for_mode(env, smaller_mode, in_reg);
1662
1663                                 be_emit_cstring(env, "\tmov");
1664                                 be_emit_string(env, sign_suffix);
1665                                 ia32_emit_mode_suffix_mode(env, smaller_mode);
1666                                 be_emit_cstring(env, "l %");
1667                                 be_emit_string(env, sreg);
1668                                 be_emit_cstring(env, ", ");
1669                                 ia32_emit_dest_register(env, node, 0);
1670                         }
1671                         break;
1672                 case ia32_AddrModeS: {
1673                         be_emit_cstring(env, "\tmov");
1674                         be_emit_string(env, sign_suffix);
1675                         ia32_emit_mode_suffix_mode(env, smaller_mode);
1676                         be_emit_cstring(env, "l %");
1677                         ia32_emit_am(env, node);
1678                         be_emit_cstring(env, ", ");
1679                         ia32_emit_dest_register(env, node, 0);
1680                         break;
1681                 }
1682                 default:
1683                         assert(0 && "unsupported op type for Conv");
1684         }
1685         be_emit_finish_line_gas(env, node);
1686 }
1687
1688 /**
1689  * Emits code for an 8Bit Int conversion.
1690  */
1691 void emit_ia32_Conv_I2I8Bit(ia32_emit_env_t *env, const ir_node *node) {
1692         emit_ia32_Conv_I2I(env, node);
1693 }
1694
1695
1696 /*******************************************
1697  *  _                          _
1698  * | |                        | |
1699  * | |__   ___ _ __   ___   __| | ___  ___
1700  * | '_ \ / _ \ '_ \ / _ \ / _` |/ _ \/ __|
1701  * | |_) |  __/ | | | (_) | (_| |  __/\__ \
1702  * |_.__/ \___|_| |_|\___/ \__,_|\___||___/
1703  *
1704  *******************************************/
1705
1706 /**
1707  * Emits a backend call
1708  */
1709 static
1710 void emit_be_Call(ia32_emit_env_t *env, const ir_node *node) {
1711         ir_entity *ent = be_Call_get_entity(node);
1712
1713         be_emit_cstring(env, "\tcall ");
1714         if (ent) {
1715                 mark_entity_visited(ent);
1716                 be_emit_string(env, get_entity_ld_name(ent));
1717         } else {
1718                 be_emit_char(env, '*');
1719                 ia32_emit_dest_register(env, get_irn_n(node, be_pos_Call_ptr), 0);
1720         }
1721         be_emit_finish_line_gas(env, node);
1722 }
1723
1724 /**
1725  * Emits code to increase stack pointer.
1726  */
1727 static
1728 void emit_be_IncSP(ia32_emit_env_t *env, const ir_node *node) {
1729         int offs = be_get_IncSP_offset(node);
1730
1731         if (offs == 0)
1732                 return;
1733
1734         if (offs > 0) {
1735                 be_emit_cstring(env, "\tsubl $");
1736                 be_emit_irprintf(env->emit, "%u, ", offs);
1737                 ia32_emit_source_register(env, node, 0);
1738         } else {
1739                 be_emit_cstring(env, "\taddl $");
1740                 be_emit_irprintf(env->emit, "%u, ", -offs);
1741                 ia32_emit_source_register(env, node, 0);
1742         }
1743         be_emit_finish_line_gas(env, node);
1744 }
1745
1746 /**
1747  * Emits code to set stack pointer.
1748  */
1749 static
1750 void emit_be_SetSP(ia32_emit_env_t *env, const ir_node *node) {
1751         be_emit_cstring(env, "\tmovl ");
1752         ia32_emit_source_register(env, node, 2);
1753         be_emit_cstring(env, ", ");
1754         ia32_emit_dest_register(env, node, 0);
1755         be_emit_finish_line_gas(env, node);
1756 }
1757
1758 /**
1759  * Emits code for Copy/CopyKeep.
1760  */
1761 static
1762 void Copy_emitter(ia32_emit_env_t *env, const ir_node *node, const ir_node *op)
1763 {
1764         const arch_env_t *aenv = env->arch_env;
1765         ir_mode *mode;
1766
1767         if (REGS_ARE_EQUAL(arch_get_irn_register(aenv, node), arch_get_irn_register(aenv, op)) ||
1768                 arch_register_type_is(arch_get_irn_register(aenv, op), virtual))
1769                 return;
1770
1771         mode = get_irn_mode(node);
1772         if (mode == mode_E) {
1773                 be_emit_cstring(env, "\tmovsd ");
1774                 ia32_emit_source_register(env, node, 0);
1775                 be_emit_cstring(env, ", ");
1776                 ia32_emit_dest_register(env, node, 0);
1777         } else {
1778                 be_emit_cstring(env, "\tmovl ");
1779                 ia32_emit_source_register(env, node, 0);
1780                 be_emit_cstring(env, ", ");
1781                 ia32_emit_dest_register(env, node, 0);
1782         }
1783         be_emit_finish_line_gas(env, node);
1784 }
1785
1786 static
1787 void emit_be_Copy(ia32_emit_env_t *env, const ir_node *node) {
1788         Copy_emitter(env, node, be_get_Copy_op(node));
1789 }
1790
1791 static
1792 void emit_be_CopyKeep(ia32_emit_env_t *env, const ir_node *node) {
1793         Copy_emitter(env, node, be_get_CopyKeep_op(node));
1794 }
1795
1796 /**
1797  * Emits code for exchange.
1798  */
1799 static
1800 void emit_be_Perm(ia32_emit_env_t *env, const ir_node *node) {
1801         const arch_register_t *in1, *in2;
1802         const arch_register_class_t *cls1, *cls2;
1803
1804         in1 = arch_get_irn_register(env->arch_env, get_irn_n(node, 0));
1805         in2 = arch_get_irn_register(env->arch_env, get_irn_n(node, 1));
1806
1807         cls1 = arch_register_get_class(in1);
1808         cls2 = arch_register_get_class(in2);
1809
1810         assert(cls1 == cls2 && "Register class mismatch at Perm");
1811
1812         if (cls1 == &ia32_reg_classes[CLASS_ia32_gp]) {
1813                 be_emit_cstring(env, "\txchg ");
1814                 ia32_emit_source_register(env, node, 1);
1815                 be_emit_cstring(env, ", ");
1816                 ia32_emit_source_register(env, node, 0);
1817                 be_emit_finish_line_gas(env, node);
1818         } else if (cls1 == &ia32_reg_classes[CLASS_ia32_xmm]) {
1819                 be_emit_cstring(env, "\txorpd ");
1820                 ia32_emit_source_register(env, node, 1);
1821                 be_emit_cstring(env, ", ");
1822                 ia32_emit_source_register(env, node, 0);
1823                 be_emit_finish_line_gas(env, NULL);
1824
1825                 be_emit_cstring(env, "\txorpd ");
1826                 ia32_emit_source_register(env, node, 0);
1827                 be_emit_cstring(env, ", ");
1828                 ia32_emit_source_register(env, node, 1);
1829                 be_emit_finish_line_gas(env, NULL);
1830
1831                 be_emit_cstring(env, "\txorpd ");
1832                 ia32_emit_source_register(env, node, 1);
1833                 be_emit_cstring(env, ", ");
1834                 ia32_emit_source_register(env, node, 0);
1835                 be_emit_finish_line_gas(env, node);
1836         } else if (cls1 == &ia32_reg_classes[CLASS_ia32_vfp]) {
1837                 /* is a NOP */
1838         } else if (cls1 == &ia32_reg_classes[CLASS_ia32_st]) {
1839                 /* is a NOP */
1840         }
1841 }
1842
1843 /**
1844  * Emits code for Constant loading.
1845  */
1846 static
1847 void emit_ia32_Const(ia32_emit_env_t *env, const ir_node *node) {
1848         ia32_immop_type_t imm_tp = get_ia32_immop_type(node);
1849
1850         if (imm_tp == ia32_ImmSymConst) {
1851                 be_emit_cstring(env, "\tmovl ");
1852                 ia32_emit_immediate(env, node);
1853                 be_emit_cstring(env, ", ");
1854                 ia32_emit_dest_register(env, node, 0);
1855         } else {
1856                 tarval *tv = get_ia32_Immop_tarval(node);
1857                 assert(get_irn_mode(node) == mode_Iu);
1858                 /* beware: in some rare cases mode is mode_b which has no tarval_null() */
1859                 if (tarval_is_null(tv)) {
1860                         if (env->isa->opt_arch == arch_pentium_4) {
1861                                 /* P4 prefers sub r, r, others xor r, r */
1862                                 be_emit_cstring(env, "\tsubl ");
1863                         } else {
1864                                 be_emit_cstring(env, "\txorl ");
1865                         }
1866                         ia32_emit_dest_register(env, node, 0);
1867                         be_emit_cstring(env, ", ");
1868                         ia32_emit_dest_register(env, node, 0);
1869                 } else {
1870                         be_emit_cstring(env, "\tmovl ");
1871                         ia32_emit_immediate(env, node);
1872                         be_emit_cstring(env, ", ");
1873                         ia32_emit_dest_register(env, node, 0);
1874                 }
1875         }
1876         be_emit_finish_line_gas(env, node);
1877 }
1878
1879 /**
1880  * Emits code to load the TLS base
1881  */
1882 static
1883 void emit_ia32_LdTls(ia32_emit_env_t *env, const ir_node *node) {
1884         be_emit_cstring(env, "\tmovl %gs:0, ");
1885         ia32_emit_dest_register(env, node, 0);
1886         be_emit_finish_line_gas(env, node);
1887 }
1888
1889 static
1890 void emit_be_Return(ia32_emit_env_t *env, const ir_node *node) {
1891         be_emit_cstring(env, "\tret");
1892         be_emit_finish_line_gas(env, node);
1893 }
1894
1895 static
1896 void emit_Nothing(ia32_emit_env_t *env, const ir_node *node) {
1897 }
1898
1899
1900 /***********************************************************************************
1901  *                  _          __                                             _
1902  *                 (_)        / _|                                           | |
1903  *  _ __ ___   __ _ _ _ __   | |_ _ __ __ _ _ __ ___   _____      _____  _ __| | __
1904  * | '_ ` _ \ / _` | | '_ \  |  _| '__/ _` | '_ ` _ \ / _ \ \ /\ / / _ \| '__| |/ /
1905  * | | | | | | (_| | | | | | | | | | | (_| | | | | | |  __/\ V  V / (_) | |  |   <
1906  * |_| |_| |_|\__,_|_|_| |_| |_| |_|  \__,_|_| |_| |_|\___| \_/\_/ \___/|_|  |_|\_\
1907  *
1908  ***********************************************************************************/
1909
1910 /**
1911  * Enters the emitter functions for handled nodes into the generic
1912  * pointer of an opcode.
1913  */
1914 static
1915 void ia32_register_emitters(void) {
1916
1917 #define IA32_EMIT2(a,b) op_ia32_##a->ops.generic = (op_func)emit_ia32_##b
1918 #define IA32_EMIT(a)    IA32_EMIT2(a,a)
1919 #define EMIT(a)         op_##a->ops.generic = (op_func)emit_##a
1920 #define IGN(a)                  op_##a->ops.generic = (op_func)emit_Nothing
1921 #define BE_EMIT(a)      op_be_##a->ops.generic = (op_func)emit_be_##a
1922 #define BE_IGN(a)               op_be_##a->ops.generic = (op_func)emit_Nothing
1923
1924         /* first clear the generic function pointer for all ops */
1925         clear_irp_opcodes_generic_func();
1926
1927         /* register all emitter functions defined in spec */
1928         ia32_register_spec_emitters();
1929
1930         /* other ia32 emitter functions */
1931         IA32_EMIT(Asm);
1932         IA32_EMIT(CondJmp);
1933         IA32_EMIT(TestJmp);
1934         IA32_EMIT(CJmp);
1935         IA32_EMIT(CJmpAM);
1936         IA32_EMIT(CmpCMov);
1937         IA32_EMIT(PsiCondCMov);
1938         IA32_EMIT(CmpSet);
1939         IA32_EMIT(PsiCondSet);
1940         IA32_EMIT(SwitchJmp);
1941         IA32_EMIT(CopyB);
1942         IA32_EMIT(CopyB_i);
1943         IA32_EMIT(Conv_I2FP);
1944         IA32_EMIT(Conv_FP2I);
1945         IA32_EMIT(Conv_FP2FP);
1946         IA32_EMIT(Conv_I2I);
1947         IA32_EMIT(Conv_I2I8Bit);
1948         IA32_EMIT(Const);
1949         IA32_EMIT(LdTls);
1950         IA32_EMIT(xCmp);
1951         IA32_EMIT(xCmpSet);
1952         IA32_EMIT(xCmpCMov);
1953         IA32_EMIT(xCondJmp);
1954         IA32_EMIT2(fcomJmp, x87CondJmp);
1955         IA32_EMIT2(fcompJmp, x87CondJmp);
1956         IA32_EMIT2(fcomppJmp, x87CondJmp);
1957         IA32_EMIT2(fcomrJmp, x87CondJmp);
1958         IA32_EMIT2(fcomrpJmp, x87CondJmp);
1959         IA32_EMIT2(fcomrppJmp, x87CondJmp);
1960
1961         /* benode emitter */
1962         BE_EMIT(Call);
1963         BE_EMIT(IncSP);
1964         BE_EMIT(SetSP);
1965         BE_EMIT(Copy);
1966         BE_EMIT(CopyKeep);
1967         BE_EMIT(Perm);
1968         BE_EMIT(Return);
1969
1970         BE_IGN(RegParams);
1971         BE_IGN(Barrier);
1972         BE_IGN(Keep);
1973
1974         /* firm emitter */
1975         EMIT(Jmp);
1976         IGN(Proj);
1977         IGN(Phi);
1978         IGN(Start);
1979
1980 #undef BE_EMIT
1981 #undef EMIT
1982 #undef IGN
1983 #undef IA32_EMIT2
1984 #undef IA32_EMIT
1985 }
1986
1987 static const char *last_name = NULL;
1988 static unsigned last_line = -1;
1989 static unsigned num = -1;
1990
1991 /**
1992  * Emit the debug support for node node.
1993  */
1994 static
1995 void ia32_emit_dbg(ia32_emit_env_t *env, const ir_node *node) {
1996         dbg_info *db = get_irn_dbg_info(node);
1997         unsigned lineno;
1998         const char *fname = be_retrieve_dbg_info(db, &lineno);
1999
2000         if (! env->cg->birg->main_env->options->stabs_debug_support)
2001                 return;
2002
2003         if (fname) {
2004                 if (last_name != fname) {
2005                         last_line = -1;
2006                         be_dbg_include_begin(env->cg->birg->main_env->db_handle, fname);
2007                         last_name = fname;
2008                 }
2009                 if (last_line != lineno) {
2010                         char name[64];
2011
2012                         snprintf(name, sizeof(name), ".LM%u", ++num);
2013                         last_line = lineno;
2014                         be_dbg_line(env->cg->birg->main_env->db_handle, lineno, name);
2015                         be_emit_string(env, name);
2016                         be_emit_cstring(env, ":\n");
2017                         be_emit_write_line(env);
2018                 }
2019         }
2020 }
2021
2022 typedef void (*emit_func_ptr) (ia32_emit_env_t *, const ir_node *);
2023
2024 /**
2025  * Emits code for a node.
2026  */
2027 static
2028 void ia32_emit_node(ia32_emit_env_t *env, const ir_node *node) {
2029         ir_op *op = get_irn_op(node);
2030
2031         DBG((dbg, LEVEL_1, "emitting code for %+F\n", node));
2032
2033         if (op->ops.generic) {
2034                 emit_func_ptr func = (emit_func_ptr) op->ops.generic;
2035                 ia32_emit_dbg(env, node);
2036                 (*func) (env, node);
2037         } else {
2038                 emit_Nothing(env, node);
2039                 ir_fprintf(stderr, "Warning: No emit handler for node %+F (%+G)\n", node, node);
2040         }
2041 }
2042
2043 /**
2044  * Emits gas alignment directives
2045  */
2046 static
2047 void ia32_emit_alignment(ia32_emit_env_t *env, unsigned align, unsigned skip) {
2048         be_emit_cstring(env, "\t.p2align ");
2049         be_emit_irprintf(env->emit, "%u,,%u\n", align, skip);
2050         be_emit_write_line(env);
2051 }
2052
2053 /**
2054  * Emits gas alignment directives for Functions depended on cpu architecture.
2055  */
2056 static
2057 void ia32_emit_align_func(ia32_emit_env_t *env, cpu_support cpu) {
2058         unsigned align;
2059         unsigned maximum_skip;
2060
2061         switch (cpu) {
2062                 case arch_i386:
2063                         align = 2;
2064                         break;
2065                 case arch_i486:
2066                         align = 4;
2067                         break;
2068                 case arch_k6:
2069                         align = 5;
2070                         break;
2071                 default:
2072                         align = 4;
2073         }
2074         maximum_skip = (1 << align) - 1;
2075         ia32_emit_alignment(env, align, maximum_skip);
2076 }
2077
2078 /**
2079  * Emits gas alignment directives for Labels depended on cpu architecture.
2080  */
2081 static
2082 void ia32_emit_align_label(ia32_emit_env_t *env, cpu_support cpu) {
2083         unsigned align; unsigned maximum_skip;
2084
2085         switch (cpu) {
2086                 case arch_i386:
2087                         align = 2;
2088                         break;
2089                 case arch_i486:
2090                         align = 4;
2091                         break;
2092                 case arch_k6:
2093                         align = 5;
2094                         break;
2095                 default:
2096                         align = 4;
2097         }
2098         maximum_skip = (1 << align) - 1;
2099         ia32_emit_alignment(env, align, maximum_skip);
2100 }
2101
2102 /**
2103  * Test wether a block should be aligned.
2104  * For cpus in the P4/Athlon class it is usefull to align jump labels to
2105  * 16 bytes. However we should only do that if the alignment nops before the
2106  * label aren't executed more often than we have jumps to the label.
2107  */
2108 static
2109 int should_align_block(ia32_emit_env_t *env, ir_node *block, ir_node *prev) {
2110         static const double DELTA = .0001;
2111         ir_exec_freq *exec_freq = env->cg->birg->exec_freq;
2112         double        block_freq;
2113         double        prev_freq = 0;  /**< execfreq of the fallthrough block */
2114         double        jmp_freq  = 0;  /**< execfreq of all non-fallthrough blocks */
2115         cpu_support   cpu       = env->isa->opt_arch;
2116         int           i, n_cfgpreds;
2117
2118         if(exec_freq == NULL)
2119                 return 0;
2120         if(cpu == arch_i386 || cpu == arch_i486)
2121                 return 0;
2122
2123         block_freq = get_block_execfreq(exec_freq, block);
2124         if(block_freq < DELTA)
2125                 return 0;
2126
2127         n_cfgpreds = get_Block_n_cfgpreds(block);
2128         for(i = 0; i < n_cfgpreds; ++i) {
2129                 ir_node *pred      = get_Block_cfgpred_block(block, i);
2130                 double   pred_freq = get_block_execfreq(exec_freq, pred);
2131
2132                 if(pred == prev) {
2133                         prev_freq += pred_freq;
2134                 } else {
2135                         jmp_freq  += pred_freq;
2136                 }
2137         }
2138
2139         if(prev_freq < DELTA && !(jmp_freq < DELTA))
2140                 return 1;
2141
2142         jmp_freq /= prev_freq;
2143
2144         switch (cpu) {
2145                 case arch_athlon:
2146                 case arch_athlon_64:
2147                 case arch_k6:
2148                         return jmp_freq > 3;
2149                 default:
2150                         return jmp_freq > 2;
2151         }
2152 }
2153
2154 static
2155 void ia32_emit_block_header(ia32_emit_env_t *env, ir_node *block, ir_node *prev)
2156 {
2157         int           n_cfgpreds;
2158         int           need_label;
2159         int           i, arity;
2160         ir_exec_freq  *exec_freq = env->cg->birg->exec_freq;
2161
2162         need_label = 1;
2163         n_cfgpreds = get_Block_n_cfgpreds(block);
2164         if (n_cfgpreds == 0) {
2165                 need_label = 0;
2166         } else if (n_cfgpreds == 1) {
2167                 ir_node *pred       = get_Block_cfgpred(block, 0);
2168                 ir_node *pred_block = get_nodes_block(pred);
2169
2170                 /* we don't need labels for fallthrough blocks, however switch-jmps
2171                  * are no fallthoughs */
2172                 if(pred_block == prev &&
2173                                 !(is_Proj(pred) && is_ia32_SwitchJmp(get_Proj_pred(pred)))) {
2174                         need_label = 0;
2175                 } else {
2176                         need_label = 1;
2177                 }
2178         } else {
2179                 need_label = 1;
2180         }
2181
2182         if (should_align_block(env, block, prev)) {
2183                 assert(need_label);
2184                 ia32_emit_align_label(env, env->isa->opt_arch);
2185         }
2186
2187         if(need_label) {
2188                 ia32_emit_block_name(env, block);
2189                 be_emit_char(env, ':');
2190
2191                 be_emit_pad_comment(env);
2192                 be_emit_cstring(env, "   /* preds:");
2193
2194                 /* emit list of pred blocks in comment */
2195                 arity = get_irn_arity(block);
2196                 for (i = 0; i < arity; ++i) {
2197                         ir_node *predblock = get_Block_cfgpred_block(block, i);
2198                         be_emit_irprintf(env->emit, " %d", get_irn_node_nr(predblock));
2199                 }
2200         } else {
2201                 be_emit_cstring(env, "\t/* ");
2202                 ia32_emit_block_name(env, block);
2203                 be_emit_cstring(env, ": ");
2204         }
2205         if (exec_freq != NULL) {
2206                 be_emit_irprintf(env->emit, " freq: %f",
2207                                  get_block_execfreq(exec_freq, block));
2208         }
2209         be_emit_cstring(env, " */\n");
2210         be_emit_write_line(env);
2211 }
2212
2213 /**
2214  * Walks over the nodes in a block connected by scheduling edges
2215  * and emits code for each node.
2216  */
2217 static
2218 void ia32_gen_block(ia32_emit_env_t *env, ir_node *block, ir_node *last_block)
2219 {
2220         const ir_node *node;
2221
2222         ia32_emit_block_header(env, block, last_block);
2223
2224         /* emit the contents of the block */
2225         ia32_emit_dbg(env, block);
2226         sched_foreach(block, node) {
2227                 ia32_emit_node(env, node);
2228         }
2229 }
2230
2231 /**
2232  * Emits code for function start.
2233  */
2234 static
2235 void ia32_emit_func_prolog(ia32_emit_env_t *env, ir_graph *irg) {
2236         ir_entity  *irg_ent  = get_irg_entity(irg);
2237         const char *irg_name = get_entity_ld_name(irg_ent);
2238         cpu_support cpu      = env->isa->opt_arch;
2239         const be_irg_t *birg = env->cg->birg;
2240
2241         be_emit_write_line(env);
2242         be_gas_emit_switch_section(env->emit, GAS_SECTION_TEXT);
2243         be_dbg_method_begin(birg->main_env->db_handle, irg_ent, be_abi_get_stack_layout(birg->abi));
2244         ia32_emit_align_func(env, cpu);
2245         if (get_entity_visibility(irg_ent) == visibility_external_visible) {
2246                 be_emit_cstring(env, ".global ");
2247                 be_emit_string(env, irg_name);
2248                 be_emit_char(env, '\n');
2249                 be_emit_write_line(env);
2250         }
2251         ia32_emit_function_object(env, irg_name);
2252         be_emit_string(env, irg_name);
2253         be_emit_cstring(env, ":\n");
2254         be_emit_write_line(env);
2255 }
2256
2257 /**
2258  * Emits code for function end
2259  */
2260 static
2261 void ia32_emit_func_epilog(ia32_emit_env_t *env, ir_graph *irg) {
2262         const char *irg_name = get_entity_ld_name(get_irg_entity(irg));
2263         const be_irg_t *birg = env->cg->birg;
2264
2265         ia32_emit_function_size(env, irg_name);
2266         be_dbg_method_end(birg->main_env->db_handle);
2267         be_emit_char(env, '\n');
2268         be_emit_write_line(env);
2269 }
2270
2271 /**
2272  * Block-walker:
2273  * Sets labels for control flow nodes (jump target)
2274  */
2275 static
2276 void ia32_gen_labels(ir_node *block, void *data) {
2277         ir_node *pred;
2278         int n = get_Block_n_cfgpreds(block);
2279
2280         for (n--; n >= 0; n--) {
2281                 pred = get_Block_cfgpred(block, n);
2282                 set_irn_link(pred, block);
2283         }
2284 }
2285
2286 /**
2287  * Emit an exception label if the current instruction can fail.
2288  */
2289 void ia32_emit_exc_label(ia32_emit_env_t *env, const ir_node *node) {
2290         if (get_ia32_exc_label(node)) {
2291                 be_emit_irprintf(env->emit, ".EXL%u\n", 0);
2292                 be_emit_write_line(env);
2293         }
2294 }
2295
2296 /**
2297  * Main driver. Emits the code for one routine.
2298  */
2299 void ia32_gen_routine(ia32_code_gen_t *cg, ir_graph *irg) {
2300         ia32_emit_env_t env;
2301         ir_node *block;
2302         ir_node *last_block = NULL;
2303         int i, n;
2304
2305         env.isa      = (ia32_isa_t *)cg->arch_env->isa;
2306         env.emit     = &env.isa->emit;
2307         env.arch_env = cg->arch_env;
2308         env.cg       = cg;
2309
2310         ia32_register_emitters();
2311
2312         ia32_emit_func_prolog(&env, irg);
2313         irg_block_walk_graph(irg, ia32_gen_labels, NULL, &env);
2314
2315         n = ARR_LEN(cg->blk_sched);
2316         for (i = 0; i < n;) {
2317                 ir_node *next_bl;
2318
2319                 block   = cg->blk_sched[i];
2320                 ++i;
2321                 next_bl = i < n ? cg->blk_sched[i] : NULL;
2322
2323                 /* set here the link. the emitter expects to find the next block here */
2324                 set_irn_link(block, next_bl);
2325                 ia32_gen_block(&env, block, last_block);
2326                 last_block = block;
2327         }
2328
2329         ia32_emit_func_epilog(&env, irg);
2330 }
2331
2332 void ia32_init_emitter(void)
2333 {
2334         FIRM_DBG_REGISTER(dbg, "firm.be.ia32.emitter");
2335 }