finish support for custom backend node attributes, separate x87 attributes from norma...
[libfirm] / ir / be / ia32 / ia32_emitter.c
1 /*
2  * Copyright (C) 1995-2007 University of Karlsruhe.  All right reserved.
3  *
4  * This file is part of libFirm.
5  *
6  * This file may be distributed and/or modified under the terms of the
7  * GNU General Public License version 2 as published by the Free Software
8  * Foundation and appearing in the file LICENSE.GPL included in the
9  * packaging of this file.
10  *
11  * Licensees holding valid libFirm Professional Edition licenses may use
12  * this file in accordance with the libFirm Commercial License.
13  * Agreement provided with the Software.
14  *
15  * This file is provided AS IS with NO WARRANTY OF ANY KIND, INCLUDING THE
16  * WARRANTY OF DESIGN, MERCHANTABILITY AND FITNESS FOR A PARTICULAR
17  * PURPOSE.
18  */
19
20 /**
21  * @file
22  * @brief       This file implements the ia32 node emitter.
23  * @author      Christian Wuerdig, Matthias Braun
24  * @version     $Id$
25  */
26 #ifdef HAVE_CONFIG_H
27 #include "config.h"
28 #endif
29
30 #include <limits.h>
31
32 #include "xmalloc.h"
33 #include "tv.h"
34 #include "iredges.h"
35 #include "debug.h"
36 #include "irgwalk.h"
37 #include "irprintf.h"
38 #include "irop_t.h"
39 #include "irargs_t.h"
40 #include "irprog_t.h"
41 #include "iredges_t.h"
42 #include "execfreq.h"
43 #include "error.h"
44 #include "raw_bitset.h"
45
46 #include "../besched_t.h"
47 #include "../benode_t.h"
48 #include "../beabi.h"
49 #include "../be_dbgout.h"
50 #include "../beemitter.h"
51 #include "../begnuas.h"
52 #include "../beirg_t.h"
53
54 #include "ia32_emitter.h"
55 #include "gen_ia32_emitter.h"
56 #include "gen_ia32_regalloc_if.h"
57 #include "ia32_nodes_attr.h"
58 #include "ia32_new_nodes.h"
59 #include "ia32_map_regs.h"
60 #include "bearch_ia32_t.h"
61
62 DEBUG_ONLY(static firm_dbg_module_t *dbg = NULL;)
63
64 #define BLOCK_PREFIX ".L"
65
66 #define SNPRINTF_BUF_LEN 128
67
68 /**
69  * Returns the register at in position pos.
70  */
71 static
72 const arch_register_t *get_in_reg(ia32_emit_env_t *env, const ir_node *irn,
73                                   int pos)
74 {
75         const arch_env_t       *arch_env = env->arch_env;
76         ir_node                *op;
77         const arch_register_t  *reg = NULL;
78
79         assert(get_irn_arity(irn) > pos && "Invalid IN position");
80
81         /* The out register of the operator at position pos is the
82            in register we need. */
83         op = get_irn_n(irn, pos);
84
85         reg = arch_get_irn_register(arch_env, op);
86
87         assert(reg && "no in register found");
88
89         /* in case of a joker register: just return a valid register */
90         if (arch_register_type_is(reg, joker)) {
91                 const arch_register_req_t *req;
92
93                 /* ask for the requirements */
94                 req = arch_get_register_req(arch_env, irn, pos);
95
96                 if (arch_register_req_is(req, limited)) {
97                         /* in case of limited requirements: get the first allowed register */
98                         unsigned idx = rbitset_next(req->limited, 0, 1);
99                         reg = arch_register_for_index(req->cls, idx);
100                 } else {
101                         /* otherwise get first register in class */
102                         reg = arch_register_for_index(req->cls, 0);
103                 }
104         }
105
106         return reg;
107 }
108
109 /**
110  * Returns the register at out position pos.
111  */
112 static
113 const arch_register_t *get_out_reg(ia32_emit_env_t *env, const ir_node *irn,
114                                    int pos)
115 {
116         const arch_env_t      *arch_env = env->arch_env;
117         ir_node               *proj;
118         const arch_register_t *reg = NULL;
119
120         /* 1st case: irn is not of mode_T, so it has only                 */
121         /*           one OUT register -> good                             */
122         /* 2nd case: irn is of mode_T -> collect all Projs and ask the    */
123         /*           Proj with the corresponding projnum for the register */
124
125         if (get_irn_mode(irn) != mode_T) {
126                 reg = arch_get_irn_register(arch_env, irn);
127         } else if (is_ia32_irn(irn)) {
128                 reg = get_ia32_out_reg(irn, pos);
129         } else {
130                 const ir_edge_t *edge;
131
132                 foreach_out_edge(irn, edge) {
133                         proj = get_edge_src_irn(edge);
134                         assert(is_Proj(proj) && "non-Proj from mode_T node");
135                         if (get_Proj_proj(proj) == pos) {
136                                 reg = arch_get_irn_register(arch_env, proj);
137                                 break;
138                         }
139                 }
140         }
141
142         assert(reg && "no out register found");
143         return reg;
144 }
145
146 /**
147  * Determine the gnu assembler suffix that indicates a mode
148  */
149 static
150 char get_mode_suffix(const ir_mode *mode) {
151         if(mode_is_float(mode)) {
152                 switch(get_mode_size_bits(mode)) {
153                 case 32:
154                         return 's';
155                 case 64:
156                         return 'l';
157                 case 80:
158                         return 't';
159                 }
160         } else {
161                 assert(mode_is_int(mode) || mode_is_reference(mode) || mode_is_character(mode));
162                 switch(get_mode_size_bits(mode)) {
163                 case 64:
164                         return 'q';
165                 case 32:
166                         return 'l';
167                 case 16:
168                         return 'w';
169                 case 8:
170                         return 'b';
171                 }
172         }
173         panic("Can't output mode_suffix for %+F\n", mode);
174 }
175
176 static
177 int produces_result(const ir_node *node) {
178         return !(is_ia32_St(node) ||
179                 is_ia32_CondJmp(node) ||
180                 is_ia32_xCondJmp(node) ||
181                 is_ia32_CmpSet(node) ||
182                 is_ia32_xCmpSet(node) ||
183                 is_ia32_SwitchJmp(node));
184 }
185
186 static
187 const char *ia32_get_reg_name_for_mode(ia32_emit_env_t *env, ir_mode *mode,
188                                        const arch_register_t *reg) {
189         switch(get_mode_size_bits(mode)) {
190                 case 8:
191                         return ia32_get_mapped_reg_name(env->isa->regs_8bit, reg);
192                 case 16:
193                         return ia32_get_mapped_reg_name(env->isa->regs_16bit, reg);
194                 default:
195                         return (char *)arch_register_get_name(reg);
196         }
197 }
198
199 /**
200  * Add a number to a prefix. This number will not be used a second time.
201  */
202 static
203 char *get_unique_label(char *buf, size_t buflen, const char *prefix) {
204         static unsigned long id = 0;
205         snprintf(buf, buflen, "%s%lu", prefix, ++id);
206         return buf;
207 }
208
209 /*************************************************************
210  *             _       _    __   _          _
211  *            (_)     | |  / _| | |        | |
212  *  _ __  _ __ _ _ __ | |_| |_  | |__   ___| |_ __   ___ _ __
213  * | '_ \| '__| | '_ \| __|  _| | '_ \ / _ \ | '_ \ / _ \ '__|
214  * | |_) | |  | | | | | |_| |   | | | |  __/ | |_) |  __/ |
215  * | .__/|_|  |_|_| |_|\__|_|   |_| |_|\___|_| .__/ \___|_|
216  * | |                                       | |
217  * |_|                                       |_|
218  *************************************************************/
219
220 // we have no C++ and can't define an implicit ia32_emit_env_t* cast to
221 // be_emit_env_t* so we cheat a bit...
222 #define be_emit_char(env,c)             be_emit_char(env->emit,c)
223 #define be_emit_string(env,s)           be_emit_string(env->emit,s)
224 #undef be_emit_cstring
225 #define be_emit_cstring(env,x)          { be_emit_string_len(env->emit, x, sizeof(x)-1); }
226 #define be_emit_ident(env,i)            be_emit_ident(env->emit,i)
227 #define be_emit_tarval(env,tv)          be_emit_tarval(env->emit,tv)
228 #define be_emit_write_line(env)         be_emit_write_line(env->emit)
229 #define be_emit_finish_line_gas(env,n)  be_emit_finish_line_gas(env->emit,n)
230 #define be_emit_pad_comment(env)        be_emit_pad_comment(env->emit)
231
232 void ia32_emit_source_register(ia32_emit_env_t *env, const ir_node *node, int pos)
233 {
234         const arch_register_t *reg = get_in_reg(env, node, pos);
235         const char *reg_name = arch_register_get_name(reg);
236
237         assert(pos < get_irn_arity(node));
238
239         be_emit_char(env, '%');
240         be_emit_string(env, reg_name);
241 }
242
243 void ia32_emit_dest_register(ia32_emit_env_t *env, const ir_node *node, int pos) {
244         const arch_register_t *reg = get_out_reg(env, node, pos);
245         const char *reg_name = arch_register_get_name(reg);
246
247         be_emit_char(env, '%');
248         be_emit_string(env, reg_name);
249 }
250
251 void ia32_emit_x87_name(ia32_emit_env_t *env, const ir_node *node, int pos)
252 {
253         const ia32_x87_attr_t *attr = get_ia32_x87_attr_const(node);
254
255         assert(pos < 3);
256         be_emit_char(env, '%');
257         be_emit_string(env, attr->x87[pos]->name);
258 }
259
260 void ia32_emit_immediate(ia32_emit_env_t *env, const ir_node *node)
261 {
262         tarval *tv;
263         ir_entity *ent;
264         ident *id;
265
266         be_emit_char(env, '$');
267
268         switch(get_ia32_immop_type(node)) {
269         case ia32_ImmConst:
270                 tv = get_ia32_Immop_tarval(node);
271                 be_emit_tarval(env, tv);
272                 return;
273         case ia32_ImmSymConst:
274                 ent = get_ia32_Immop_symconst(node);
275                 mark_entity_visited(ent);
276                 id = get_entity_ld_ident(ent);
277                 be_emit_ident(env, id);
278                 return;
279         case ia32_ImmAsm:
280         case ia32_ImmNone:
281                 break;
282         }
283
284         assert(0);
285         be_emit_string(env, "BAD");
286         return;
287 }
288
289 static
290 void ia32_emit_mode_suffix_mode(ia32_emit_env_t *env, const ir_mode *mode)
291 {
292         be_emit_char(env, get_mode_suffix(mode));
293 }
294
295 void ia32_emit_mode_suffix(ia32_emit_env_t *env, const ir_node *node)
296 {
297         ir_mode *mode = get_ia32_ls_mode(node);
298         if(mode == NULL)
299                 mode = mode_Iu;
300
301         ia32_emit_mode_suffix_mode(env, mode);
302 }
303
304 void ia32_emit_x87_mode_suffix(ia32_emit_env_t *env, const ir_node *node)
305 {
306         ir_mode *mode = get_ia32_ls_mode(node);
307         if(mode != NULL)
308                 ia32_emit_mode_suffix_mode(env, mode);
309 }
310
311 static
312 char get_xmm_mode_suffix(ir_mode *mode)
313 {
314         assert(mode_is_float(mode));
315         switch(get_mode_size_bits(mode)) {
316         case 32:
317                 return 's';
318         case 64:
319                 return 'd';
320         default:
321                 assert(0);
322         }
323         return '%';
324 }
325
326 void ia32_emit_xmm_mode_suffix(ia32_emit_env_t *env, const ir_node *node)
327 {
328         ir_mode *mode = get_ia32_ls_mode(node);
329         assert(mode != NULL);
330         be_emit_char(env, 's');
331         be_emit_char(env, get_xmm_mode_suffix(mode));
332 }
333
334 void ia32_emit_xmm_mode_suffix_s(ia32_emit_env_t *env, const ir_node *node)
335 {
336         ir_mode *mode = get_ia32_ls_mode(node);
337         assert(mode != NULL);
338         be_emit_char(env, get_xmm_mode_suffix(mode));
339 }
340
341 void ia32_emit_extend_suffix(ia32_emit_env_t *env, const ir_mode *mode)
342 {
343         if(get_mode_size_bits(mode) == 32)
344                 return;
345         if(mode_is_signed(mode)) {
346                 be_emit_char(env, 's');
347         } else {
348                 be_emit_char(env, 'z');
349         }
350 }
351
352 static
353 void ia32_emit_function_object(ia32_emit_env_t *env, const char *name)
354 {
355         switch (be_gas_flavour) {
356         case GAS_FLAVOUR_NORMAL:
357                 be_emit_cstring(env, "\t.type\t");
358                 be_emit_string(env, name);
359                 be_emit_cstring(env, ", @function\n");
360                 be_emit_write_line(env);
361                 break;
362         case GAS_FLAVOUR_MINGW:
363                 be_emit_cstring(env, "\t.def\t");
364                 be_emit_string(env, name);
365                 be_emit_cstring(env, ";\t.scl\t2;\t.type\t32;\t.endef\n");
366                 be_emit_write_line(env);
367                 break;
368         default:
369                 break;
370         }
371 }
372
373 static
374 void ia32_emit_function_size(ia32_emit_env_t *env, const char *name)
375 {
376         switch (be_gas_flavour) {
377         case GAS_FLAVOUR_NORMAL:
378                 be_emit_cstring(env, "\t.size\t");
379                 be_emit_string(env, name);
380                 be_emit_cstring(env, ", .-");
381                 be_emit_string(env, name);
382                 be_emit_char(env, '\n');
383                 be_emit_write_line(env);
384                 break;
385         default:
386                 break;
387         }
388 }
389
390
391
392 /**
393  * Emits registers and/or address mode of a binary operation.
394  */
395 void ia32_emit_binop(ia32_emit_env_t *env, const ir_node *node) {
396         switch(get_ia32_op_type(node)) {
397                 case ia32_Normal:
398                         if (is_ia32_ImmConst(node) || is_ia32_ImmSymConst(node)) {
399                                 ia32_emit_immediate(env, node);
400                                 be_emit_cstring(env, ", ");
401                                 ia32_emit_source_register(env, node, 2);
402                         } else {
403                                 const arch_register_t *in1 = get_in_reg(env, node, 2);
404                                 const arch_register_t *in2 = get_in_reg(env, node, 3);
405                                 const arch_register_t *out = produces_result(node) ? get_out_reg(env, node, 0) : NULL;
406                                 const arch_register_t *in;
407                                 const char            *in_name;
408
409                                 in      = out ? (REGS_ARE_EQUAL(out, in2) ? in1 : in2) : in2;
410                                 out     = out ? out : in1;
411                                 in_name = arch_register_get_name(in);
412
413                                 if (is_ia32_emit_cl(node)) {
414                                         assert(REGS_ARE_EQUAL(&ia32_gp_regs[REG_ECX], in) && "shift operation needs ecx");
415                                         in_name = "cl";
416                                 }
417
418                                 be_emit_char(env, '%');
419                                 be_emit_string(env, in_name);
420                                 be_emit_cstring(env, ", %");
421                                 be_emit_string(env, arch_register_get_name(out));
422                         }
423                         break;
424                 case ia32_AddrModeS:
425                         ia32_emit_am(env, node);
426                         be_emit_cstring(env, ", ");
427                         if (is_ia32_ImmConst(node) || is_ia32_ImmSymConst(node)) {
428                                 assert(!produces_result(node) && "Source AM with Const must not produce result");
429                                 ia32_emit_immediate(env, node);
430                         } else if (produces_result(node)) {
431                                 ia32_emit_dest_register(env, node, 0);
432                         } else {
433                                 ia32_emit_source_register(env, node, 2);
434                         }
435                         break;
436                 case ia32_AddrModeD:
437                         if (is_ia32_ImmConst(node) || is_ia32_ImmSymConst(node)) {
438                                 ia32_emit_immediate(env, node);
439                                 be_emit_cstring(env, ", ");
440                                 ia32_emit_am(env, node);
441                         } else {
442                                 const arch_register_t *in1 = get_in_reg(env, node,
443                                                                         get_irn_arity(node) == 5 ? 3 : 2);
444                                 ir_mode               *mode = get_ia32_ls_mode(node);
445                                 const char            *in_name;
446
447                                 in_name = ia32_get_reg_name_for_mode(env, mode, in1);
448
449                                 if (is_ia32_emit_cl(node)) {
450                                         assert(REGS_ARE_EQUAL(&ia32_gp_regs[REG_ECX], in1) && "shift operation needs ecx");
451                                         in_name = "cl";
452                                 }
453
454                                 be_emit_char(env, '%');
455                                 be_emit_string(env, in_name);
456                                 be_emit_cstring(env, ", ");
457                                 ia32_emit_am(env, node);
458                         }
459                         break;
460                 default:
461                         assert(0 && "unsupported op type");
462         }
463 }
464
465 /**
466  * Emits registers and/or address mode of a binary operation.
467  */
468 void ia32_emit_x87_binop(ia32_emit_env_t *env, const ir_node *node) {
469         switch(get_ia32_op_type(node)) {
470                 case ia32_Normal:
471                         if (is_ia32_ImmConst(node) || is_ia32_ImmSymConst(node)) {
472                                 // should not happen...
473                                 assert(0);
474                         } else {
475                                 const ia32_x87_attr_t *x87_attr = get_ia32_x87_attr_const(node);
476                                 const arch_register_t *in1      = x87_attr->x87[0];
477                                 const arch_register_t *in2      = x87_attr->x87[1];
478                                 const arch_register_t *out      = x87_attr->x87[2];
479                                 const arch_register_t *in;
480
481                                 in  = out ? (REGS_ARE_EQUAL(out, in2) ? in1 : in2) : in2;
482                                 out = out ? out : in1;
483
484                                 be_emit_char(env, '%');
485                                 be_emit_string(env, arch_register_get_name(in));
486                                 be_emit_cstring(env, ", %");
487                                 be_emit_string(env, arch_register_get_name(out));
488                         }
489                         break;
490                 case ia32_AddrModeS:
491                 case ia32_AddrModeD:
492                         ia32_emit_am(env, node);
493                         break;
494                 default:
495                         assert(0 && "unsupported op type");
496         }
497 }
498
499 /**
500  * Emits registers and/or address mode of a unary operation.
501  */
502 void ia32_emit_unop(ia32_emit_env_t *env, const ir_node *node) {
503         switch(get_ia32_op_type(node)) {
504                 case ia32_Normal:
505                         if (is_ia32_ImmConst(node) || is_ia32_ImmSymConst(node)) {
506                                 ia32_emit_immediate(env, node);
507                         } else {
508                                 if (is_ia32_Mul(node) || is_ia32_IMul1OP(node)) {
509                                         ia32_emit_source_register(env, node, 3);
510                                 } else if(is_ia32_IDiv(node) || is_ia32_Div(node)) {
511                                         ia32_emit_source_register(env, node, 4);
512                                 } else if(is_ia32_Push(node)) {
513                                         ia32_emit_source_register(env, node, 2);
514                                 } else if(is_ia32_Pop(node)) {
515                                         ia32_emit_dest_register(env, node, 1);
516                                 } else {
517                                         ia32_emit_dest_register(env, node, 0);
518                                 }
519                         }
520                         break;
521                 case ia32_AddrModeS:
522                 case ia32_AddrModeD:
523                         ia32_emit_am(env, node);
524                         break;
525                 default:
526                         assert(0 && "unsupported op type");
527         }
528 }
529
530 /**
531  * Emits address mode.
532  */
533 void ia32_emit_am(ia32_emit_env_t *env, const ir_node *node) {
534         ir_entity *ent       = get_ia32_am_sc(node);
535         int        offs      = get_ia32_am_offs_int(node);
536         ir_node   *base      = get_irn_n(node, 0);
537         int        has_base  = !is_ia32_NoReg_GP(base);
538         ir_node   *index     = get_irn_n(node, 1);
539         int        has_index = !is_ia32_NoReg_GP(index);
540
541         /* just to be sure... */
542         assert(!is_ia32_use_frame(node) || get_ia32_frame_ent(node) != NULL);
543
544         /* emit offset */
545         if (ent != NULL) {
546                 ident *id;
547
548                 mark_entity_visited(ent);
549                 id = get_entity_ld_ident(ent);
550                 if (is_ia32_am_sc_sign(node))
551                         be_emit_char(env, '-');
552                 be_emit_ident(env, id);
553
554                 if(get_entity_owner(ent) == get_tls_type()) {
555                         if (get_entity_visibility(ent) == visibility_external_allocated) {
556                                 be_emit_cstring(env, "@INDNTPOFF");
557                         } else {
558                                 be_emit_cstring(env, "@NTPOFF");
559                         }
560                 }
561         }
562
563         if(offs != 0) {
564                 if(ent != NULL) {
565                         be_emit_irprintf(env->emit, "%+d", offs);
566                 } else {
567                         be_emit_irprintf(env->emit, "%d", offs);
568                 }
569         }
570
571         if (has_base || has_index) {
572                 be_emit_char(env, '(');
573
574                 /* emit base */
575                 if (has_base) {
576                         ia32_emit_source_register(env, node, 0);
577                 }
578
579                 /* emit index + scale */
580                 if (has_index) {
581                         int scale;
582                         be_emit_char(env, ',');
583                         ia32_emit_source_register(env, node, 1);
584
585                         scale = get_ia32_am_scale(node);
586                         if (scale > 0) {
587                                 be_emit_irprintf(env->emit, ",%d", 1 << get_ia32_am_scale(node));
588                         }
589                 }
590                 be_emit_char(env, ')');
591         }
592 }
593
594 /*************************************************
595  *                 _ _                         _
596  *                (_) |                       | |
597  *   ___ _ __ ___  _| |_    ___ ___  _ __   __| |
598  *  / _ \ '_ ` _ \| | __|  / __/ _ \| '_ \ / _` |
599  * |  __/ | | | | | | |_  | (_| (_) | | | | (_| |
600  *  \___|_| |_| |_|_|\__|  \___\___/|_| |_|\__,_|
601  *
602  *************************************************/
603
604 #undef IA32_DO_EMIT
605 #define IA32_DO_EMIT(irn) ia32_fprintf_format(F, irn, cmd_buf, cmnt_buf)
606
607 /*
608  * coding of conditions
609  */
610 struct cmp2conditon_t {
611         const char *name;
612         pn_Cmp      num;
613 };
614
615 /*
616  * positive conditions for signed compares
617  */
618 static
619 const struct cmp2conditon_t cmp2condition_s[] = {
620         { NULL,              pn_Cmp_False },  /* always false */
621         { "e",               pn_Cmp_Eq },     /* == */
622         { "l",               pn_Cmp_Lt },     /* < */
623         { "le",              pn_Cmp_Le },     /* <= */
624         { "g",               pn_Cmp_Gt },     /* > */
625         { "ge",              pn_Cmp_Ge },     /* >= */
626         { "ne",              pn_Cmp_Lg },     /* != */
627         { NULL,              pn_Cmp_Leg},     /* Floating point: ordered */
628         { NULL,              pn_Cmp_Uo },     /* Floating point: unordered */
629         { "e",               pn_Cmp_Ue },     /* Floating point: unordered or == */
630         { "b",               pn_Cmp_Ul },     /* Floating point: unordered or < */
631         { "be",              pn_Cmp_Ule },    /* Floating point: unordered or <= */
632         { "a",               pn_Cmp_Ug },     /* Floating point: unordered or > */
633         { "ae",              pn_Cmp_Uge },    /* Floating point: unordered or >= */
634         { "ne",              pn_Cmp_Ne },     /* Floating point: unordered or != */
635         { NULL,              pn_Cmp_True },   /* always true */
636 };
637
638 /*
639  * positive conditions for unsigned compares
640  */
641 static
642 const struct cmp2conditon_t cmp2condition_u[] = {
643         { NULL,              pn_Cmp_False },  /* always false */
644         { "e",               pn_Cmp_Eq },     /* == */
645         { "b",               pn_Cmp_Lt },     /* < */
646         { "be",              pn_Cmp_Le },     /* <= */
647         { "a",               pn_Cmp_Gt },     /* > */
648         { "ae",              pn_Cmp_Ge },     /* >= */
649         { "ne",              pn_Cmp_Lg },     /* != */
650         { NULL,              pn_Cmp_True },   /* always true */
651 };
652
653 /*
654  * returns the condition code
655  */
656 static
657 const char *get_cmp_suffix(int cmp_code)
658 {
659         assert( (cmp2condition_s[cmp_code & 15].num) == (cmp_code & 15));
660         assert( (cmp2condition_u[cmp_code & 7].num) == (cmp_code & 7));
661
662         if((cmp_code & ia32_pn_Cmp_Unsigned)) {
663                 return cmp2condition_u[cmp_code & 7].name;
664         } else {
665                 return cmp2condition_s[cmp_code & 15].name;
666         }
667 }
668
669 void ia32_emit_cmp_suffix(ia32_emit_env_t *env, long pnc)
670 {
671         be_emit_string(env, get_cmp_suffix(pnc));
672 }
673
674
675 /**
676  * Returns the target block for a control flow node.
677  */
678 static
679 ir_node *get_cfop_target_block(const ir_node *irn) {
680         return get_irn_link(irn);
681 }
682
683 static
684 void ia32_emit_block_name(ia32_emit_env_t *env, const ir_node *block)
685 {
686         be_emit_cstring(env, BLOCK_PREFIX);
687         be_emit_irprintf(env->emit, "%d", get_irn_node_nr(block));
688 }
689
690 /**
691  * Returns the target label for a control flow node.
692  */
693 static
694 void ia32_emit_cfop_target(ia32_emit_env_t * env, const ir_node *node) {
695         ir_node *block = get_cfop_target_block(node);
696
697         ia32_emit_block_name(env, block);
698 }
699
700 /** Return the next block in Block schedule */
701 static ir_node *next_blk_sched(const ir_node *block) {
702         return get_irn_link(block);
703 }
704
705 /**
706  * Returns the Proj with projection number proj and NOT mode_M
707  */
708 static
709 ir_node *get_proj(const ir_node *node, long proj) {
710         const ir_edge_t *edge;
711         ir_node         *src;
712
713         assert(get_irn_mode(node) == mode_T && "expected mode_T node");
714
715         foreach_out_edge(node, edge) {
716                 src = get_edge_src_irn(edge);
717
718                 assert(is_Proj(src) && "Proj expected");
719                 if (get_irn_mode(src) == mode_M)
720                         continue;
721
722                 if (get_Proj_proj(src) == proj)
723                         return src;
724         }
725         return NULL;
726 }
727
728 /**
729  * Emits the jump sequence for a conditional jump (cmp + jmp_true + jmp_false)
730  */
731 static
732 void finish_CondJmp(ia32_emit_env_t *env, const ir_node *node, ir_mode *mode,
733                     long pnc) {
734         const ir_node *proj_true;
735         const ir_node *proj_false;
736         const ir_node *block;
737         const ir_node *next_block;
738         int flipped = 0;
739
740         /* get both Proj's */
741         proj_true = get_proj(node, pn_Cond_true);
742         assert(proj_true && "CondJmp without true Proj");
743
744         proj_false = get_proj(node, pn_Cond_false);
745         assert(proj_false && "CondJmp without false Proj");
746
747         /* for now, the code works for scheduled and non-schedules blocks */
748         block = get_nodes_block(node);
749
750         /* we have a block schedule */
751         next_block = next_blk_sched(block);
752
753         if (get_cfop_target_block(proj_true) == next_block) {
754                 /* exchange both proj's so the second one can be omitted */
755                 const ir_node *t = proj_true;
756
757                 proj_true  = proj_false;
758                 proj_false = t;
759                 flipped    = 1;
760                 pnc        = get_negated_pnc(pnc, mode);
761         }
762
763         /* in case of unordered compare, check for parity */
764         if (pnc & pn_Cmp_Uo) {
765                 be_emit_cstring(env, "\tjp ");
766                 ia32_emit_cfop_target(env, proj_true);
767                 be_emit_finish_line_gas(env, proj_true);
768         }
769
770         be_emit_cstring(env, "\tj");
771         ia32_emit_cmp_suffix(env, pnc);
772         be_emit_char(env, ' ');
773         ia32_emit_cfop_target(env, proj_true);
774         be_emit_finish_line_gas(env, proj_true);
775
776         /* the second Proj might be a fallthrough */
777         if (get_cfop_target_block(proj_false) != next_block) {
778                 be_emit_cstring(env, "\tjmp ");
779                 ia32_emit_cfop_target(env, proj_false);
780                 be_emit_finish_line_gas(env, proj_false);
781         } else {
782                 be_emit_cstring(env, "\t/* fallthrough to ");
783                 ia32_emit_cfop_target(env, proj_false);
784                 be_emit_cstring(env, " */");
785                 be_emit_finish_line_gas(env, proj_false);
786         }
787 }
788
789 /**
790  * Emits code for conditional jump.
791  */
792 static
793 void CondJmp_emitter(ia32_emit_env_t *env, const ir_node *node) {
794         be_emit_cstring(env, "\tcmp ");
795         ia32_emit_binop(env, node);
796         be_emit_finish_line_gas(env, node);
797
798         finish_CondJmp(env, node, mode_Iu, get_ia32_pncode(node));
799 }
800
801 /**
802  * Emits code for conditional jump with two variables.
803  */
804 static
805 void emit_ia32_CondJmp(ia32_emit_env_t *env, const ir_node *node) {
806         CondJmp_emitter(env, node);
807 }
808
809 /**
810  * Emits code for conditional test and jump.
811  */
812 static
813 void TestJmp_emitter(ia32_emit_env_t *env, const ir_node *node) {
814         if(is_ia32_ImmSymConst(node) || is_ia32_ImmConst(node)) {
815                 be_emit_cstring(env, "\ttest ");
816                 ia32_emit_immediate(env, node);
817                 be_emit_cstring(env, ", ");
818                 ia32_emit_source_register(env, node, 0);
819                 be_emit_finish_line_gas(env, node);
820         } else {
821                 be_emit_cstring(env, "\ttest ");
822                 ia32_emit_source_register(env, node, 1);
823                 be_emit_cstring(env, ", ");
824                 ia32_emit_source_register(env, node, 0);
825                 be_emit_finish_line_gas(env, node);
826         }
827         finish_CondJmp(env, node, mode_Iu, get_ia32_pncode(node));
828 }
829
830 /**
831  * Emits code for conditional test and jump with two variables.
832  */
833 static
834 void emit_ia32_TestJmp(ia32_emit_env_t *env, const ir_node *node) {
835         TestJmp_emitter(env, node);
836 }
837
838 static
839 void emit_ia32_CJmp(ia32_emit_env_t *env, const ir_node *node) {
840         be_emit_cstring(env, "/* omitted redundant test */");
841         be_emit_finish_line_gas(env, node);
842
843         finish_CondJmp(env, node, mode_Is, get_ia32_pncode(node));
844 }
845
846 static
847 void emit_ia32_CJmpAM(ia32_emit_env_t *env, const ir_node *node) {
848         be_emit_cstring(env, "/* omitted redundant test/cmp */");
849         be_emit_finish_line_gas(env, node);
850
851         finish_CondJmp(env, node, mode_Is, get_ia32_pncode(node));
852 }
853
854 /**
855  * Emits code for conditional SSE floating point jump with two variables.
856  */
857 static
858 void emit_ia32_xCondJmp(ia32_emit_env_t *env, const ir_node *node) {
859         be_emit_cstring(env, "\tucomi");
860         ia32_emit_xmm_mode_suffix(env, node);
861         be_emit_char(env, ' ');
862         ia32_emit_binop(env, node);
863         be_emit_finish_line_gas(env, node);
864
865         finish_CondJmp(env, node, mode_F, get_ia32_pncode(node));
866 }
867
868 /**
869  * Emits code for conditional x87 floating point jump with two variables.
870  */
871 static
872 void emit_ia32_x87CondJmp(ia32_emit_env_t *env, const ir_node *node) {
873         const ia32_x87_attr_t *x87_attr = get_ia32_x87_attr_const(node);
874         const char            *reg      = x87_attr->x87[1]->name;
875         long                   pnc      = get_ia32_pncode(node);
876
877         switch (get_ia32_irn_opcode(node)) {
878         case iro_ia32_fcomrJmp:
879                 pnc = get_inversed_pnc(pnc);
880                 reg = x87_attr->x87[0]->name;
881         case iro_ia32_fcomJmp:
882         default:
883                 be_emit_cstring(env, "\tfucom ");
884                 break;
885         case iro_ia32_fcomrpJmp:
886                 pnc = get_inversed_pnc(pnc);
887                 reg = x87_attr->x87[0]->name;
888         case iro_ia32_fcompJmp:
889                 be_emit_cstring(env, "\tfucomp ");
890                 break;
891         case iro_ia32_fcomrppJmp:
892                 pnc = get_inversed_pnc(pnc);
893         case iro_ia32_fcomppJmp:
894                 be_emit_cstring(env, "\tfucompp ");
895                 reg = "";
896                 break;
897         }
898
899         if(reg[0] != '\0') {
900                 be_emit_char(env, '%');
901                 be_emit_string(env, reg);
902         }
903         be_emit_finish_line_gas(env, node);
904
905         be_emit_cstring(env, "\tfnstsw %ax");
906         be_emit_finish_line_gas(env, node);
907         be_emit_cstring(env, "\tsahf");
908         be_emit_finish_line_gas(env, node);
909
910         finish_CondJmp(env, node, mode_E, pnc);
911 }
912
913 static
914 void CMov_emitter(ia32_emit_env_t *env, const ir_node *node) {
915         long pnc = get_ia32_pncode(node);
916         int is_PsiCondCMov = is_ia32_PsiCondCMov(node);
917         int idx_left  = 2 - is_PsiCondCMov;
918         int idx_right = 3 - is_PsiCondCMov;
919         const arch_register_t *in1, *in2, *out;
920
921         out = arch_get_irn_register(env->arch_env, node);
922         in1 = arch_get_irn_register(env->arch_env, get_irn_n(node, idx_left));
923         in2 = arch_get_irn_register(env->arch_env, get_irn_n(node, idx_right));
924
925         /* we have to emit the cmp first, because the destination register */
926         /* could be one of the compare registers                           */
927         if (is_ia32_CmpCMov(node)) {
928                 be_emit_cstring(env, "\tcmp ");
929                 ia32_emit_source_register(env, node, 1);
930                 be_emit_cstring(env, ", ");
931                 ia32_emit_source_register(env, node, 0);
932         } else if (is_ia32_xCmpCMov(node)) {
933                 be_emit_cstring(env, "\tucomis");
934                 ia32_emit_mode_suffix_mode(env, get_irn_mode(node));
935                 be_emit_char(env, ' ');
936                 ia32_emit_source_register(env, node, 1);
937                 be_emit_cstring(env, ", ");
938                 ia32_emit_source_register(env, node, 0);
939         } else if (is_PsiCondCMov) {
940                 /* omit compare because flags are already set by And/Or */
941                 be_emit_cstring(env, "\ttest ");
942                 ia32_emit_source_register(env, node, 0);
943                 be_emit_cstring(env, ", ");
944                 ia32_emit_source_register(env, node, 0);
945         } else {
946                 assert(0 && "unsupported CMov");
947         }
948         be_emit_finish_line_gas(env, node);
949
950         if (REGS_ARE_EQUAL(out, in2)) {
951                 /* best case: default in == out -> do nothing */
952         } else if (REGS_ARE_EQUAL(out, in1)) {
953                 ir_node *n = (ir_node*) node;
954                 /* true in == out -> need complement compare and exchange true and default in */
955                 ir_node *t = get_irn_n(n, idx_left);
956                 set_irn_n(n, idx_left, get_irn_n(n, idx_right));
957                 set_irn_n(n, idx_right, t);
958
959                 pnc = get_negated_pnc(pnc, get_irn_mode(node));
960         } else {
961                 /* out is different from in: need copy default -> out */
962                 if (is_PsiCondCMov) {
963                         be_emit_cstring(env, "\tmovl ");
964                         ia32_emit_dest_register(env, node, 2);
965                         be_emit_cstring(env, ", ");
966                         ia32_emit_dest_register(env, node, 0);
967                 } else {
968                         be_emit_cstring(env, "\tmovl ");
969                         ia32_emit_source_register(env, node, 3);
970                         be_emit_cstring(env, ", ");
971                         ia32_emit_dest_register(env, node, 0);
972                 }
973                 be_emit_finish_line_gas(env, node);
974         }
975
976         if (is_PsiCondCMov) {
977                 be_emit_cstring(env, "\tcmov");
978                 ia32_emit_cmp_suffix(env, pnc);
979                 be_emit_cstring(env, "l ");
980                 ia32_emit_source_register(env, node, 1);
981                 be_emit_cstring(env, ", ");
982                 ia32_emit_dest_register(env, node, 0);
983         } else {
984                 be_emit_cstring(env, "\tcmov");
985                 ia32_emit_cmp_suffix(env, pnc);
986                 be_emit_cstring(env, "l ");
987                 ia32_emit_source_register(env, node, 2);
988                 be_emit_cstring(env, ", ");
989                 ia32_emit_dest_register(env, node, 0);
990         }
991         be_emit_finish_line_gas(env, node);
992 }
993
994 static
995 void emit_ia32_CmpCMov(ia32_emit_env_t *env, const ir_node *node) {
996         CMov_emitter(env, node);
997 }
998
999 static
1000 void emit_ia32_PsiCondCMov(ia32_emit_env_t *env, const ir_node *node) {
1001         CMov_emitter(env, node);
1002 }
1003
1004 static
1005 void emit_ia32_xCmpCMov(ia32_emit_env_t *env, const ir_node *node) {
1006         CMov_emitter(env, node);
1007 }
1008
1009 static
1010 void Set_emitter(ia32_emit_env_t *env, const ir_node *node, ir_mode *mode) {
1011         int pnc = get_ia32_pncode(node);
1012         const char *reg8bit;
1013         const arch_register_t *out;
1014
1015         out     = arch_get_irn_register(env->arch_env, node);
1016         reg8bit = ia32_get_mapped_reg_name(env->isa->regs_8bit, out);
1017
1018         if (is_ia32_CmpSet(node)) {
1019                 be_emit_cstring(env, "\tcmp ");
1020                 ia32_emit_binop(env, node);
1021         } else if (is_ia32_xCmpSet(node)) {
1022                 be_emit_cstring(env, "\tucomis");
1023                 ia32_emit_mode_suffix_mode(env, get_irn_mode(get_irn_n(node, 2)));
1024                 be_emit_char(env, ' ');
1025                 ia32_emit_binop(env, node);
1026         } else if (is_ia32_PsiCondSet(node)) {
1027                 be_emit_cstring(env, "\tcmp $0, ");
1028                 ia32_emit_source_register(env, node, 0);
1029         } else {
1030                 assert(0 && "unsupported Set");
1031         }
1032         be_emit_finish_line_gas(env, node);
1033
1034         /* use mov to clear target because it doesn't affect the eflags */
1035         be_emit_cstring(env, "\tmovl $0, %");
1036         be_emit_string(env, arch_register_get_name(out));
1037         be_emit_finish_line_gas(env, node);
1038
1039         be_emit_cstring(env, "\tset");
1040         ia32_emit_cmp_suffix(env, pnc);
1041         be_emit_cstring(env, " %");
1042         be_emit_string(env, reg8bit);
1043         be_emit_finish_line_gas(env, node);
1044 }
1045
1046 static
1047 void emit_ia32_CmpSet(ia32_emit_env_t *env, const ir_node *node) {
1048         Set_emitter(env, node, get_irn_mode(get_irn_n(node, 2)));
1049 }
1050
1051 static
1052 void emit_ia32_PsiCondSet(ia32_emit_env_t *env, const ir_node *node) {
1053         Set_emitter(env, node, get_irn_mode(get_irn_n(node, 0)));
1054 }
1055
1056 static
1057 void emit_ia32_xCmpSet(ia32_emit_env_t *env, const ir_node *node) {
1058         Set_emitter(env, node, get_irn_mode(get_irn_n(node, 2)));
1059 }
1060
1061 static
1062 void emit_ia32_xCmp(ia32_emit_env_t *env, const ir_node *node) {
1063         int  sse_pnc  = -1;
1064         long pnc      = get_ia32_pncode(node);
1065         long unord    = pnc & pn_Cmp_Uo;
1066
1067         assert( (pnc & ia32_pn_Cmp_Unsigned) == 0);
1068
1069         switch (pnc) {
1070                 case pn_Cmp_Leg: /* odered */
1071                         sse_pnc = 7;
1072                         break;
1073                 case pn_Cmp_Uo:  /* unordered */
1074                         sse_pnc = 3;
1075                         break;
1076                 case pn_Cmp_Ue:
1077                 case pn_Cmp_Eq:  /* == */
1078                         sse_pnc = 0;
1079                         break;
1080                 case pn_Cmp_Ul:
1081                 case pn_Cmp_Lt:  /* < */
1082                         sse_pnc = 1;
1083                         break;
1084                 case pn_Cmp_Ule:
1085                 case pn_Cmp_Le: /* <= */
1086                         sse_pnc = 2;
1087                         break;
1088                 case pn_Cmp_Ug:
1089                 case pn_Cmp_Gt:  /* > */
1090                         sse_pnc = 6;
1091                         break;
1092                 case pn_Cmp_Uge:
1093                 case pn_Cmp_Ge: /* >= */
1094                         sse_pnc = 5;
1095                         break;
1096                 case pn_Cmp_Ne:
1097                 case pn_Cmp_Lg:  /* != */
1098                         sse_pnc = 4;
1099                         break;
1100         }
1101
1102         assert(sse_pnc >= 0 && "unsupported compare");
1103
1104         if (unord && sse_pnc != 3) {
1105                 /*
1106                         We need a separate compare against unordered.
1107                         Quick and Dirty solution:
1108                         - get some memory on stack
1109                         - compare
1110                         - store result
1111                         - compare
1112                         - and result and stored result
1113                     - cleanup stack
1114                 */
1115                 be_emit_cstring(env, "\tsubl $8, %esp");
1116                 be_emit_finish_line_gas(env, node);
1117
1118                 be_emit_cstring(env, "\tcmpsd $3, ");
1119                 ia32_emit_binop(env, node);
1120                 be_emit_finish_line_gas(env, node);
1121
1122                 be_emit_cstring(env, "\tmovsd ");
1123                 ia32_emit_dest_register(env, node, 0);
1124                 be_emit_cstring(env, ", (%esp)");
1125                 be_emit_finish_line_gas(env, node);
1126         }
1127
1128         be_emit_cstring(env, "\tcmpsd ");
1129         be_emit_irprintf(env->emit, "%d, ", sse_pnc);
1130         ia32_emit_binop(env, node);
1131         be_emit_finish_line_gas(env, node);
1132
1133         if (unord && sse_pnc != 3) {
1134                 be_emit_cstring(env, "\tandpd (%esp), ");
1135                 ia32_emit_dest_register(env, node, 0);
1136                 be_emit_finish_line_gas(env, node);
1137
1138                 be_emit_cstring(env, "\taddl $8, %esp");
1139                 be_emit_finish_line_gas(env, node);
1140         }
1141 }
1142
1143 /*********************************************************
1144  *                 _ _       _
1145  *                (_) |     (_)
1146  *   ___ _ __ ___  _| |_     _ _   _ _ __ ___  _ __  ___
1147  *  / _ \ '_ ` _ \| | __|   | | | | | '_ ` _ \| '_ \/ __|
1148  * |  __/ | | | | | | |_    | | |_| | | | | | | |_) \__ \
1149  *  \___|_| |_| |_|_|\__|   | |\__,_|_| |_| |_| .__/|___/
1150  *                         _/ |               | |
1151  *                        |__/                |_|
1152  *********************************************************/
1153
1154 /* jump table entry (target and corresponding number) */
1155 typedef struct _branch_t {
1156         ir_node *target;
1157         int      value;
1158 } branch_t;
1159
1160 /* jump table for switch generation */
1161 typedef struct _jmp_tbl_t {
1162         ir_node  *defProj;         /**< default target */
1163         int       min_value;       /**< smallest switch case */
1164         int       max_value;       /**< largest switch case */
1165         int       num_branches;    /**< number of jumps */
1166         char     *label;           /**< label of the jump table */
1167         branch_t *branches;        /**< jump array */
1168 } jmp_tbl_t;
1169
1170 /**
1171  * Compare two variables of type branch_t. Used to sort all switch cases
1172  */
1173 static
1174 int ia32_cmp_branch_t(const void *a, const void *b) {
1175         branch_t *b1 = (branch_t *)a;
1176         branch_t *b2 = (branch_t *)b;
1177
1178         if (b1->value <= b2->value)
1179                 return -1;
1180         else
1181                 return 1;
1182 }
1183
1184 /**
1185  * Emits code for a SwitchJmp (creates a jump table if
1186  * possible otherwise a cmp-jmp cascade). Port from
1187  * cggg ia32 backend
1188  */
1189 static
1190 void emit_ia32_SwitchJmp(ia32_emit_env_t *env, const ir_node *node) {
1191         unsigned long       interval;
1192         int                 last_value, i;
1193         long                pnc;
1194         jmp_tbl_t           tbl;
1195         ir_node            *proj;
1196         const ir_edge_t    *edge;
1197
1198         /* fill the table structure */
1199         tbl.label        = xmalloc(SNPRINTF_BUF_LEN);
1200         tbl.label        = get_unique_label(tbl.label, SNPRINTF_BUF_LEN, ".TBL_");
1201         tbl.defProj      = NULL;
1202         tbl.num_branches = get_irn_n_edges(node);
1203         tbl.branches     = xcalloc(tbl.num_branches, sizeof(tbl.branches[0]));
1204         tbl.min_value    = INT_MAX;
1205         tbl.max_value    = INT_MIN;
1206
1207         i = 0;
1208         /* go over all proj's and collect them */
1209         foreach_out_edge(node, edge) {
1210                 proj = get_edge_src_irn(edge);
1211                 assert(is_Proj(proj) && "Only proj allowed at SwitchJmp");
1212
1213                 pnc = get_Proj_proj(proj);
1214
1215                 /* create branch entry */
1216                 tbl.branches[i].target = proj;
1217                 tbl.branches[i].value  = pnc;
1218
1219                 tbl.min_value = pnc < tbl.min_value ? pnc : tbl.min_value;
1220                 tbl.max_value = pnc > tbl.max_value ? pnc : tbl.max_value;
1221
1222                 /* check for default proj */
1223                 if (pnc == get_ia32_pncode(node)) {
1224                         assert(tbl.defProj == NULL && "found two defProjs at SwitchJmp");
1225                         tbl.defProj = proj;
1226                 }
1227
1228                 i++;
1229         }
1230
1231         /* sort the branches by their number */
1232         qsort(tbl.branches, tbl.num_branches, sizeof(tbl.branches[0]), ia32_cmp_branch_t);
1233
1234         /* two-complement's magic make this work without overflow */
1235         interval = tbl.max_value - tbl.min_value;
1236
1237         /* emit the table */
1238         be_emit_cstring(env, "\tcmpl $");
1239         be_emit_irprintf(env->emit, "%u, ", interval);
1240         ia32_emit_source_register(env, node, 0);
1241         be_emit_finish_line_gas(env, node);
1242
1243         be_emit_cstring(env, "\tja ");
1244         ia32_emit_cfop_target(env, tbl.defProj);
1245         be_emit_finish_line_gas(env, node);
1246
1247         if (tbl.num_branches > 1) {
1248                 /* create table */
1249                 be_emit_cstring(env, "\tjmp *");
1250                 be_emit_string(env, tbl.label);
1251                 be_emit_cstring(env, "(,");
1252                 ia32_emit_source_register(env, node, 0);
1253                 be_emit_cstring(env, ",4)");
1254                 be_emit_finish_line_gas(env, node);
1255
1256                 be_gas_emit_switch_section(env->emit, GAS_SECTION_RODATA);
1257                 be_emit_cstring(env, "\t.align 4\n");
1258                 be_emit_write_line(env);
1259
1260                 be_emit_string(env, tbl.label);
1261                 be_emit_cstring(env, ":\n");
1262                 be_emit_write_line(env);
1263
1264                 be_emit_cstring(env, ".long ");
1265                 ia32_emit_cfop_target(env, tbl.branches[0].target);
1266                 be_emit_finish_line_gas(env, NULL);
1267
1268                 last_value = tbl.branches[0].value;
1269                 for (i = 1; i < tbl.num_branches; ++i) {
1270                         while (++last_value < tbl.branches[i].value) {
1271                                 be_emit_cstring(env, ".long ");
1272                                 ia32_emit_cfop_target(env, tbl.defProj);
1273                                 be_emit_finish_line_gas(env, NULL);
1274                         }
1275                         be_emit_cstring(env, ".long ");
1276                         ia32_emit_cfop_target(env, tbl.branches[i].target);
1277                         be_emit_finish_line_gas(env, NULL);
1278                 }
1279                 be_gas_emit_switch_section(env->emit, GAS_SECTION_TEXT);
1280         } else {
1281                 /* one jump is enough */
1282                 be_emit_cstring(env, "\tjmp ");
1283                 ia32_emit_cfop_target(env, tbl.branches[0].target);
1284                 be_emit_finish_line_gas(env, node);
1285         }
1286
1287         if (tbl.label)
1288                 free(tbl.label);
1289         if (tbl.branches)
1290                 free(tbl.branches);
1291 }
1292
1293 /**
1294  * Emits code for a unconditional jump.
1295  */
1296 static
1297 void emit_Jmp(ia32_emit_env_t *env, const ir_node *node) {
1298         ir_node *block, *next_block;
1299
1300         /* for now, the code works for scheduled and non-schedules blocks */
1301         block = get_nodes_block(node);
1302
1303         /* we have a block schedule */
1304         next_block = next_blk_sched(block);
1305         if (get_cfop_target_block(node) != next_block) {
1306                 be_emit_cstring(env, "\tjmp ");
1307                 ia32_emit_cfop_target(env, node);
1308         } else {
1309                 be_emit_cstring(env, "\t/* fallthrough to ");
1310                 ia32_emit_cfop_target(env, node);
1311                 be_emit_cstring(env, " */");
1312         }
1313         be_emit_finish_line_gas(env, node);
1314 }
1315
1316 static
1317 void emit_ia32_Immediate(ia32_emit_env_t *env, const ir_node *node)
1318 {
1319         const ia32_attr_t *attr = get_ia32_attr_const(node);
1320
1321         if(attr->am_sc != NULL) {
1322                 ident *id = get_entity_ld_ident(attr->am_sc);
1323
1324                 if(attr->data.am_sc_sign)
1325                         be_emit_char(env, '-');
1326                 be_emit_ident(env, id);
1327         }
1328         if(attr->cnst_val.tv != NULL) {
1329                 if(attr->am_sc != NULL)
1330                         be_emit_char(env, '+');
1331                 else
1332                         be_emit_char(env, '$');
1333                 be_emit_tarval(env, attr->cnst_val.tv);
1334         }
1335 }
1336
1337 static
1338 const char* emit_asm_operand(ia32_emit_env_t *env, const ir_node *node,
1339                              const char *s)
1340 {
1341         const arch_register_t *reg;
1342         const char            *reg_name;
1343         char                   c;
1344         char                   modifier = 0;
1345         int                    num      = -1;
1346         const ia32_attr_t     *attr;
1347         int                    n_outs;
1348         int                    p;
1349
1350         assert(*s == '%');
1351         c = *(++s);
1352
1353         /* parse modifiers */
1354         switch(c) {
1355         case 0:
1356                 ir_fprintf(stderr, "Warning: asm text (%+F) ends with %\n", node);
1357                 be_emit_char(env, '%');
1358                 return s + 1;
1359         case '%':
1360                 be_emit_char(env, '%');
1361                 return s + 1;
1362         case 'w':
1363         case 'b':
1364         case 'h':
1365                 modifier = c;
1366                 ++s;
1367                 break;
1368         case '0':
1369         case '1':
1370         case '2':
1371         case '3':
1372         case '4':
1373         case '5':
1374         case '6':
1375         case '7':
1376         case '8':
1377         case '9':
1378                 break;
1379         default:
1380                 ir_fprintf(stderr, "Warning: asm text (%+F) contains unknown modifier "
1381                            "'%c' for asm op\n", node, c);
1382                 ++s;
1383                 break;
1384         }
1385
1386         /* parse number */
1387         sscanf(s, "%d%n", &num, &p);
1388         if(num < 0) {
1389                 ir_fprintf(stderr, "Warning: Couldn't parse assembler operand (%+F)\n",
1390                            node);
1391                 return s;
1392         } else {
1393                 s += p;
1394         }
1395
1396         /* get register */
1397         attr   = get_ia32_attr_const(node);
1398         n_outs = ARR_LEN(attr->slots);
1399         if(num < n_outs) {
1400                 reg = get_out_reg(env, node, num);
1401         } else {
1402                 ir_node *pred;
1403                 int      in = num - n_outs;
1404                 if(in >= get_irn_arity(node)) {
1405                         ir_fprintf(stderr, "Warning: Invalid input %d specified in asm "
1406                                    "op (%+F)\n", num, node);
1407                         return s;
1408                 }
1409                 pred = get_irn_n(node, in);
1410                 /* might be an immediate value */
1411                 if(is_ia32_Immediate(pred)) {
1412                         emit_ia32_Immediate(env, pred);
1413                         return s;
1414                 }
1415                 reg = get_in_reg(env, node, in);
1416         }
1417         if(reg == NULL) {
1418                 ir_fprintf(stderr, "Warning: no register assigned for %d asm op "
1419                            "(%+F)\n", num, node);
1420                 return s;
1421         }
1422
1423         /* emit it */
1424         be_emit_char(env, '%');
1425         switch(modifier) {
1426         case 0:
1427                 reg_name = arch_register_get_name(reg);
1428                 break;
1429         case 'b':
1430                 reg_name = ia32_get_mapped_reg_name(env->isa->regs_8bit, reg);
1431                 break;
1432         case 'h':
1433                 reg_name = ia32_get_mapped_reg_name(env->isa->regs_8bit_high, reg);
1434                 break;
1435         case 'w':
1436                 reg_name = ia32_get_mapped_reg_name(env->isa->regs_16bit, reg);
1437                 break;
1438         default:
1439                 panic("Invalid asm op modifier");
1440         }
1441         be_emit_string(env, reg_name);
1442
1443         return s;
1444 }
1445
1446 /**
1447  * Emits code for an ASM pseudo op.
1448  */
1449 static
1450 void emit_ia32_Asm(ia32_emit_env_t *env, const ir_node *node)
1451 {
1452         const ia32_attr_t *attr     = get_ia32_attr_const(node);
1453         ident             *asm_text = attr->cnst_val.asm_text;
1454         const char        *s        = get_id_str(asm_text);
1455
1456         be_emit_cstring(env, "# Begin ASM \t");
1457         be_emit_finish_line_gas(env, node);
1458
1459         if (s[0] != '\t')
1460                 be_emit_char(env, '\t');
1461
1462         while(*s != 0) {
1463                 if(*s == '%') {
1464                         s = emit_asm_operand(env, node, s);
1465                         continue;
1466                 } else {
1467                         be_emit_char(env, *s);
1468                 }
1469                 ++s;
1470         }
1471
1472         be_emit_char(env, '\n');
1473         be_emit_write_line(env);
1474
1475         be_emit_cstring(env, "# End ASM\n");
1476         be_emit_write_line(env);
1477 }
1478
1479 /**********************************
1480  *   _____                  ____
1481  *  / ____|                |  _ \
1482  * | |     ___  _ __  _   _| |_) |
1483  * | |    / _ \| '_ \| | | |  _ <
1484  * | |___| (_) | |_) | |_| | |_) |
1485  *  \_____\___/| .__/ \__, |____/
1486  *             | |     __/ |
1487  *             |_|    |___/
1488  **********************************/
1489
1490 /**
1491  * Emit movsb/w instructions to make mov count divideable by 4
1492  */
1493 static
1494 void emit_CopyB_prolog(ia32_emit_env_t *env, int rem) {
1495         be_emit_cstring(env, "\tcld");
1496         be_emit_finish_line_gas(env, NULL);
1497
1498         switch(rem) {
1499         case 1:
1500                 be_emit_cstring(env, "\tmovsb");
1501                 be_emit_finish_line_gas(env, NULL);
1502                 break;
1503         case 2:
1504                 be_emit_cstring(env, "\tmovsw");
1505                 be_emit_finish_line_gas(env, NULL);
1506                 break;
1507         case 3:
1508                 be_emit_cstring(env, "\tmovsb");
1509                 be_emit_finish_line_gas(env, NULL);
1510                 be_emit_cstring(env, "\tmovsw");
1511                 be_emit_finish_line_gas(env, NULL);
1512                 break;
1513         }
1514 }
1515
1516 /**
1517  * Emit rep movsd instruction for memcopy.
1518  */
1519 static
1520 void emit_ia32_CopyB(ia32_emit_env_t *env, const ir_node *node) {
1521         tarval *tv = get_ia32_Immop_tarval(node);
1522         int    rem = get_tarval_long(tv);
1523
1524         emit_CopyB_prolog(env, rem);
1525
1526         be_emit_cstring(env, "\trep movsd");
1527         be_emit_finish_line_gas(env, node);
1528 }
1529
1530 /**
1531  * Emits unrolled memcopy.
1532  */
1533 static
1534 void emit_ia32_CopyB_i(ia32_emit_env_t *env, const ir_node *node) {
1535         tarval *tv   = get_ia32_Immop_tarval(node);
1536         int     size = get_tarval_long(tv);
1537
1538         emit_CopyB_prolog(env, size & 0x3);
1539
1540         size >>= 2;
1541         while (size--) {
1542                 be_emit_cstring(env, "\tmovsd");
1543                 be_emit_finish_line_gas(env, NULL);
1544         }
1545 }
1546
1547
1548
1549 /***************************
1550  *   _____
1551  *  / ____|
1552  * | |     ___  _ ____   __
1553  * | |    / _ \| '_ \ \ / /
1554  * | |___| (_) | | | \ V /
1555  *  \_____\___/|_| |_|\_/
1556  *
1557  ***************************/
1558
1559 /**
1560  * Emit code for conversions (I, FP), (FP, I) and (FP, FP).
1561  */
1562 static
1563 void emit_ia32_Conv_with_FP(ia32_emit_env_t *env, const ir_node *node) {
1564         ir_mode            *ls_mode = get_ia32_ls_mode(node);
1565         int                 ls_bits = get_mode_size_bits(ls_mode);
1566
1567         be_emit_cstring(env, "\tcvt");
1568
1569         if(is_ia32_Conv_I2FP(node)) {
1570                 if(ls_bits == 32) {
1571                         be_emit_cstring(env, "si2ss");
1572                 } else {
1573                         be_emit_cstring(env, "si2sd");
1574                 }
1575         } else if(is_ia32_Conv_FP2I(node)) {
1576                 if(ls_bits == 32) {
1577                         be_emit_cstring(env, "ss2si");
1578                 } else {
1579                         be_emit_cstring(env, "sd2si");
1580                 }
1581         } else {
1582                 assert(is_ia32_Conv_FP2FP(node));
1583                 if(ls_bits == 32) {
1584                         be_emit_cstring(env, "sd2ss");
1585                 } else {
1586                         be_emit_cstring(env, "ss2sd");
1587                 }
1588         }
1589         be_emit_char(env, ' ');
1590
1591         switch(get_ia32_op_type(node)) {
1592                 case ia32_Normal:
1593                         ia32_emit_source_register(env, node, 2);
1594                         be_emit_cstring(env, ", ");
1595                         ia32_emit_dest_register(env, node, 0);
1596                         break;
1597                 case ia32_AddrModeS:
1598                         ia32_emit_dest_register(env, node, 0);
1599                         be_emit_cstring(env, ", ");
1600                         ia32_emit_am(env, node);
1601                         break;
1602                 default:
1603                         assert(0 && "unsupported op type for Conv");
1604         }
1605         be_emit_finish_line_gas(env, node);
1606 }
1607
1608 static
1609 void emit_ia32_Conv_I2FP(ia32_emit_env_t *env, const ir_node *node) {
1610         emit_ia32_Conv_with_FP(env, node);
1611 }
1612
1613 static
1614 void emit_ia32_Conv_FP2I(ia32_emit_env_t *env, const ir_node *node) {
1615         emit_ia32_Conv_with_FP(env, node);
1616 }
1617
1618 static
1619 void emit_ia32_Conv_FP2FP(ia32_emit_env_t *env, const ir_node *node) {
1620         emit_ia32_Conv_with_FP(env, node);
1621 }
1622
1623 /**
1624  * Emits code for an Int conversion.
1625  */
1626 static
1627 void emit_ia32_Conv_I2I(ia32_emit_env_t *env, const ir_node *node) {
1628         const char *sign_suffix;
1629         ir_mode *smaller_mode = get_ia32_ls_mode(node);
1630         int smaller_bits = get_mode_size_bits(smaller_mode);
1631         int signed_mode;
1632         const arch_register_t *in_reg, *out_reg;
1633
1634         assert(!mode_is_float(smaller_mode));
1635         assert(smaller_bits == 8 || smaller_bits == 16 || smaller_bits == 32);
1636
1637         signed_mode = mode_is_signed(smaller_mode);
1638         if(smaller_bits == 32) {
1639                 // this should not happen as it's no convert
1640                 assert(0);
1641                 sign_suffix = "";
1642         } else {
1643                 sign_suffix = signed_mode ? "s" : "z";
1644         }
1645
1646         switch(get_ia32_op_type(node)) {
1647                 case ia32_Normal:
1648                         in_reg  = get_in_reg(env, node, 2);
1649                         out_reg = get_out_reg(env, node, 0);
1650
1651                         if (REGS_ARE_EQUAL(in_reg, &ia32_gp_regs[REG_EAX]) &&
1652                                 REGS_ARE_EQUAL(out_reg, in_reg)                &&
1653                                 signed_mode)
1654                         {
1655                                 /* argument and result are both in EAX and */
1656                                 /* signedness is ok: -> use converts       */
1657                                 if (smaller_bits == 8) {
1658                                         be_emit_cstring(env, "\tcbtw");
1659                                 } else if (smaller_bits == 16) {
1660                                         be_emit_cstring(env, "\tcwtl");
1661                                 } else {
1662                                         assert(0);
1663                                 }
1664                         } else {
1665                                 const char *sreg = ia32_get_reg_name_for_mode(env, smaller_mode, in_reg);
1666
1667                                 be_emit_cstring(env, "\tmov");
1668                                 be_emit_string(env, sign_suffix);
1669                                 ia32_emit_mode_suffix_mode(env, smaller_mode);
1670                                 be_emit_cstring(env, "l %");
1671                                 be_emit_string(env, sreg);
1672                                 be_emit_cstring(env, ", ");
1673                                 ia32_emit_dest_register(env, node, 0);
1674                         }
1675                         break;
1676                 case ia32_AddrModeS: {
1677                         be_emit_cstring(env, "\tmov");
1678                         be_emit_string(env, sign_suffix);
1679                         ia32_emit_mode_suffix_mode(env, smaller_mode);
1680                         be_emit_cstring(env, "l %");
1681                         ia32_emit_am(env, node);
1682                         be_emit_cstring(env, ", ");
1683                         ia32_emit_dest_register(env, node, 0);
1684                         break;
1685                 }
1686                 default:
1687                         assert(0 && "unsupported op type for Conv");
1688         }
1689         be_emit_finish_line_gas(env, node);
1690 }
1691
1692 /**
1693  * Emits code for an 8Bit Int conversion.
1694  */
1695 void emit_ia32_Conv_I2I8Bit(ia32_emit_env_t *env, const ir_node *node) {
1696         emit_ia32_Conv_I2I(env, node);
1697 }
1698
1699
1700 /*******************************************
1701  *  _                          _
1702  * | |                        | |
1703  * | |__   ___ _ __   ___   __| | ___  ___
1704  * | '_ \ / _ \ '_ \ / _ \ / _` |/ _ \/ __|
1705  * | |_) |  __/ | | | (_) | (_| |  __/\__ \
1706  * |_.__/ \___|_| |_|\___/ \__,_|\___||___/
1707  *
1708  *******************************************/
1709
1710 /**
1711  * Emits a backend call
1712  */
1713 static
1714 void emit_be_Call(ia32_emit_env_t *env, const ir_node *node) {
1715         ir_entity *ent = be_Call_get_entity(node);
1716
1717         be_emit_cstring(env, "\tcall ");
1718         if (ent) {
1719                 mark_entity_visited(ent);
1720                 be_emit_string(env, get_entity_ld_name(ent));
1721         } else {
1722                 be_emit_char(env, '*');
1723                 ia32_emit_dest_register(env, get_irn_n(node, be_pos_Call_ptr), 0);
1724         }
1725         be_emit_finish_line_gas(env, node);
1726 }
1727
1728 /**
1729  * Emits code to increase stack pointer.
1730  */
1731 static
1732 void emit_be_IncSP(ia32_emit_env_t *env, const ir_node *node) {
1733         int offs = be_get_IncSP_offset(node);
1734
1735         if (offs == 0)
1736                 return;
1737
1738         if (offs > 0) {
1739                 be_emit_cstring(env, "\tsubl $");
1740                 be_emit_irprintf(env->emit, "%u, ", offs);
1741                 ia32_emit_source_register(env, node, 0);
1742         } else {
1743                 be_emit_cstring(env, "\taddl $");
1744                 be_emit_irprintf(env->emit, "%u, ", -offs);
1745                 ia32_emit_source_register(env, node, 0);
1746         }
1747         be_emit_finish_line_gas(env, node);
1748 }
1749
1750 /**
1751  * Emits code to set stack pointer.
1752  */
1753 static
1754 void emit_be_SetSP(ia32_emit_env_t *env, const ir_node *node) {
1755         be_emit_cstring(env, "\tmovl ");
1756         ia32_emit_source_register(env, node, 2);
1757         be_emit_cstring(env, ", ");
1758         ia32_emit_dest_register(env, node, 0);
1759         be_emit_finish_line_gas(env, node);
1760 }
1761
1762 /**
1763  * Emits code for Copy/CopyKeep.
1764  */
1765 static
1766 void Copy_emitter(ia32_emit_env_t *env, const ir_node *node, const ir_node *op)
1767 {
1768         const arch_env_t *aenv = env->arch_env;
1769         ir_mode *mode;
1770
1771         if (REGS_ARE_EQUAL(arch_get_irn_register(aenv, node), arch_get_irn_register(aenv, op)) ||
1772                 arch_register_type_is(arch_get_irn_register(aenv, op), virtual))
1773                 return;
1774
1775         mode = get_irn_mode(node);
1776         if (mode == mode_E) {
1777                 be_emit_cstring(env, "\tmovsd ");
1778                 ia32_emit_source_register(env, node, 0);
1779                 be_emit_cstring(env, ", ");
1780                 ia32_emit_dest_register(env, node, 0);
1781         } else {
1782                 be_emit_cstring(env, "\tmovl ");
1783                 ia32_emit_source_register(env, node, 0);
1784                 be_emit_cstring(env, ", ");
1785                 ia32_emit_dest_register(env, node, 0);
1786         }
1787         be_emit_finish_line_gas(env, node);
1788 }
1789
1790 static
1791 void emit_be_Copy(ia32_emit_env_t *env, const ir_node *node) {
1792         Copy_emitter(env, node, be_get_Copy_op(node));
1793 }
1794
1795 static
1796 void emit_be_CopyKeep(ia32_emit_env_t *env, const ir_node *node) {
1797         Copy_emitter(env, node, be_get_CopyKeep_op(node));
1798 }
1799
1800 /**
1801  * Emits code for exchange.
1802  */
1803 static
1804 void emit_be_Perm(ia32_emit_env_t *env, const ir_node *node) {
1805         const arch_register_t *in1, *in2;
1806         const arch_register_class_t *cls1, *cls2;
1807
1808         in1 = arch_get_irn_register(env->arch_env, get_irn_n(node, 0));
1809         in2 = arch_get_irn_register(env->arch_env, get_irn_n(node, 1));
1810
1811         cls1 = arch_register_get_class(in1);
1812         cls2 = arch_register_get_class(in2);
1813
1814         assert(cls1 == cls2 && "Register class mismatch at Perm");
1815
1816         if (cls1 == &ia32_reg_classes[CLASS_ia32_gp]) {
1817                 be_emit_cstring(env, "\txchg ");
1818                 ia32_emit_source_register(env, node, 1);
1819                 be_emit_cstring(env, ", ");
1820                 ia32_emit_source_register(env, node, 0);
1821                 be_emit_finish_line_gas(env, node);
1822         } else if (cls1 == &ia32_reg_classes[CLASS_ia32_xmm]) {
1823                 be_emit_cstring(env, "\txorpd ");
1824                 ia32_emit_source_register(env, node, 1);
1825                 be_emit_cstring(env, ", ");
1826                 ia32_emit_source_register(env, node, 0);
1827                 be_emit_finish_line_gas(env, NULL);
1828
1829                 be_emit_cstring(env, "\txorpd ");
1830                 ia32_emit_source_register(env, node, 0);
1831                 be_emit_cstring(env, ", ");
1832                 ia32_emit_source_register(env, node, 1);
1833                 be_emit_finish_line_gas(env, NULL);
1834
1835                 be_emit_cstring(env, "\txorpd ");
1836                 ia32_emit_source_register(env, node, 1);
1837                 be_emit_cstring(env, ", ");
1838                 ia32_emit_source_register(env, node, 0);
1839                 be_emit_finish_line_gas(env, node);
1840         } else if (cls1 == &ia32_reg_classes[CLASS_ia32_vfp]) {
1841                 /* is a NOP */
1842         } else if (cls1 == &ia32_reg_classes[CLASS_ia32_st]) {
1843                 /* is a NOP */
1844         }
1845 }
1846
1847 /**
1848  * Emits code for Constant loading.
1849  */
1850 static
1851 void emit_ia32_Const(ia32_emit_env_t *env, const ir_node *node) {
1852         ia32_immop_type_t imm_tp = get_ia32_immop_type(node);
1853
1854         if (imm_tp == ia32_ImmSymConst) {
1855                 be_emit_cstring(env, "\tmovl ");
1856                 ia32_emit_immediate(env, node);
1857                 be_emit_cstring(env, ", ");
1858                 ia32_emit_dest_register(env, node, 0);
1859         } else {
1860                 tarval *tv = get_ia32_Immop_tarval(node);
1861                 assert(get_irn_mode(node) == mode_Iu);
1862                 /* beware: in some rare cases mode is mode_b which has no tarval_null() */
1863                 if (tarval_is_null(tv)) {
1864                         if (env->isa->opt_arch == arch_pentium_4) {
1865                                 /* P4 prefers sub r, r, others xor r, r */
1866                                 be_emit_cstring(env, "\tsubl ");
1867                         } else {
1868                                 be_emit_cstring(env, "\txorl ");
1869                         }
1870                         ia32_emit_dest_register(env, node, 0);
1871                         be_emit_cstring(env, ", ");
1872                         ia32_emit_dest_register(env, node, 0);
1873                 } else {
1874                         be_emit_cstring(env, "\tmovl ");
1875                         ia32_emit_immediate(env, node);
1876                         be_emit_cstring(env, ", ");
1877                         ia32_emit_dest_register(env, node, 0);
1878                 }
1879         }
1880         be_emit_finish_line_gas(env, node);
1881 }
1882
1883 /**
1884  * Emits code to load the TLS base
1885  */
1886 static
1887 void emit_ia32_LdTls(ia32_emit_env_t *env, const ir_node *node) {
1888         be_emit_cstring(env, "\tmovl %gs:0, ");
1889         ia32_emit_dest_register(env, node, 0);
1890         be_emit_finish_line_gas(env, node);
1891 }
1892
1893 static
1894 void emit_be_Return(ia32_emit_env_t *env, const ir_node *node) {
1895         be_emit_cstring(env, "\tret");
1896         be_emit_finish_line_gas(env, node);
1897 }
1898
1899 static
1900 void emit_Nothing(ia32_emit_env_t *env, const ir_node *node) {
1901 }
1902
1903
1904 /***********************************************************************************
1905  *                  _          __                                             _
1906  *                 (_)        / _|                                           | |
1907  *  _ __ ___   __ _ _ _ __   | |_ _ __ __ _ _ __ ___   _____      _____  _ __| | __
1908  * | '_ ` _ \ / _` | | '_ \  |  _| '__/ _` | '_ ` _ \ / _ \ \ /\ / / _ \| '__| |/ /
1909  * | | | | | | (_| | | | | | | | | | | (_| | | | | | |  __/\ V  V / (_) | |  |   <
1910  * |_| |_| |_|\__,_|_|_| |_| |_| |_|  \__,_|_| |_| |_|\___| \_/\_/ \___/|_|  |_|\_\
1911  *
1912  ***********************************************************************************/
1913
1914 /**
1915  * Enters the emitter functions for handled nodes into the generic
1916  * pointer of an opcode.
1917  */
1918 static
1919 void ia32_register_emitters(void) {
1920
1921 #define IA32_EMIT2(a,b) op_ia32_##a->ops.generic = (op_func)emit_ia32_##b
1922 #define IA32_EMIT(a)    IA32_EMIT2(a,a)
1923 #define EMIT(a)         op_##a->ops.generic = (op_func)emit_##a
1924 #define IGN(a)                  op_##a->ops.generic = (op_func)emit_Nothing
1925 #define BE_EMIT(a)      op_be_##a->ops.generic = (op_func)emit_be_##a
1926 #define BE_IGN(a)               op_be_##a->ops.generic = (op_func)emit_Nothing
1927
1928         /* first clear the generic function pointer for all ops */
1929         clear_irp_opcodes_generic_func();
1930
1931         /* register all emitter functions defined in spec */
1932         ia32_register_spec_emitters();
1933
1934         /* other ia32 emitter functions */
1935         IA32_EMIT(Asm);
1936         IA32_EMIT(CondJmp);
1937         IA32_EMIT(TestJmp);
1938         IA32_EMIT(CJmp);
1939         IA32_EMIT(CJmpAM);
1940         IA32_EMIT(CmpCMov);
1941         IA32_EMIT(PsiCondCMov);
1942         IA32_EMIT(CmpSet);
1943         IA32_EMIT(PsiCondSet);
1944         IA32_EMIT(SwitchJmp);
1945         IA32_EMIT(CopyB);
1946         IA32_EMIT(CopyB_i);
1947         IA32_EMIT(Conv_I2FP);
1948         IA32_EMIT(Conv_FP2I);
1949         IA32_EMIT(Conv_FP2FP);
1950         IA32_EMIT(Conv_I2I);
1951         IA32_EMIT(Conv_I2I8Bit);
1952         IA32_EMIT(Const);
1953         IA32_EMIT(LdTls);
1954         IA32_EMIT(xCmp);
1955         IA32_EMIT(xCmpSet);
1956         IA32_EMIT(xCmpCMov);
1957         IA32_EMIT(xCondJmp);
1958         IA32_EMIT2(fcomJmp, x87CondJmp);
1959         IA32_EMIT2(fcompJmp, x87CondJmp);
1960         IA32_EMIT2(fcomppJmp, x87CondJmp);
1961         IA32_EMIT2(fcomrJmp, x87CondJmp);
1962         IA32_EMIT2(fcomrpJmp, x87CondJmp);
1963         IA32_EMIT2(fcomrppJmp, x87CondJmp);
1964
1965         /* benode emitter */
1966         BE_EMIT(Call);
1967         BE_EMIT(IncSP);
1968         BE_EMIT(SetSP);
1969         BE_EMIT(Copy);
1970         BE_EMIT(CopyKeep);
1971         BE_EMIT(Perm);
1972         BE_EMIT(Return);
1973
1974         BE_IGN(RegParams);
1975         BE_IGN(Barrier);
1976         BE_IGN(Keep);
1977
1978         /* firm emitter */
1979         EMIT(Jmp);
1980         IGN(Proj);
1981         IGN(Phi);
1982         IGN(Start);
1983
1984 #undef BE_EMIT
1985 #undef EMIT
1986 #undef IGN
1987 #undef IA32_EMIT2
1988 #undef IA32_EMIT
1989 }
1990
1991 static const char *last_name = NULL;
1992 static unsigned last_line = -1;
1993 static unsigned num = -1;
1994
1995 /**
1996  * Emit the debug support for node node.
1997  */
1998 static
1999 void ia32_emit_dbg(ia32_emit_env_t *env, const ir_node *node) {
2000         dbg_info *db = get_irn_dbg_info(node);
2001         unsigned lineno;
2002         const char *fname = be_retrieve_dbg_info(db, &lineno);
2003
2004         if (! env->cg->birg->main_env->options->stabs_debug_support)
2005                 return;
2006
2007         if (fname) {
2008                 if (last_name != fname) {
2009                         last_line = -1;
2010                         be_dbg_include_begin(env->cg->birg->main_env->db_handle, fname);
2011                         last_name = fname;
2012                 }
2013                 if (last_line != lineno) {
2014                         char name[64];
2015
2016                         snprintf(name, sizeof(name), ".LM%u", ++num);
2017                         last_line = lineno;
2018                         be_dbg_line(env->cg->birg->main_env->db_handle, lineno, name);
2019                         be_emit_string(env, name);
2020                         be_emit_cstring(env, ":\n");
2021                         be_emit_write_line(env);
2022                 }
2023         }
2024 }
2025
2026 typedef void (*emit_func_ptr) (ia32_emit_env_t *, const ir_node *);
2027
2028 /**
2029  * Emits code for a node.
2030  */
2031 static
2032 void ia32_emit_node(ia32_emit_env_t *env, const ir_node *node) {
2033         ir_op *op = get_irn_op(node);
2034
2035         DBG((dbg, LEVEL_1, "emitting code for %+F\n", node));
2036
2037         if (op->ops.generic) {
2038                 emit_func_ptr func = (emit_func_ptr) op->ops.generic;
2039                 ia32_emit_dbg(env, node);
2040                 (*func) (env, node);
2041         } else {
2042                 emit_Nothing(env, node);
2043                 ir_fprintf(stderr, "Warning: No emit handler for node %+F (%+G)\n", node, node);
2044         }
2045 }
2046
2047 /**
2048  * Emits gas alignment directives
2049  */
2050 static
2051 void ia32_emit_alignment(ia32_emit_env_t *env, unsigned align, unsigned skip) {
2052         be_emit_cstring(env, "\t.p2align ");
2053         be_emit_irprintf(env->emit, "%u,,%u\n", align, skip);
2054         be_emit_write_line(env);
2055 }
2056
2057 /**
2058  * Emits gas alignment directives for Functions depended on cpu architecture.
2059  */
2060 static
2061 void ia32_emit_align_func(ia32_emit_env_t *env, cpu_support cpu) {
2062         unsigned align;
2063         unsigned maximum_skip;
2064
2065         switch (cpu) {
2066                 case arch_i386:
2067                         align = 2;
2068                         break;
2069                 case arch_i486:
2070                         align = 4;
2071                         break;
2072                 case arch_k6:
2073                         align = 5;
2074                         break;
2075                 default:
2076                         align = 4;
2077         }
2078         maximum_skip = (1 << align) - 1;
2079         ia32_emit_alignment(env, align, maximum_skip);
2080 }
2081
2082 /**
2083  * Emits gas alignment directives for Labels depended on cpu architecture.
2084  */
2085 static
2086 void ia32_emit_align_label(ia32_emit_env_t *env, cpu_support cpu) {
2087         unsigned align; unsigned maximum_skip;
2088
2089         switch (cpu) {
2090                 case arch_i386:
2091                         align = 2;
2092                         break;
2093                 case arch_i486:
2094                         align = 4;
2095                         break;
2096                 case arch_k6:
2097                         align = 5;
2098                         break;
2099                 default:
2100                         align = 4;
2101         }
2102         maximum_skip = (1 << align) - 1;
2103         ia32_emit_alignment(env, align, maximum_skip);
2104 }
2105
2106 /**
2107  * Test wether a block should be aligned.
2108  * For cpus in the P4/Athlon class it is usefull to align jump labels to
2109  * 16 bytes. However we should only do that if the alignment nops before the
2110  * label aren't executed more often than we have jumps to the label.
2111  */
2112 static
2113 int should_align_block(ia32_emit_env_t *env, ir_node *block, ir_node *prev) {
2114         static const double DELTA = .0001;
2115         ir_exec_freq *exec_freq = env->cg->birg->exec_freq;
2116         double        block_freq;
2117         double        prev_freq = 0;  /**< execfreq of the fallthrough block */
2118         double        jmp_freq  = 0;  /**< execfreq of all non-fallthrough blocks */
2119         cpu_support   cpu       = env->isa->opt_arch;
2120         int           i, n_cfgpreds;
2121
2122         if(exec_freq == NULL)
2123                 return 0;
2124         if(cpu == arch_i386 || cpu == arch_i486)
2125                 return 0;
2126
2127         block_freq = get_block_execfreq(exec_freq, block);
2128         if(block_freq < DELTA)
2129                 return 0;
2130
2131         n_cfgpreds = get_Block_n_cfgpreds(block);
2132         for(i = 0; i < n_cfgpreds; ++i) {
2133                 ir_node *pred      = get_Block_cfgpred_block(block, i);
2134                 double   pred_freq = get_block_execfreq(exec_freq, pred);
2135
2136                 if(pred == prev) {
2137                         prev_freq += pred_freq;
2138                 } else {
2139                         jmp_freq  += pred_freq;
2140                 }
2141         }
2142
2143         if(prev_freq < DELTA && !(jmp_freq < DELTA))
2144                 return 1;
2145
2146         jmp_freq /= prev_freq;
2147
2148         switch (cpu) {
2149                 case arch_athlon:
2150                 case arch_athlon_64:
2151                 case arch_k6:
2152                         return jmp_freq > 3;
2153                 default:
2154                         return jmp_freq > 2;
2155         }
2156 }
2157
2158 static
2159 void ia32_emit_block_header(ia32_emit_env_t *env, ir_node *block, ir_node *prev)
2160 {
2161         int           n_cfgpreds;
2162         int           need_label;
2163         int           i, arity;
2164         ir_exec_freq  *exec_freq = env->cg->birg->exec_freq;
2165
2166         need_label = 1;
2167         n_cfgpreds = get_Block_n_cfgpreds(block);
2168         if (n_cfgpreds == 0) {
2169                 need_label = 0;
2170         } else if (n_cfgpreds == 1) {
2171                 ir_node *pred       = get_Block_cfgpred(block, 0);
2172                 ir_node *pred_block = get_nodes_block(pred);
2173
2174                 /* we don't need labels for fallthrough blocks, however switch-jmps
2175                  * are no fallthoughs */
2176                 if(pred_block == prev &&
2177                                 !(is_Proj(pred) && is_ia32_SwitchJmp(get_Proj_pred(pred)))) {
2178                         need_label = 0;
2179                 } else {
2180                         need_label = 1;
2181                 }
2182         } else {
2183                 need_label = 1;
2184         }
2185
2186         if (should_align_block(env, block, prev)) {
2187                 assert(need_label);
2188                 ia32_emit_align_label(env, env->isa->opt_arch);
2189         }
2190
2191         if(need_label) {
2192                 ia32_emit_block_name(env, block);
2193                 be_emit_char(env, ':');
2194
2195                 be_emit_pad_comment(env);
2196                 be_emit_cstring(env, "   /* preds:");
2197
2198                 /* emit list of pred blocks in comment */
2199                 arity = get_irn_arity(block);
2200                 for (i = 0; i < arity; ++i) {
2201                         ir_node *predblock = get_Block_cfgpred_block(block, i);
2202                         be_emit_irprintf(env->emit, " %d", get_irn_node_nr(predblock));
2203                 }
2204         } else {
2205                 be_emit_cstring(env, "\t/* ");
2206                 ia32_emit_block_name(env, block);
2207                 be_emit_cstring(env, ": ");
2208         }
2209         if (exec_freq != NULL) {
2210                 be_emit_irprintf(env->emit, " freq: %f",
2211                                  get_block_execfreq(exec_freq, block));
2212         }
2213         be_emit_cstring(env, " */\n");
2214         be_emit_write_line(env);
2215 }
2216
2217 /**
2218  * Walks over the nodes in a block connected by scheduling edges
2219  * and emits code for each node.
2220  */
2221 static
2222 void ia32_gen_block(ia32_emit_env_t *env, ir_node *block, ir_node *last_block)
2223 {
2224         const ir_node *node;
2225
2226         ia32_emit_block_header(env, block, last_block);
2227
2228         /* emit the contents of the block */
2229         ia32_emit_dbg(env, block);
2230         sched_foreach(block, node) {
2231                 ia32_emit_node(env, node);
2232         }
2233 }
2234
2235 /**
2236  * Emits code for function start.
2237  */
2238 static
2239 void ia32_emit_func_prolog(ia32_emit_env_t *env, ir_graph *irg) {
2240         ir_entity  *irg_ent  = get_irg_entity(irg);
2241         const char *irg_name = get_entity_ld_name(irg_ent);
2242         cpu_support cpu      = env->isa->opt_arch;
2243         const be_irg_t *birg = env->cg->birg;
2244
2245         be_emit_write_line(env);
2246         be_gas_emit_switch_section(env->emit, GAS_SECTION_TEXT);
2247         be_dbg_method_begin(birg->main_env->db_handle, irg_ent, be_abi_get_stack_layout(birg->abi));
2248         ia32_emit_align_func(env, cpu);
2249         if (get_entity_visibility(irg_ent) == visibility_external_visible) {
2250                 be_emit_cstring(env, ".global ");
2251                 be_emit_string(env, irg_name);
2252                 be_emit_char(env, '\n');
2253                 be_emit_write_line(env);
2254         }
2255         ia32_emit_function_object(env, irg_name);
2256         be_emit_string(env, irg_name);
2257         be_emit_cstring(env, ":\n");
2258         be_emit_write_line(env);
2259 }
2260
2261 /**
2262  * Emits code for function end
2263  */
2264 static
2265 void ia32_emit_func_epilog(ia32_emit_env_t *env, ir_graph *irg) {
2266         const char *irg_name = get_entity_ld_name(get_irg_entity(irg));
2267         const be_irg_t *birg = env->cg->birg;
2268
2269         ia32_emit_function_size(env, irg_name);
2270         be_dbg_method_end(birg->main_env->db_handle);
2271         be_emit_char(env, '\n');
2272         be_emit_write_line(env);
2273 }
2274
2275 /**
2276  * Block-walker:
2277  * Sets labels for control flow nodes (jump target)
2278  */
2279 static
2280 void ia32_gen_labels(ir_node *block, void *data) {
2281         ir_node *pred;
2282         int n = get_Block_n_cfgpreds(block);
2283
2284         for (n--; n >= 0; n--) {
2285                 pred = get_Block_cfgpred(block, n);
2286                 set_irn_link(pred, block);
2287         }
2288 }
2289
2290 /**
2291  * Emit an exception label if the current instruction can fail.
2292  */
2293 void ia32_emit_exc_label(ia32_emit_env_t *env, const ir_node *node) {
2294         if (get_ia32_exc_label(node)) {
2295                 be_emit_irprintf(env->emit, ".EXL%u\n", 0);
2296                 be_emit_write_line(env);
2297         }
2298 }
2299
2300 /**
2301  * Main driver. Emits the code for one routine.
2302  */
2303 void ia32_gen_routine(ia32_code_gen_t *cg, ir_graph *irg) {
2304         ia32_emit_env_t env;
2305         ir_node *block;
2306         ir_node *last_block = NULL;
2307         int i, n;
2308
2309         env.isa      = (ia32_isa_t *)cg->arch_env->isa;
2310         env.emit     = &env.isa->emit;
2311         env.arch_env = cg->arch_env;
2312         env.cg       = cg;
2313
2314         ia32_register_emitters();
2315
2316         ia32_emit_func_prolog(&env, irg);
2317         irg_block_walk_graph(irg, ia32_gen_labels, NULL, &env);
2318
2319         n = ARR_LEN(cg->blk_sched);
2320         for (i = 0; i < n;) {
2321                 ir_node *next_bl;
2322
2323                 block   = cg->blk_sched[i];
2324                 ++i;
2325                 next_bl = i < n ? cg->blk_sched[i] : NULL;
2326
2327                 /* set here the link. the emitter expects to find the next block here */
2328                 set_irn_link(block, next_bl);
2329                 ia32_gen_block(&env, block, last_block);
2330                 last_block = block;
2331         }
2332
2333         ia32_emit_func_epilog(&env, irg);
2334 }
2335
2336 void ia32_init_emitter(void)
2337 {
2338         FIRM_DBG_REGISTER(dbg, "firm.be.ia32.emitter");
2339 }