emit new block labels
[libfirm] / ir / be / ia32 / ia32_emitter.c
1 /*
2  * Copyright (C) 1995-2007 University of Karlsruhe.  All right reserved.
3  *
4  * This file is part of libFirm.
5  *
6  * This file may be distributed and/or modified under the terms of the
7  * GNU General Public License version 2 as published by the Free Software
8  * Foundation and appearing in the file LICENSE.GPL included in the
9  * packaging of this file.
10  *
11  * Licensees holding valid libFirm Professional Edition licenses may use
12  * this file in accordance with the libFirm Commercial License.
13  * Agreement provided with the Software.
14  *
15  * This file is provided AS IS with NO WARRANTY OF ANY KIND, INCLUDING THE
16  * WARRANTY OF DESIGN, MERCHANTABILITY AND FITNESS FOR A PARTICULAR
17  * PURPOSE.
18  */
19
20 /**
21  * @file
22  * @brief       This file implements the ia32 node emitter.
23  * @author      Christian Wuerdig, Matthias Braun
24  * @version     $Id$
25  */
26 #ifdef HAVE_CONFIG_H
27 #include "config.h"
28 #endif
29
30 #include <limits.h>
31
32 #include "xmalloc.h"
33 #include "tv.h"
34 #include "iredges.h"
35 #include "debug.h"
36 #include "irgwalk.h"
37 #include "irprintf.h"
38 #include "irop_t.h"
39 #include "irargs_t.h"
40 #include "irprog_t.h"
41 #include "iredges_t.h"
42 #include "execfreq.h"
43 #include "error.h"
44 #include "raw_bitset.h"
45
46 #include "../besched_t.h"
47 #include "../benode_t.h"
48 #include "../beabi.h"
49 #include "../be_dbgout.h"
50 #include "../beemitter.h"
51 #include "../begnuas.h"
52 #include "../beirg_t.h"
53
54 #include "ia32_emitter.h"
55 #include "gen_ia32_emitter.h"
56 #include "gen_ia32_regalloc_if.h"
57 #include "ia32_nodes_attr.h"
58 #include "ia32_new_nodes.h"
59 #include "ia32_map_regs.h"
60 #include "bearch_ia32_t.h"
61
62 DEBUG_ONLY(static firm_dbg_module_t *dbg = NULL;)
63
64 #define BLOCK_PREFIX ".L"
65
66 #define SNPRINTF_BUF_LEN 128
67
68 /**
69  * Returns the register at in position pos.
70  */
71 static
72 const arch_register_t *get_in_reg(ia32_emit_env_t *env, const ir_node *irn,
73                                   int pos)
74 {
75         const arch_env_t       *arch_env = env->arch_env;
76         ir_node                *op;
77         const arch_register_t  *reg = NULL;
78
79         assert(get_irn_arity(irn) > pos && "Invalid IN position");
80
81         /* The out register of the operator at position pos is the
82            in register we need. */
83         op = get_irn_n(irn, pos);
84
85         reg = arch_get_irn_register(arch_env, op);
86
87         assert(reg && "no in register found");
88
89         if(reg == &ia32_gp_regs[REG_GP_NOREG])
90                 panic("trying to emit noreg");
91
92         /* in case of unknown register: just return a valid register */
93         if (reg == &ia32_gp_regs[REG_GP_UKNWN]) {
94                 const arch_register_req_t *req;
95
96                 /* ask for the requirements */
97                 req = arch_get_register_req(arch_env, irn, pos);
98
99                 if (arch_register_req_is(req, limited)) {
100                         /* in case of limited requirements: get the first allowed register */
101                         unsigned idx = rbitset_next(req->limited, 0, 1);
102                         reg = arch_register_for_index(req->cls, idx);
103                 } else {
104                         /* otherwise get first register in class */
105                         reg = arch_register_for_index(req->cls, 0);
106                 }
107         }
108
109         return reg;
110 }
111
112 /**
113  * Returns the register at out position pos.
114  */
115 static
116 const arch_register_t *get_out_reg(ia32_emit_env_t *env, const ir_node *irn,
117                                    int pos)
118 {
119         const arch_env_t      *arch_env = env->arch_env;
120         ir_node               *proj;
121         const arch_register_t *reg = NULL;
122
123         /* 1st case: irn is not of mode_T, so it has only                 */
124         /*           one OUT register -> good                             */
125         /* 2nd case: irn is of mode_T -> collect all Projs and ask the    */
126         /*           Proj with the corresponding projnum for the register */
127
128         if (get_irn_mode(irn) != mode_T) {
129                 reg = arch_get_irn_register(arch_env, irn);
130         } else if (is_ia32_irn(irn)) {
131                 reg = get_ia32_out_reg(irn, pos);
132         } else {
133                 const ir_edge_t *edge;
134
135                 foreach_out_edge(irn, edge) {
136                         proj = get_edge_src_irn(edge);
137                         assert(is_Proj(proj) && "non-Proj from mode_T node");
138                         if (get_Proj_proj(proj) == pos) {
139                                 reg = arch_get_irn_register(arch_env, proj);
140                                 break;
141                         }
142                 }
143         }
144
145         assert(reg && "no out register found");
146         return reg;
147 }
148
149 /**
150  * Determine the gnu assembler suffix that indicates a mode
151  */
152 static
153 char get_mode_suffix(const ir_mode *mode) {
154         if(mode_is_float(mode)) {
155                 switch(get_mode_size_bits(mode)) {
156                 case 32:
157                         return 's';
158                 case 64:
159                         return 'l';
160                 case 80:
161                 case 96:
162                         return 't';
163                 }
164         } else {
165                 assert(mode_is_int(mode) || mode_is_reference(mode));
166                 switch(get_mode_size_bits(mode)) {
167                 case 64:
168                         return 'q';
169                 case 32:
170                         return 'l';
171                 case 16:
172                         return 'w';
173                 case 8:
174                         return 'b';
175                 }
176         }
177         panic("Can't output mode_suffix for %+F\n", mode);
178 }
179
180 static
181 int produces_result(const ir_node *node) {
182         return
183                 !is_ia32_CmpSet(node)    &&
184                 !is_ia32_CondJmp(node)   &&
185                 !is_ia32_St(node)        &&
186                 !is_ia32_SwitchJmp(node) &&
187                 !is_ia32_TestJmp(node)   &&
188                 !is_ia32_xCmpSet(node)   &&
189                 !is_ia32_xCondJmp(node)  &&
190                 !is_ia32_CmpCMov(node)   &&
191                 !is_ia32_TestCMov(node)  &&
192                 !is_ia32_CmpSet(node)    && /* this is correct, the Cmp has no result */
193                 !is_ia32_TestSet(node);
194 }
195
196 static
197 const char *ia32_get_reg_name_for_mode(ia32_emit_env_t *env, ir_mode *mode,
198                                        const arch_register_t *reg) {
199         switch(get_mode_size_bits(mode)) {
200                 case 8:
201                         return ia32_get_mapped_reg_name(env->isa->regs_8bit, reg);
202                 case 16:
203                         return ia32_get_mapped_reg_name(env->isa->regs_16bit, reg);
204                 default:
205                         return (char *)arch_register_get_name(reg);
206         }
207 }
208
209 /**
210  * Add a number to a prefix. This number will not be used a second time.
211  */
212 static
213 char *get_unique_label(char *buf, size_t buflen, const char *prefix) {
214         static unsigned long id = 0;
215         snprintf(buf, buflen, "%s%lu", prefix, ++id);
216         return buf;
217 }
218
219 /*************************************************************
220  *             _       _    __   _          _
221  *            (_)     | |  / _| | |        | |
222  *  _ __  _ __ _ _ __ | |_| |_  | |__   ___| |_ __   ___ _ __
223  * | '_ \| '__| | '_ \| __|  _| | '_ \ / _ \ | '_ \ / _ \ '__|
224  * | |_) | |  | | | | | |_| |   | | | |  __/ | |_) |  __/ |
225  * | .__/|_|  |_|_| |_|\__|_|   |_| |_|\___|_| .__/ \___|_|
226  * | |                                       | |
227  * |_|                                       |_|
228  *************************************************************/
229
230 // we have no C++ and can't define an implicit ia32_emit_env_t* cast to
231 // be_emit_env_t* so we cheat a bit...
232 #define be_emit_char(env,c)             be_emit_char(env->emit,c)
233 #define be_emit_string(env,s)           be_emit_string(env->emit,s)
234 #undef be_emit_cstring
235 #define be_emit_cstring(env,x)          { be_emit_string_len(env->emit, x, sizeof(x)-1); }
236 #define be_emit_ident(env,i)            be_emit_ident(env->emit,i)
237 #define be_emit_tarval(env,tv)          be_emit_tarval(env->emit,tv)
238 #define be_emit_write_line(env)         be_emit_write_line(env->emit)
239 #define be_emit_finish_line_gas(env,n)  be_emit_finish_line_gas(env->emit,n)
240 #define be_emit_pad_comment(env)        be_emit_pad_comment(env->emit)
241
242 void ia32_emit_source_register(ia32_emit_env_t *env, const ir_node *node, int pos)
243 {
244         const arch_register_t *reg = get_in_reg(env, node, pos);
245         const char *reg_name = arch_register_get_name(reg);
246
247         assert(pos < get_irn_arity(node));
248
249         be_emit_char(env, '%');
250         be_emit_string(env, reg_name);
251 }
252
253 void ia32_emit_dest_register(ia32_emit_env_t *env, const ir_node *node, int pos) {
254         const arch_register_t *reg = get_out_reg(env, node, pos);
255         const char *reg_name = arch_register_get_name(reg);
256
257         be_emit_char(env, '%');
258         be_emit_string(env, reg_name);
259 }
260
261 static void ia32_emit_register(ia32_emit_env_t *env, const arch_register_t *reg)
262 {
263         const char *reg_name = arch_register_get_name(reg);
264
265         be_emit_char(env, '%');
266         be_emit_string(env, reg_name);
267 }
268
269 void ia32_emit_x87_name(ia32_emit_env_t *env, const ir_node *node, int pos)
270 {
271         const ia32_x87_attr_t *attr = get_ia32_x87_attr_const(node);
272
273         assert(pos < 3);
274         be_emit_char(env, '%');
275         be_emit_string(env, attr->x87[pos]->name);
276 }
277
278 void ia32_emit_immediate(ia32_emit_env_t *env, const ir_node *node)
279 {
280         tarval *tv;
281         ir_entity *ent;
282         ident *id;
283
284         be_emit_char(env, '$');
285
286         switch(get_ia32_immop_type(node)) {
287         case ia32_ImmConst:
288                 tv = get_ia32_Immop_tarval(node);
289                 be_emit_tarval(env, tv);
290                 return;
291         case ia32_ImmSymConst:
292                 ent = get_ia32_Immop_symconst(node);
293                 set_entity_backend_marked(ent, 1);
294                 id = get_entity_ld_ident(ent);
295                 be_emit_ident(env, id);
296                 return;
297         case ia32_ImmNone:
298                 break;
299         }
300
301         assert(0);
302         be_emit_string(env, "BAD");
303         return;
304 }
305
306 static
307 void ia32_emit_mode_suffix_mode(ia32_emit_env_t *env, const ir_mode *mode)
308 {
309         be_emit_char(env, get_mode_suffix(mode));
310 }
311
312 void ia32_emit_mode_suffix(ia32_emit_env_t *env, const ir_node *node)
313 {
314         ir_mode *mode = get_ia32_ls_mode(node);
315         if(mode == NULL)
316                 mode = mode_Iu;
317
318         ia32_emit_mode_suffix_mode(env, mode);
319 }
320
321 void ia32_emit_x87_mode_suffix(ia32_emit_env_t *env, const ir_node *node)
322 {
323         ir_mode *mode = get_ia32_ls_mode(node);
324         if(mode != NULL)
325                 ia32_emit_mode_suffix_mode(env, mode);
326 }
327
328 static
329 char get_xmm_mode_suffix(ir_mode *mode)
330 {
331         assert(mode_is_float(mode));
332         switch(get_mode_size_bits(mode)) {
333         case 32:
334                 return 's';
335         case 64:
336                 return 'd';
337         default:
338                 assert(0);
339         }
340         return '%';
341 }
342
343 void ia32_emit_xmm_mode_suffix(ia32_emit_env_t *env, const ir_node *node)
344 {
345         ir_mode *mode = get_ia32_ls_mode(node);
346         assert(mode != NULL);
347         be_emit_char(env, 's');
348         be_emit_char(env, get_xmm_mode_suffix(mode));
349 }
350
351 void ia32_emit_xmm_mode_suffix_s(ia32_emit_env_t *env, const ir_node *node)
352 {
353         ir_mode *mode = get_ia32_ls_mode(node);
354         assert(mode != NULL);
355         be_emit_char(env, get_xmm_mode_suffix(mode));
356 }
357
358 void ia32_emit_extend_suffix(ia32_emit_env_t *env, const ir_mode *mode)
359 {
360         if(get_mode_size_bits(mode) == 32)
361                 return;
362         if(mode_is_signed(mode)) {
363                 be_emit_char(env, 's');
364         } else {
365                 be_emit_char(env, 'z');
366         }
367 }
368
369 static
370 void ia32_emit_function_object(ia32_emit_env_t *env, const char *name)
371 {
372         switch (be_gas_flavour) {
373         case GAS_FLAVOUR_NORMAL:
374                 be_emit_cstring(env, "\t.type\t");
375                 be_emit_string(env, name);
376                 be_emit_cstring(env, ", @function\n");
377                 be_emit_write_line(env);
378                 break;
379         case GAS_FLAVOUR_MINGW:
380                 be_emit_cstring(env, "\t.def\t");
381                 be_emit_string(env, name);
382                 be_emit_cstring(env, ";\t.scl\t2;\t.type\t32;\t.endef\n");
383                 be_emit_write_line(env);
384                 break;
385         default:
386                 break;
387         }
388 }
389
390 static
391 void ia32_emit_function_size(ia32_emit_env_t *env, const char *name)
392 {
393         switch (be_gas_flavour) {
394         case GAS_FLAVOUR_NORMAL:
395                 be_emit_cstring(env, "\t.size\t");
396                 be_emit_string(env, name);
397                 be_emit_cstring(env, ", .-");
398                 be_emit_string(env, name);
399                 be_emit_char(env, '\n');
400                 be_emit_write_line(env);
401                 break;
402         default:
403                 break;
404         }
405 }
406
407
408 static
409 void emit_ia32_Immediate(ia32_emit_env_t *env, const ir_node *node);
410
411 /**
412  * Emits registers and/or address mode of a binary operation.
413  */
414 void ia32_emit_binop(ia32_emit_env_t *env, const ir_node *node) {
415         int            right_pos;
416         const ir_node *right_op = get_irn_n(node, 3);
417
418         switch(get_ia32_op_type(node)) {
419         case ia32_Normal:
420                 if(is_ia32_Immediate(right_op)) {
421                         emit_ia32_Immediate(env, right_op);
422                         be_emit_cstring(env, ", ");
423                         ia32_emit_source_register(env, node, 2);
424                         break;
425                 } else if (is_ia32_ImmConst(node) || is_ia32_ImmSymConst(node)) {
426                         ia32_emit_immediate(env, node);
427                         be_emit_cstring(env, ", ");
428                         ia32_emit_source_register(env, node, 2);
429                 } else {
430                         const arch_register_t *in1 = get_in_reg(env, node, 2);
431                         const arch_register_t *in2 = get_in_reg(env, node, 3);
432                         const arch_register_t *out = produces_result(node) ? get_out_reg(env, node, 0) : NULL;
433                         const arch_register_t *in;
434                         const char            *in_name;
435
436                         in      = out ? ((out == in2) ? in1 : in2) : in2;
437                         out     = out ? out : in1;
438                         in_name = arch_register_get_name(in);
439
440                         if (is_ia32_emit_cl(node)) {
441                                 assert(in == &ia32_gp_regs[REG_ECX]);
442                                 in_name = "cl";
443                         }
444
445                         be_emit_char(env, '%');
446                         be_emit_string(env, in_name);
447                         be_emit_cstring(env, ", %");
448                         be_emit_string(env, arch_register_get_name(out));
449                 }
450                 break;
451         case ia32_AddrModeS:
452                 if (is_ia32_ImmConst(node) || is_ia32_ImmSymConst(node)) {
453                         assert(!produces_result(node) &&
454                                         "Source AM with Const must not produce result");
455                         ia32_emit_immediate(env, node);
456                         be_emit_cstring(env, ", ");
457                         ia32_emit_am(env, node);
458                 } else if(is_ia32_Immediate(right_op)) {
459                         assert(!produces_result(node) &&
460                                         "Source AM with Const must not produce result");
461
462                         emit_ia32_Immediate(env, right_op);
463                         be_emit_cstring(env, ", ");
464                         ia32_emit_am(env, node);
465                 } else if (produces_result(node)) {
466                         ia32_emit_am(env, node);
467                         be_emit_cstring(env, ", ");
468                         ia32_emit_dest_register(env, node, 0);
469                 } else {
470                         ia32_emit_am(env, node);
471                         be_emit_cstring(env, ", ");
472                         ia32_emit_source_register(env, node, 2);
473                 }
474                 break;
475         case ia32_AddrModeD:
476                 right_pos = get_irn_arity(node) >= 5 ? 3 : 2;
477                 right_op  = get_irn_n(node, right_pos);
478                 if(is_ia32_Immediate(right_op)) {
479                         emit_ia32_Immediate(env, right_op);
480                         be_emit_cstring(env, ", ");
481                         ia32_emit_am(env, node);
482                         break;
483                 } else if (is_ia32_ImmConst(node) || is_ia32_ImmSymConst(node)) {
484                         ia32_emit_immediate(env, node);
485                         be_emit_cstring(env, ", ");
486                         ia32_emit_am(env, node);
487                 } else {
488                         const arch_register_t *in1 = get_in_reg(env, node, right_pos);
489                         ir_mode               *mode = get_ia32_ls_mode(node);
490                         const char            *in_name;
491
492                         in_name = ia32_get_reg_name_for_mode(env, mode, in1);
493
494                         if (is_ia32_emit_cl(node)) {
495                                 assert(in1 == &ia32_gp_regs[REG_ECX]);
496                                 in_name = "cl";
497                         }
498
499                         be_emit_char(env, '%');
500                         be_emit_string(env, in_name);
501                         be_emit_cstring(env, ", ");
502                         ia32_emit_am(env, node);
503                 }
504                 break;
505         default:
506                 assert(0 && "unsupported op type");
507         }
508 }
509
510 /**
511  * Emits registers and/or address mode of a binary operation.
512  */
513 void ia32_emit_x87_binop(ia32_emit_env_t *env, const ir_node *node) {
514         switch(get_ia32_op_type(node)) {
515                 case ia32_Normal:
516                         if (is_ia32_ImmConst(node) || is_ia32_ImmSymConst(node)) {
517                                 // should not happen...
518                                 assert(0);
519                         } else {
520                                 const ia32_x87_attr_t *x87_attr = get_ia32_x87_attr_const(node);
521                                 const arch_register_t *in1      = x87_attr->x87[0];
522                                 const arch_register_t *in2      = x87_attr->x87[1];
523                                 const arch_register_t *out      = x87_attr->x87[2];
524                                 const arch_register_t *in;
525
526                                 in  = out ? ((out == in2) ? in1 : in2) : in2;
527                                 out = out ? out : in1;
528
529                                 be_emit_char(env, '%');
530                                 be_emit_string(env, arch_register_get_name(in));
531                                 be_emit_cstring(env, ", %");
532                                 be_emit_string(env, arch_register_get_name(out));
533                         }
534                         break;
535                 case ia32_AddrModeS:
536                 case ia32_AddrModeD:
537                         ia32_emit_am(env, node);
538                         break;
539                 default:
540                         assert(0 && "unsupported op type");
541         }
542 }
543
544 void ia32_emit_am_or_dest_register(ia32_emit_env_t *env, const ir_node *node,
545                                    int pos) {
546         if(get_ia32_op_type(node) == ia32_Normal) {
547                 ia32_emit_dest_register(env, node, pos);
548         } else {
549                 assert(get_ia32_op_type(node) == ia32_AddrModeD);
550                 ia32_emit_am(env, node);
551         }
552 }
553
554 /**
555  * Emits registers and/or address mode of a unary operation.
556  */
557 void ia32_emit_unop(ia32_emit_env_t *env, const ir_node *node, int pos) {
558         const ir_node *op;
559
560         switch(get_ia32_op_type(node)) {
561         case ia32_Normal:
562                 op = get_irn_n(node, pos);
563                 if (is_ia32_Immediate(op)) {
564                         emit_ia32_Immediate(env, op);
565                 } else if (is_ia32_ImmConst(node) || is_ia32_ImmSymConst(node)) {
566                         ia32_emit_immediate(env, node);
567                 } else {
568                         ia32_emit_source_register(env, node, pos);
569                 }
570                 break;
571         case ia32_AddrModeS:
572         case ia32_AddrModeD:
573                 ia32_emit_am(env, node);
574                 break;
575         default:
576                 assert(0 && "unsupported op type");
577         }
578 }
579
580 /**
581  * Emits address mode.
582  */
583 void ia32_emit_am(ia32_emit_env_t *env, const ir_node *node) {
584         ir_entity *ent       = get_ia32_am_sc(node);
585         int        offs      = get_ia32_am_offs_int(node);
586         ir_node   *base      = get_irn_n(node, 0);
587         int        has_base  = !is_ia32_NoReg_GP(base);
588         ir_node   *index     = get_irn_n(node, 1);
589         int        has_index = !is_ia32_NoReg_GP(index);
590
591         /* just to be sure... */
592         assert(!is_ia32_use_frame(node) || get_ia32_frame_ent(node) != NULL);
593
594         /* emit offset */
595         if (ent != NULL) {
596                 ident *id;
597
598                 set_entity_backend_marked(ent, 1);
599                 id = get_entity_ld_ident(ent);
600                 if (is_ia32_am_sc_sign(node))
601                         be_emit_char(env, '-');
602                 be_emit_ident(env, id);
603
604                 if(get_entity_owner(ent) == get_tls_type()) {
605                         if (get_entity_visibility(ent) == visibility_external_allocated) {
606                                 be_emit_cstring(env, "@INDNTPOFF");
607                         } else {
608                                 be_emit_cstring(env, "@NTPOFF");
609                         }
610                 }
611         }
612
613         if(offs != 0) {
614                 if(ent != NULL) {
615                         be_emit_irprintf(env->emit, "%+d", offs);
616                 } else {
617                         be_emit_irprintf(env->emit, "%d", offs);
618                 }
619         }
620
621         if (has_base || has_index) {
622                 be_emit_char(env, '(');
623
624                 /* emit base */
625                 if (has_base) {
626                         ia32_emit_source_register(env, node, 0);
627                 }
628
629                 /* emit index + scale */
630                 if (has_index) {
631                         int scale;
632                         be_emit_char(env, ',');
633                         ia32_emit_source_register(env, node, 1);
634
635                         scale = get_ia32_am_scale(node);
636                         if (scale > 0) {
637                                 be_emit_irprintf(env->emit, ",%d", 1 << get_ia32_am_scale(node));
638                         }
639                 }
640                 be_emit_char(env, ')');
641         }
642 }
643
644 /*************************************************
645  *                 _ _                         _
646  *                (_) |                       | |
647  *   ___ _ __ ___  _| |_    ___ ___  _ __   __| |
648  *  / _ \ '_ ` _ \| | __|  / __/ _ \| '_ \ / _` |
649  * |  __/ | | | | | | |_  | (_| (_) | | | | (_| |
650  *  \___|_| |_| |_|_|\__|  \___\___/|_| |_|\__,_|
651  *
652  *************************************************/
653
654 #undef IA32_DO_EMIT
655 #define IA32_DO_EMIT(irn) ia32_fprintf_format(F, irn, cmd_buf, cmnt_buf)
656
657 /*
658  * coding of conditions
659  */
660 struct cmp2conditon_t {
661         const char *name;
662         pn_Cmp      num;
663 };
664
665 /*
666  * positive conditions for signed compares
667  */
668 static
669 const struct cmp2conditon_t cmp2condition_s[] = {
670         { NULL,              pn_Cmp_False },  /* always false */
671         { "e",               pn_Cmp_Eq },     /* == */
672         { "l",               pn_Cmp_Lt },     /* < */
673         { "le",              pn_Cmp_Le },     /* <= */
674         { "g",               pn_Cmp_Gt },     /* > */
675         { "ge",              pn_Cmp_Ge },     /* >= */
676         { "ne",              pn_Cmp_Lg },     /* != */
677         { NULL,              pn_Cmp_Leg},     /* Floating point: ordered */
678 };
679
680 /*
681  * positive conditions for unsigned compares
682  */
683 static
684 const struct cmp2conditon_t cmp2condition_u[] = {
685         { NULL,              pn_Cmp_False },  /* always false */
686         { "e",               pn_Cmp_Eq },     /* == */
687         { "b",               pn_Cmp_Lt },     /* < */
688         { "be",              pn_Cmp_Le },     /* <= */
689         { "a",               pn_Cmp_Gt },     /* > */
690         { "ae",              pn_Cmp_Ge },     /* >= */
691         { "ne",              pn_Cmp_Lg },     /* != */
692         { NULL,              pn_Cmp_True },   /* always true */
693 };
694
695 /*
696  * returns the condition code
697  */
698 static
699 const char *get_cmp_suffix(pn_Cmp cmp_code)
700 {
701         assert( (cmp2condition_s[cmp_code & 7].num) == (cmp_code & 7));
702         assert( (cmp2condition_u[cmp_code & 7].num) == (cmp_code & 7));
703
704         if((cmp_code & ia32_pn_Cmp_Unsigned)) {
705                 return cmp2condition_u[cmp_code & 7].name;
706         } else {
707                 return cmp2condition_s[cmp_code & 7].name;
708         }
709 }
710
711 void ia32_emit_cmp_suffix(ia32_emit_env_t *env, long pnc)
712 {
713         be_emit_string(env, get_cmp_suffix(pnc));
714 }
715
716
717 /**
718  * Returns the target block for a control flow node.
719  */
720 static
721 ir_node *get_cfop_target_block(const ir_node *irn) {
722         return get_irn_link(irn);
723 }
724
725 /**
726  * Emits a block label for the given block.
727  */
728 static
729 void ia32_emit_block_name(ia32_emit_env_t *env, const ir_node *block)
730 {
731         if (has_Block_label(block)) {
732                 be_emit_string(env, be_gas_label_prefix());
733                 be_emit_irprintf(env->emit, "%u", (unsigned)get_Block_label(block));
734         } else {
735                 be_emit_cstring(env, BLOCK_PREFIX);
736                 be_emit_irprintf(env->emit, "%d", get_irn_node_nr(block));
737         }
738 }
739
740 /**
741  * Emits the target label for a control flow node.
742  */
743 static
744 void ia32_emit_cfop_target(ia32_emit_env_t * env, const ir_node *node) {
745         ir_node *block = get_cfop_target_block(node);
746
747         ia32_emit_block_name(env, block);
748 }
749
750 /** Return the next block in Block schedule */
751 static ir_node *next_blk_sched(const ir_node *block) {
752         return get_irn_link(block);
753 }
754
755 /**
756  * Returns the Proj with projection number proj and NOT mode_M
757  */
758 static
759 ir_node *get_proj(const ir_node *node, long proj) {
760         const ir_edge_t *edge;
761         ir_node         *src;
762
763         assert(get_irn_mode(node) == mode_T && "expected mode_T node");
764
765         foreach_out_edge(node, edge) {
766                 src = get_edge_src_irn(edge);
767
768                 assert(is_Proj(src) && "Proj expected");
769                 if (get_irn_mode(src) == mode_M)
770                         continue;
771
772                 if (get_Proj_proj(src) == proj)
773                         return src;
774         }
775         return NULL;
776 }
777
778 /**
779  * Emits the jump sequence for a conditional jump (cmp + jmp_true + jmp_false)
780  */
781 static
782 void finish_CondJmp(ia32_emit_env_t *env, const ir_node *node, ir_mode *mode,
783                     long pnc) {
784         const ir_node *proj_true;
785         const ir_node *proj_false;
786         const ir_node *block;
787         const ir_node *next_block;
788         int flipped = 0;
789
790         /* get both Proj's */
791         proj_true = get_proj(node, pn_Cond_true);
792         assert(proj_true && "CondJmp without true Proj");
793
794         proj_false = get_proj(node, pn_Cond_false);
795         assert(proj_false && "CondJmp without false Proj");
796
797         /* for now, the code works for scheduled and non-schedules blocks */
798         block = get_nodes_block(node);
799
800         /* we have a block schedule */
801         next_block = next_blk_sched(block);
802
803         if (get_cfop_target_block(proj_true) == next_block) {
804                 /* exchange both proj's so the second one can be omitted */
805                 const ir_node *t = proj_true;
806
807                 proj_true  = proj_false;
808                 proj_false = t;
809                 flipped    = 1;
810                 pnc        = get_negated_pnc(pnc, mode);
811         }
812
813         if (mode_is_float(mode)) {
814                 /* Some floating point comparisons require a test of the parity flag, which
815                  * indicates that the result is unordered */
816                 switch (pnc) {
817                         case pn_Cmp_Uo:
818                                 be_emit_cstring(env, "\tjp ");
819                                 ia32_emit_cfop_target(env, proj_true);
820                                 be_emit_finish_line_gas(env, proj_true);
821                                 break;
822
823                         case pn_Cmp_Leg:
824                                 be_emit_cstring(env, "\tjnp ");
825                                 ia32_emit_cfop_target(env, proj_true);
826                                 be_emit_finish_line_gas(env, proj_true);
827                                 break;
828
829                         case pn_Cmp_Eq:
830                         case pn_Cmp_Lt:
831                         case pn_Cmp_Le:
832                                 be_emit_cstring(env, "\tjp ");
833                                 ia32_emit_cfop_target(env, proj_false);
834                                 be_emit_finish_line_gas(env, proj_false);
835                                 goto float_jcc;
836
837                         case pn_Cmp_Ug:
838                         case pn_Cmp_Uge:
839                         case pn_Cmp_Ne:
840                                 be_emit_cstring(env, "\tjp ");
841                                 ia32_emit_cfop_target(env, proj_true);
842                                 be_emit_finish_line_gas(env, proj_true);
843                                 goto float_jcc;
844
845                         default:
846                         float_jcc:
847                                 /* The bits set by floating point compares correspond to unsigned
848                                  * comparisons */
849                                 pnc |= ia32_pn_Cmp_Unsigned;
850                                 goto emit_jcc;
851                 }
852         } else {
853 emit_jcc:
854                 be_emit_cstring(env, "\tj");
855                 ia32_emit_cmp_suffix(env, pnc);
856                 be_emit_char(env, ' ');
857                 ia32_emit_cfop_target(env, proj_true);
858                 be_emit_finish_line_gas(env, proj_true);
859         }
860
861         /* the second Proj might be a fallthrough */
862         if (get_cfop_target_block(proj_false) != next_block) {
863                 be_emit_cstring(env, "\tjmp ");
864                 ia32_emit_cfop_target(env, proj_false);
865                 be_emit_finish_line_gas(env, proj_false);
866         } else {
867                 be_emit_cstring(env, "\t/* fallthrough to ");
868                 ia32_emit_cfop_target(env, proj_false);
869                 be_emit_cstring(env, " */");
870                 be_emit_finish_line_gas(env, proj_false);
871         }
872 }
873
874 /**
875  * Emits code for conditional jump.
876  */
877 static
878 void CondJmp_emitter(ia32_emit_env_t *env, const ir_node *node) {
879         be_emit_cstring(env, "\tcmp");
880         ia32_emit_mode_suffix(env, node);
881         be_emit_char(env, ' ');
882         ia32_emit_binop(env, node);
883         be_emit_finish_line_gas(env, node);
884
885         finish_CondJmp(env, node, mode_Iu, get_ia32_pncode(node));
886 }
887
888 /**
889  * Emits code for conditional jump with two variables.
890  */
891 static
892 void emit_ia32_CondJmp(ia32_emit_env_t *env, const ir_node *node) {
893         CondJmp_emitter(env, node);
894 }
895
896 /**
897  * Emits code for conditional test and jump.
898  */
899 static
900 void TestJmp_emitter(ia32_emit_env_t *env, const ir_node *node) {
901         be_emit_cstring(env, "\ttest");
902         ia32_emit_mode_suffix(env, node);
903         be_emit_char(env, ' ');
904
905         ia32_emit_binop(env, node);
906         be_emit_finish_line_gas(env, node);
907
908         finish_CondJmp(env, node, mode_Iu, get_ia32_pncode(node));
909 }
910
911 /**
912  * Emits code for conditional test and jump with two variables.
913  */
914 static
915 void emit_ia32_TestJmp(ia32_emit_env_t *env, const ir_node *node) {
916         TestJmp_emitter(env, node);
917 }
918
919 /**
920  * Emits code for conditional SSE floating point jump with two variables.
921  */
922 static
923 void emit_ia32_xCondJmp(ia32_emit_env_t *env, const ir_node *node) {
924         be_emit_cstring(env, "\tucomi");
925         ia32_emit_xmm_mode_suffix(env, node);
926         be_emit_char(env, ' ');
927         ia32_emit_binop(env, node);
928         be_emit_finish_line_gas(env, node);
929
930         finish_CondJmp(env, node, mode_F, get_ia32_pncode(node));
931 }
932
933 /**
934  * Emits code for conditional x87 floating point jump with two variables.
935  */
936 static
937 void emit_ia32_x87CondJmp(ia32_emit_env_t *env, const ir_node *node) {
938         const ia32_x87_attr_t *x87_attr = get_ia32_x87_attr_const(node);
939         const char            *reg      = x87_attr->x87[1]->name;
940         long                   pnc      = get_ia32_pncode(node);
941
942         switch (get_ia32_irn_opcode(node)) {
943         case iro_ia32_fcomrJmp:
944                 pnc = get_inversed_pnc(pnc);
945                 reg = x87_attr->x87[0]->name;
946         case iro_ia32_fcomJmp:
947         default:
948                 be_emit_cstring(env, "\tfucom ");
949                 break;
950         case iro_ia32_fcomrpJmp:
951                 pnc = get_inversed_pnc(pnc);
952                 reg = x87_attr->x87[0]->name;
953         case iro_ia32_fcompJmp:
954                 be_emit_cstring(env, "\tfucomp ");
955                 break;
956         case iro_ia32_fcomrppJmp:
957                 pnc = get_inversed_pnc(pnc);
958         case iro_ia32_fcomppJmp:
959                 be_emit_cstring(env, "\tfucompp ");
960                 reg = "";
961                 break;
962         }
963
964         if(reg[0] != '\0') {
965                 be_emit_char(env, '%');
966                 be_emit_string(env, reg);
967         }
968         be_emit_finish_line_gas(env, node);
969
970         be_emit_cstring(env, "\tfnstsw %ax");
971         be_emit_finish_line_gas(env, node);
972         be_emit_cstring(env, "\tsahf");
973         be_emit_finish_line_gas(env, node);
974
975         finish_CondJmp(env, node, mode_E, pnc);
976 }
977
978 static
979 void CMov_emitter(ia32_emit_env_t *env, const ir_node *node)
980 {
981         const arch_register_t *in1, *in2, *out;
982         long  pnc = get_ia32_pncode(node);
983
984         out = arch_get_irn_register(env->arch_env, node);
985
986         /* we have to emit the cmp first, because the destination register */
987         /* could be one of the compare registers                           */
988         if (is_ia32_xCmpCMov(node)) {
989                 be_emit_cstring(env, "\tucomis");
990                 ia32_emit_mode_suffix_mode(env, get_irn_mode(node));
991                 be_emit_char(env, ' ');
992                 ia32_emit_source_register(env, node, 1);
993                 be_emit_cstring(env, ", ");
994                 ia32_emit_source_register(env, node, 0);
995
996                 in1 = arch_get_irn_register(env->arch_env, get_irn_n(node, 2));
997                 in2 = arch_get_irn_register(env->arch_env, get_irn_n(node, 3));
998         } else {
999                 if (is_ia32_CmpCMov(node)) {
1000                         be_emit_cstring(env, "\tcmp ");
1001                 } else {
1002                         assert(is_ia32_TestCMov(node));
1003                         be_emit_cstring(env, "\ttest ");
1004                 }
1005                 ia32_emit_binop(env, node);
1006
1007                 in1 = arch_get_irn_register(env->arch_env, get_irn_n(node, 5));
1008                 in2 = arch_get_irn_register(env->arch_env, get_irn_n(node, 6));
1009         }
1010         be_emit_finish_line_gas(env, node);
1011
1012         if (out == in2) {
1013                 /* best case: default in == out -> do nothing */
1014         } else if(in2 == &ia32_gp_regs[REG_GP_UKNWN]) {
1015                 /* also nothign to do for unknown regs */
1016         } else if (out == in1) {
1017                 const arch_register_t *t;
1018                 /* true in == out -> need complement compare and exchange true and
1019                  * default in */
1020                 t   = in1;
1021                 in1 = in2;
1022                 in2 = t;
1023                 pnc = get_negated_pnc(pnc, get_irn_mode(node));
1024         } else {
1025                 /* out is different from both ins: need copy default -> out */
1026                 be_emit_cstring(env, "\tmovl ");
1027                 ia32_emit_register(env, in2);
1028                 be_emit_cstring(env, ", ");
1029                 ia32_emit_register(env, out);
1030                 be_emit_finish_line_gas(env, node);
1031         }
1032
1033         be_emit_cstring(env, "\tcmov");
1034         ia32_emit_cmp_suffix(env, pnc );
1035         be_emit_cstring(env, "l ");
1036         ia32_emit_register(env, in1);
1037         be_emit_cstring(env, ", ");
1038         ia32_emit_register(env, out);
1039
1040         be_emit_finish_line_gas(env, node);
1041 }
1042
1043 static
1044 void emit_ia32_CmpCMov(ia32_emit_env_t *env, const ir_node *node)
1045 {
1046         CMov_emitter(env, node);
1047 }
1048
1049 static
1050 void emit_ia32_TestCMov(ia32_emit_env_t *env, const ir_node *node)
1051 {
1052         CMov_emitter(env, node);
1053 }
1054
1055 static
1056 void emit_ia32_xCmpCMov(ia32_emit_env_t *env, const ir_node *node)
1057 {
1058         CMov_emitter(env, node);
1059 }
1060
1061 static
1062 void Set_emitter(ia32_emit_env_t *env, const ir_node *node)
1063 {
1064         long pnc = get_ia32_pncode(node);
1065         const char *reg8bit;
1066         const arch_register_t *out;
1067
1068         out     = arch_get_irn_register(env->arch_env, node);
1069         reg8bit = ia32_get_mapped_reg_name(env->isa->regs_8bit, out);
1070
1071         if(is_ia32_xCmpSet(node)) {
1072                 be_emit_cstring(env, "\tucomis");
1073                 ia32_emit_mode_suffix_mode(env, get_irn_mode(get_irn_n(node, 2)));
1074                 be_emit_char(env, ' ');
1075                 ia32_emit_binop(env, node);
1076         } else {
1077                 if (is_ia32_CmpSet(node)) {
1078                         be_emit_cstring(env, "\tcmp ");
1079                 } else {
1080                         assert(is_ia32_TestSet(node));
1081                         be_emit_cstring(env, "\ttest ");
1082                 }
1083                 ia32_emit_binop(env, node);
1084         }
1085         be_emit_finish_line_gas(env, node);
1086
1087         /* use mov to clear target because it doesn't affect the eflags */
1088         be_emit_cstring(env, "\tmovl $0, %");
1089         be_emit_string(env, arch_register_get_name(out));
1090         be_emit_finish_line_gas(env, node);
1091
1092         be_emit_cstring(env, "\tset");
1093         ia32_emit_cmp_suffix(env, pnc);
1094         be_emit_cstring(env, " %");
1095         be_emit_string(env, reg8bit);
1096         be_emit_finish_line_gas(env, node);
1097 }
1098
1099 static
1100 void emit_ia32_CmpSet(ia32_emit_env_t *env, const ir_node *node) {
1101         Set_emitter(env, node);
1102 }
1103
1104 static
1105 void emit_ia32_TestSet(ia32_emit_env_t *env, const ir_node *node) {
1106         Set_emitter(env, node);
1107 }
1108
1109 static
1110 void emit_ia32_xCmpSet(ia32_emit_env_t *env, const ir_node *node) {
1111         Set_emitter(env, node);
1112 }
1113
1114 static
1115 void emit_ia32_xCmp(ia32_emit_env_t *env, const ir_node *node) {
1116         int  sse_pnc  = -1;
1117         long pnc      = get_ia32_pncode(node);
1118         long unord    = pnc & pn_Cmp_Uo;
1119
1120         assert( (pnc & ia32_pn_Cmp_Unsigned) == 0);
1121
1122         switch (pnc) {
1123                 case pn_Cmp_Leg: /* odered */
1124                         sse_pnc = 7;
1125                         break;
1126                 case pn_Cmp_Uo:  /* unordered */
1127                         sse_pnc = 3;
1128                         break;
1129                 case pn_Cmp_Ue:
1130                 case pn_Cmp_Eq:  /* == */
1131                         sse_pnc = 0;
1132                         break;
1133                 case pn_Cmp_Ul:
1134                 case pn_Cmp_Lt:  /* < */
1135                         sse_pnc = 1;
1136                         break;
1137                 case pn_Cmp_Ule:
1138                 case pn_Cmp_Le: /* <= */
1139                         sse_pnc = 2;
1140                         break;
1141                 case pn_Cmp_Ug:
1142                 case pn_Cmp_Gt:  /* > */
1143                         sse_pnc = 6;
1144                         break;
1145                 case pn_Cmp_Uge:
1146                 case pn_Cmp_Ge: /* >= */
1147                         sse_pnc = 5;
1148                         break;
1149                 case pn_Cmp_Ne:
1150                 case pn_Cmp_Lg:  /* != */
1151                         sse_pnc = 4;
1152                         break;
1153         }
1154
1155         assert(sse_pnc >= 0 && "unsupported compare");
1156
1157         if (unord && sse_pnc != 3) {
1158                 /*
1159                         We need a separate compare against unordered.
1160                         Quick and Dirty solution:
1161                         - get some memory on stack
1162                         - compare
1163                         - store result
1164                         - compare
1165                         - and result and stored result
1166                     - cleanup stack
1167                 */
1168                 be_emit_cstring(env, "\tsubl $8, %esp");
1169                 be_emit_finish_line_gas(env, node);
1170
1171                 be_emit_cstring(env, "\tcmpsd $3, ");
1172                 ia32_emit_binop(env, node);
1173                 be_emit_finish_line_gas(env, node);
1174
1175                 be_emit_cstring(env, "\tmovsd ");
1176                 ia32_emit_dest_register(env, node, 0);
1177                 be_emit_cstring(env, ", (%esp)");
1178                 be_emit_finish_line_gas(env, node);
1179         }
1180
1181         be_emit_cstring(env, "\tcmpsd ");
1182         be_emit_irprintf(env->emit, "%d, ", sse_pnc);
1183         ia32_emit_binop(env, node);
1184         be_emit_finish_line_gas(env, node);
1185
1186         if (unord && sse_pnc != 3) {
1187                 be_emit_cstring(env, "\tandpd (%esp), ");
1188                 ia32_emit_dest_register(env, node, 0);
1189                 be_emit_finish_line_gas(env, node);
1190
1191                 be_emit_cstring(env, "\taddl $8, %esp");
1192                 be_emit_finish_line_gas(env, node);
1193         }
1194 }
1195
1196 /*********************************************************
1197  *                 _ _       _
1198  *                (_) |     (_)
1199  *   ___ _ __ ___  _| |_     _ _   _ _ __ ___  _ __  ___
1200  *  / _ \ '_ ` _ \| | __|   | | | | | '_ ` _ \| '_ \/ __|
1201  * |  __/ | | | | | | |_    | | |_| | | | | | | |_) \__ \
1202  *  \___|_| |_| |_|_|\__|   | |\__,_|_| |_| |_| .__/|___/
1203  *                         _/ |               | |
1204  *                        |__/                |_|
1205  *********************************************************/
1206
1207 /* jump table entry (target and corresponding number) */
1208 typedef struct _branch_t {
1209         ir_node *target;
1210         int      value;
1211 } branch_t;
1212
1213 /* jump table for switch generation */
1214 typedef struct _jmp_tbl_t {
1215         ir_node  *defProj;         /**< default target */
1216         long      min_value;       /**< smallest switch case */
1217         long      max_value;       /**< largest switch case */
1218         long      num_branches;    /**< number of jumps */
1219         char     *label;           /**< label of the jump table */
1220         branch_t *branches;        /**< jump array */
1221 } jmp_tbl_t;
1222
1223 /**
1224  * Compare two variables of type branch_t. Used to sort all switch cases
1225  */
1226 static
1227 int ia32_cmp_branch_t(const void *a, const void *b) {
1228         branch_t *b1 = (branch_t *)a;
1229         branch_t *b2 = (branch_t *)b;
1230
1231         if (b1->value <= b2->value)
1232                 return -1;
1233         else
1234                 return 1;
1235 }
1236
1237 /**
1238  * Emits code for a SwitchJmp (creates a jump table if
1239  * possible otherwise a cmp-jmp cascade). Port from
1240  * cggg ia32 backend
1241  */
1242 static
1243 void emit_ia32_SwitchJmp(ia32_emit_env_t *env, const ir_node *node) {
1244         unsigned long       interval;
1245         int                 last_value, i;
1246         long                pnc;
1247         jmp_tbl_t           tbl;
1248         ir_node            *proj;
1249         const ir_edge_t    *edge;
1250
1251         /* fill the table structure */
1252         tbl.label        = xmalloc(SNPRINTF_BUF_LEN);
1253         tbl.label        = get_unique_label(tbl.label, SNPRINTF_BUF_LEN, ".TBL_");
1254         tbl.defProj      = NULL;
1255         tbl.num_branches = get_irn_n_edges(node);
1256         tbl.branches     = xcalloc(tbl.num_branches, sizeof(tbl.branches[0]));
1257         tbl.min_value    = INT_MAX;
1258         tbl.max_value    = INT_MIN;
1259
1260         i = 0;
1261         /* go over all proj's and collect them */
1262         foreach_out_edge(node, edge) {
1263                 proj = get_edge_src_irn(edge);
1264                 assert(is_Proj(proj) && "Only proj allowed at SwitchJmp");
1265
1266                 pnc = get_Proj_proj(proj);
1267
1268                 /* create branch entry */
1269                 tbl.branches[i].target = proj;
1270                 tbl.branches[i].value  = pnc;
1271
1272                 tbl.min_value = pnc < tbl.min_value ? pnc : tbl.min_value;
1273                 tbl.max_value = pnc > tbl.max_value ? pnc : tbl.max_value;
1274
1275                 /* check for default proj */
1276                 if (pnc == get_ia32_pncode(node)) {
1277                         assert(tbl.defProj == NULL && "found two defProjs at SwitchJmp");
1278                         tbl.defProj = proj;
1279                 }
1280
1281                 i++;
1282         }
1283
1284         /* sort the branches by their number */
1285         qsort(tbl.branches, tbl.num_branches, sizeof(tbl.branches[0]), ia32_cmp_branch_t);
1286
1287         /* two-complement's magic make this work without overflow */
1288         interval = tbl.max_value - tbl.min_value;
1289
1290         /* emit the table */
1291         be_emit_cstring(env, "\tcmpl $");
1292         be_emit_irprintf(env->emit, "%u, ", interval);
1293         ia32_emit_source_register(env, node, 0);
1294         be_emit_finish_line_gas(env, node);
1295
1296         be_emit_cstring(env, "\tja ");
1297         ia32_emit_cfop_target(env, tbl.defProj);
1298         be_emit_finish_line_gas(env, node);
1299
1300         if (tbl.num_branches > 1) {
1301                 /* create table */
1302                 be_emit_cstring(env, "\tjmp *");
1303                 be_emit_string(env, tbl.label);
1304                 be_emit_cstring(env, "(,");
1305                 ia32_emit_source_register(env, node, 0);
1306                 be_emit_cstring(env, ",4)");
1307                 be_emit_finish_line_gas(env, node);
1308
1309                 be_gas_emit_switch_section(env->emit, GAS_SECTION_RODATA);
1310                 be_emit_cstring(env, "\t.align 4\n");
1311                 be_emit_write_line(env);
1312
1313                 be_emit_string(env, tbl.label);
1314                 be_emit_cstring(env, ":\n");
1315                 be_emit_write_line(env);
1316
1317                 be_emit_cstring(env, ".long ");
1318                 ia32_emit_cfop_target(env, tbl.branches[0].target);
1319                 be_emit_finish_line_gas(env, NULL);
1320
1321                 last_value = tbl.branches[0].value;
1322                 for (i = 1; i < tbl.num_branches; ++i) {
1323                         while (++last_value < tbl.branches[i].value) {
1324                                 be_emit_cstring(env, ".long ");
1325                                 ia32_emit_cfop_target(env, tbl.defProj);
1326                                 be_emit_finish_line_gas(env, NULL);
1327                         }
1328                         be_emit_cstring(env, ".long ");
1329                         ia32_emit_cfop_target(env, tbl.branches[i].target);
1330                         be_emit_finish_line_gas(env, NULL);
1331                 }
1332                 be_gas_emit_switch_section(env->emit, GAS_SECTION_TEXT);
1333         } else {
1334                 /* one jump is enough */
1335                 be_emit_cstring(env, "\tjmp ");
1336                 ia32_emit_cfop_target(env, tbl.branches[0].target);
1337                 be_emit_finish_line_gas(env, node);
1338         }
1339
1340         if (tbl.label)
1341                 free(tbl.label);
1342         if (tbl.branches)
1343                 free(tbl.branches);
1344 }
1345
1346 /**
1347  * Emits code for a unconditional jump.
1348  */
1349 static
1350 void emit_Jmp(ia32_emit_env_t *env, const ir_node *node) {
1351         ir_node *block, *next_block;
1352
1353         /* for now, the code works for scheduled and non-schedules blocks */
1354         block = get_nodes_block(node);
1355
1356         /* we have a block schedule */
1357         next_block = next_blk_sched(block);
1358         if (get_cfop_target_block(node) != next_block) {
1359                 be_emit_cstring(env, "\tjmp ");
1360                 ia32_emit_cfop_target(env, node);
1361         } else {
1362                 be_emit_cstring(env, "\t/* fallthrough to ");
1363                 ia32_emit_cfop_target(env, node);
1364                 be_emit_cstring(env, " */");
1365         }
1366         be_emit_finish_line_gas(env, node);
1367 }
1368
1369 static
1370 void emit_ia32_Immediate(ia32_emit_env_t *env, const ir_node *node)
1371 {
1372         const ia32_immediate_attr_t *attr = get_ia32_immediate_attr_const(node);
1373
1374         be_emit_char(env, '$');
1375         if(attr->symconst != NULL) {
1376                 ident *id = get_entity_ld_ident(attr->symconst);
1377
1378                 if(attr->attr.data.am_sc_sign)
1379                         be_emit_char(env, '-');
1380                 be_emit_ident(env, id);
1381         }
1382         if(attr->symconst == NULL || attr->offset != 0) {
1383                 if(attr->symconst != NULL)
1384                         be_emit_char(env, '+');
1385                 be_emit_irprintf(env->emit, "%d", attr->offset);
1386         }
1387 }
1388
1389 static
1390 const char* emit_asm_operand(ia32_emit_env_t *env, const ir_node *node,
1391                              const char *s)
1392 {
1393         const arch_register_t *reg;
1394         const char            *reg_name;
1395         char                   c;
1396         char                   modifier = 0;
1397         int                    num      = -1;
1398         const ia32_attr_t     *attr;
1399         int                    n_outs;
1400         int                    p;
1401
1402         assert(*s == '%');
1403         c = *(++s);
1404
1405         /* parse modifiers */
1406         switch(c) {
1407         case 0:
1408                 ir_fprintf(stderr, "Warning: asm text (%+F) ends with %\n", node);
1409                 be_emit_char(env, '%');
1410                 return s + 1;
1411         case '%':
1412                 be_emit_char(env, '%');
1413                 return s + 1;
1414         case 'w':
1415         case 'b':
1416         case 'h':
1417                 modifier = c;
1418                 ++s;
1419                 break;
1420         case '0':
1421         case '1':
1422         case '2':
1423         case '3':
1424         case '4':
1425         case '5':
1426         case '6':
1427         case '7':
1428         case '8':
1429         case '9':
1430                 break;
1431         default:
1432                 ir_fprintf(stderr, "Warning: asm text (%+F) contains unknown modifier "
1433                            "'%c' for asm op\n", node, c);
1434                 ++s;
1435                 break;
1436         }
1437
1438         /* parse number */
1439         sscanf(s, "%d%n", &num, &p);
1440         if(num < 0) {
1441                 ir_fprintf(stderr, "Warning: Couldn't parse assembler operand (%+F)\n",
1442                            node);
1443                 return s;
1444         } else {
1445                 s += p;
1446         }
1447
1448         /* get register */
1449         attr   = get_ia32_attr_const(node);
1450         n_outs = ARR_LEN(attr->slots);
1451         if(num < n_outs) {
1452                 reg = get_out_reg(env, node, num);
1453         } else {
1454                 ir_node *pred;
1455                 int      in = num - n_outs;
1456                 if(in >= get_irn_arity(node)) {
1457                         ir_fprintf(stderr, "Warning: Invalid input %d specified in asm "
1458                                    "op (%+F)\n", num, node);
1459                         return s;
1460                 }
1461                 pred = get_irn_n(node, in);
1462                 /* might be an immediate value */
1463                 if(is_ia32_Immediate(pred)) {
1464                         emit_ia32_Immediate(env, pred);
1465                         return s;
1466                 }
1467                 reg = get_in_reg(env, node, in);
1468         }
1469         if(reg == NULL) {
1470                 ir_fprintf(stderr, "Warning: no register assigned for %d asm op "
1471                            "(%+F)\n", num, node);
1472                 return s;
1473         }
1474
1475         /* emit it */
1476         be_emit_char(env, '%');
1477         switch(modifier) {
1478         case 0:
1479                 reg_name = arch_register_get_name(reg);
1480                 break;
1481         case 'b':
1482                 reg_name = ia32_get_mapped_reg_name(env->isa->regs_8bit, reg);
1483                 break;
1484         case 'h':
1485                 reg_name = ia32_get_mapped_reg_name(env->isa->regs_8bit_high, reg);
1486                 break;
1487         case 'w':
1488                 reg_name = ia32_get_mapped_reg_name(env->isa->regs_16bit, reg);
1489                 break;
1490         default:
1491                 panic("Invalid asm op modifier");
1492         }
1493         be_emit_string(env, reg_name);
1494
1495         return s;
1496 }
1497
1498 /**
1499  * Emits code for an ASM pseudo op.
1500  */
1501 static
1502 void emit_ia32_Asm(ia32_emit_env_t *env, const ir_node *node)
1503 {
1504         const void            *gen_attr = get_irn_generic_attr_const(node);
1505         const ia32_asm_attr_t *attr
1506                 = CONST_CAST_IA32_ATTR(ia32_asm_attr_t, gen_attr);
1507         ident                 *asm_text = attr->asm_text;
1508         const char            *s        = get_id_str(asm_text);
1509
1510         be_emit_cstring(env, "# Begin ASM \t");
1511         be_emit_finish_line_gas(env, node);
1512
1513         if (s[0] != '\t')
1514                 be_emit_char(env, '\t');
1515
1516         while(*s != 0) {
1517                 if(*s == '%') {
1518                         s = emit_asm_operand(env, node, s);
1519                         continue;
1520                 } else {
1521                         be_emit_char(env, *s);
1522                 }
1523                 ++s;
1524         }
1525
1526         be_emit_char(env, '\n');
1527         be_emit_write_line(env);
1528
1529         be_emit_cstring(env, "# End ASM\n");
1530         be_emit_write_line(env);
1531 }
1532
1533 /**********************************
1534  *   _____                  ____
1535  *  / ____|                |  _ \
1536  * | |     ___  _ __  _   _| |_) |
1537  * | |    / _ \| '_ \| | | |  _ <
1538  * | |___| (_) | |_) | |_| | |_) |
1539  *  \_____\___/| .__/ \__, |____/
1540  *             | |     __/ |
1541  *             |_|    |___/
1542  **********************************/
1543
1544 /**
1545  * Emit movsb/w instructions to make mov count divideable by 4
1546  */
1547 static
1548 void emit_CopyB_prolog(ia32_emit_env_t *env, int rem) {
1549         be_emit_cstring(env, "\tcld");
1550         be_emit_finish_line_gas(env, NULL);
1551
1552         switch(rem) {
1553         case 1:
1554                 be_emit_cstring(env, "\tmovsb");
1555                 be_emit_finish_line_gas(env, NULL);
1556                 break;
1557         case 2:
1558                 be_emit_cstring(env, "\tmovsw");
1559                 be_emit_finish_line_gas(env, NULL);
1560                 break;
1561         case 3:
1562                 be_emit_cstring(env, "\tmovsb");
1563                 be_emit_finish_line_gas(env, NULL);
1564                 be_emit_cstring(env, "\tmovsw");
1565                 be_emit_finish_line_gas(env, NULL);
1566                 break;
1567         }
1568 }
1569
1570 /**
1571  * Emit rep movsd instruction for memcopy.
1572  */
1573 static
1574 void emit_ia32_CopyB(ia32_emit_env_t *env, const ir_node *node) {
1575         tarval *tv = get_ia32_Immop_tarval(node);
1576         int    rem = get_tarval_long(tv);
1577
1578         emit_CopyB_prolog(env, rem);
1579
1580         be_emit_cstring(env, "\trep movsd");
1581         be_emit_finish_line_gas(env, node);
1582 }
1583
1584 /**
1585  * Emits unrolled memcopy.
1586  */
1587 static
1588 void emit_ia32_CopyB_i(ia32_emit_env_t *env, const ir_node *node) {
1589         tarval *tv   = get_ia32_Immop_tarval(node);
1590         int     size = get_tarval_long(tv);
1591
1592         emit_CopyB_prolog(env, size & 0x3);
1593
1594         size >>= 2;
1595         while (size--) {
1596                 be_emit_cstring(env, "\tmovsd");
1597                 be_emit_finish_line_gas(env, NULL);
1598         }
1599 }
1600
1601
1602
1603 /***************************
1604  *   _____
1605  *  / ____|
1606  * | |     ___  _ ____   __
1607  * | |    / _ \| '_ \ \ / /
1608  * | |___| (_) | | | \ V /
1609  *  \_____\___/|_| |_|\_/
1610  *
1611  ***************************/
1612
1613 /**
1614  * Emit code for conversions (I, FP), (FP, I) and (FP, FP).
1615  */
1616 static
1617 void emit_ia32_Conv_with_FP(ia32_emit_env_t *env, const ir_node *node) {
1618         ir_mode            *ls_mode = get_ia32_ls_mode(node);
1619         int                 ls_bits = get_mode_size_bits(ls_mode);
1620
1621         be_emit_cstring(env, "\tcvt");
1622
1623         if(is_ia32_Conv_I2FP(node)) {
1624                 if(ls_bits == 32) {
1625                         be_emit_cstring(env, "si2ss");
1626                 } else {
1627                         be_emit_cstring(env, "si2sd");
1628                 }
1629         } else if(is_ia32_Conv_FP2I(node)) {
1630                 if(ls_bits == 32) {
1631                         be_emit_cstring(env, "ss2si");
1632                 } else {
1633                         be_emit_cstring(env, "sd2si");
1634                 }
1635         } else {
1636                 assert(is_ia32_Conv_FP2FP(node));
1637                 if(ls_bits == 32) {
1638                         be_emit_cstring(env, "sd2ss");
1639                 } else {
1640                         be_emit_cstring(env, "ss2sd");
1641                 }
1642         }
1643         be_emit_char(env, ' ');
1644
1645         switch(get_ia32_op_type(node)) {
1646                 case ia32_Normal:
1647                         ia32_emit_source_register(env, node, 2);
1648                         be_emit_cstring(env, ", ");
1649                         ia32_emit_dest_register(env, node, 0);
1650                         break;
1651                 case ia32_AddrModeS:
1652                         ia32_emit_dest_register(env, node, 0);
1653                         be_emit_cstring(env, ", ");
1654                         ia32_emit_am(env, node);
1655                         break;
1656                 default:
1657                         assert(0 && "unsupported op type for Conv");
1658         }
1659         be_emit_finish_line_gas(env, node);
1660 }
1661
1662 static
1663 void emit_ia32_Conv_I2FP(ia32_emit_env_t *env, const ir_node *node) {
1664         emit_ia32_Conv_with_FP(env, node);
1665 }
1666
1667 static
1668 void emit_ia32_Conv_FP2I(ia32_emit_env_t *env, const ir_node *node) {
1669         emit_ia32_Conv_with_FP(env, node);
1670 }
1671
1672 static
1673 void emit_ia32_Conv_FP2FP(ia32_emit_env_t *env, const ir_node *node) {
1674         emit_ia32_Conv_with_FP(env, node);
1675 }
1676
1677 /**
1678  * Emits code for an Int conversion.
1679  */
1680 static
1681 void emit_ia32_Conv_I2I(ia32_emit_env_t *env, const ir_node *node) {
1682         const char *sign_suffix;
1683         ir_mode *smaller_mode = get_ia32_ls_mode(node);
1684         int smaller_bits = get_mode_size_bits(smaller_mode);
1685         int signed_mode;
1686         const arch_register_t *in_reg, *out_reg;
1687
1688         assert(!mode_is_float(smaller_mode));
1689         assert(smaller_bits == 8 || smaller_bits == 16 || smaller_bits == 32);
1690
1691         signed_mode = mode_is_signed(smaller_mode);
1692         if(smaller_bits == 32) {
1693                 // this should not happen as it's no convert
1694                 assert(0);
1695                 sign_suffix = "";
1696         } else {
1697                 sign_suffix = signed_mode ? "s" : "z";
1698         }
1699
1700         switch(get_ia32_op_type(node)) {
1701                 case ia32_Normal:
1702                         in_reg  = get_in_reg(env, node, 2);
1703                         out_reg = get_out_reg(env, node, 0);
1704
1705                         if (in_reg  == &ia32_gp_regs[REG_EAX] &&
1706                                 out_reg == &ia32_gp_regs[REG_EAX] &&
1707                                 signed_mode &&
1708                                 smaller_bits == 16)
1709                         {
1710                                 /* argument and result are both in EAX and */
1711                                 /* signedness is ok: -> use the smaller cwtl opcode */
1712                                 be_emit_cstring(env, "\tcwtl");
1713                         } else {
1714                                 const char *sreg = ia32_get_reg_name_for_mode(env, smaller_mode, in_reg);
1715
1716                                 be_emit_cstring(env, "\tmov");
1717                                 be_emit_string(env, sign_suffix);
1718                                 ia32_emit_mode_suffix_mode(env, smaller_mode);
1719                                 be_emit_cstring(env, "l %");
1720                                 be_emit_string(env, sreg);
1721                                 be_emit_cstring(env, ", ");
1722                                 ia32_emit_dest_register(env, node, 0);
1723                         }
1724                         break;
1725                 case ia32_AddrModeS: {
1726                         be_emit_cstring(env, "\tmov");
1727                         be_emit_string(env, sign_suffix);
1728                         ia32_emit_mode_suffix_mode(env, smaller_mode);
1729                         be_emit_cstring(env, "l %");
1730                         ia32_emit_am(env, node);
1731                         be_emit_cstring(env, ", ");
1732                         ia32_emit_dest_register(env, node, 0);
1733                         break;
1734                 }
1735                 default:
1736                         assert(0 && "unsupported op type for Conv");
1737         }
1738         be_emit_finish_line_gas(env, node);
1739 }
1740
1741 /**
1742  * Emits code for an 8Bit Int conversion.
1743  */
1744 void emit_ia32_Conv_I2I8Bit(ia32_emit_env_t *env, const ir_node *node) {
1745         emit_ia32_Conv_I2I(env, node);
1746 }
1747
1748
1749 /*******************************************
1750  *  _                          _
1751  * | |                        | |
1752  * | |__   ___ _ __   ___   __| | ___  ___
1753  * | '_ \ / _ \ '_ \ / _ \ / _` |/ _ \/ __|
1754  * | |_) |  __/ | | | (_) | (_| |  __/\__ \
1755  * |_.__/ \___|_| |_|\___/ \__,_|\___||___/
1756  *
1757  *******************************************/
1758
1759 /**
1760  * Emits a backend call
1761  */
1762 static
1763 void emit_be_Call(ia32_emit_env_t *env, const ir_node *node) {
1764         ir_entity *ent = be_Call_get_entity(node);
1765
1766         be_emit_cstring(env, "\tcall ");
1767         if (ent) {
1768                 set_entity_backend_marked(ent, 1);
1769                 be_emit_string(env, get_entity_ld_name(ent));
1770         } else {
1771                 be_emit_char(env, '*');
1772                 ia32_emit_dest_register(env, get_irn_n(node, be_pos_Call_ptr), 0);
1773         }
1774         be_emit_finish_line_gas(env, node);
1775 }
1776
1777 /**
1778  * Emits code to increase stack pointer.
1779  */
1780 static
1781 void emit_be_IncSP(ia32_emit_env_t *env, const ir_node *node) {
1782         int offs = be_get_IncSP_offset(node);
1783
1784         if (offs == 0)
1785                 return;
1786
1787         if (offs > 0) {
1788                 be_emit_cstring(env, "\tsubl $");
1789                 be_emit_irprintf(env->emit, "%u, ", offs);
1790                 ia32_emit_source_register(env, node, 0);
1791         } else {
1792                 be_emit_cstring(env, "\taddl $");
1793                 be_emit_irprintf(env->emit, "%u, ", -offs);
1794                 ia32_emit_source_register(env, node, 0);
1795         }
1796         be_emit_finish_line_gas(env, node);
1797 }
1798
1799 /**
1800  * Emits code to set stack pointer.
1801  */
1802 static
1803 void emit_be_SetSP(ia32_emit_env_t *env, const ir_node *node) {
1804         be_emit_cstring(env, "\tmovl ");
1805         ia32_emit_source_register(env, node, 2);
1806         be_emit_cstring(env, ", ");
1807         ia32_emit_dest_register(env, node, 0);
1808         be_emit_finish_line_gas(env, node);
1809 }
1810
1811 /**
1812  * Emits code for Copy/CopyKeep.
1813  */
1814 static
1815 void Copy_emitter(ia32_emit_env_t *env, const ir_node *node, const ir_node *op)
1816 {
1817         const arch_env_t      *arch_env = env->arch_env;
1818         const arch_register_t *in       = arch_get_irn_register(arch_env, op);
1819         const arch_register_t *out      = arch_get_irn_register(arch_env, node);
1820         ir_mode *mode;
1821
1822         if(in == out) {
1823                 return;
1824         }
1825         if(is_unknown_reg(in))
1826                 return;
1827         /* copies of vf nodes aren't real... */
1828         if(arch_register_get_class(in) == &ia32_reg_classes[CLASS_ia32_vfp])
1829                 return;
1830
1831         mode = get_irn_mode(node);
1832         if (mode == mode_E) {
1833                 be_emit_cstring(env, "\tmovsd ");
1834                 ia32_emit_register(env, in);
1835                 be_emit_cstring(env, ", ");
1836                 ia32_emit_register(env, out);
1837         } else {
1838                 be_emit_cstring(env, "\tmovl ");
1839                 ia32_emit_register(env, in);
1840                 be_emit_cstring(env, ", ");
1841                 ia32_emit_register(env, out);
1842         }
1843         be_emit_finish_line_gas(env, node);
1844 }
1845
1846 static
1847 void emit_be_Copy(ia32_emit_env_t *env, const ir_node *node) {
1848         Copy_emitter(env, node, be_get_Copy_op(node));
1849 }
1850
1851 static
1852 void emit_be_CopyKeep(ia32_emit_env_t *env, const ir_node *node) {
1853         Copy_emitter(env, node, be_get_CopyKeep_op(node));
1854 }
1855
1856 /**
1857  * Emits code for exchange.
1858  */
1859 static
1860 void emit_be_Perm(ia32_emit_env_t *env, const ir_node *node) {
1861         const arch_register_t *in1, *in2;
1862         const arch_register_class_t *cls1, *cls2;
1863
1864         in1 = arch_get_irn_register(env->arch_env, get_irn_n(node, 0));
1865         in2 = arch_get_irn_register(env->arch_env, get_irn_n(node, 1));
1866
1867         cls1 = arch_register_get_class(in1);
1868         cls2 = arch_register_get_class(in2);
1869
1870         assert(cls1 == cls2 && "Register class mismatch at Perm");
1871
1872         if (cls1 == &ia32_reg_classes[CLASS_ia32_gp]) {
1873                 be_emit_cstring(env, "\txchg ");
1874                 ia32_emit_source_register(env, node, 1);
1875                 be_emit_cstring(env, ", ");
1876                 ia32_emit_source_register(env, node, 0);
1877                 be_emit_finish_line_gas(env, node);
1878         } else if (cls1 == &ia32_reg_classes[CLASS_ia32_xmm]) {
1879                 be_emit_cstring(env, "\txorpd ");
1880                 ia32_emit_source_register(env, node, 1);
1881                 be_emit_cstring(env, ", ");
1882                 ia32_emit_source_register(env, node, 0);
1883                 be_emit_finish_line_gas(env, NULL);
1884
1885                 be_emit_cstring(env, "\txorpd ");
1886                 ia32_emit_source_register(env, node, 0);
1887                 be_emit_cstring(env, ", ");
1888                 ia32_emit_source_register(env, node, 1);
1889                 be_emit_finish_line_gas(env, NULL);
1890
1891                 be_emit_cstring(env, "\txorpd ");
1892                 ia32_emit_source_register(env, node, 1);
1893                 be_emit_cstring(env, ", ");
1894                 ia32_emit_source_register(env, node, 0);
1895                 be_emit_finish_line_gas(env, node);
1896         } else if (cls1 == &ia32_reg_classes[CLASS_ia32_vfp]) {
1897                 /* is a NOP */
1898         } else if (cls1 == &ia32_reg_classes[CLASS_ia32_st]) {
1899                 /* is a NOP */
1900         }
1901 }
1902
1903 /**
1904  * Emits code for Constant loading.
1905  */
1906 static
1907 void emit_ia32_Const(ia32_emit_env_t *env, const ir_node *node) {
1908         ia32_immop_type_t imm_tp = get_ia32_immop_type(node);
1909
1910         if (imm_tp == ia32_ImmSymConst) {
1911                 be_emit_cstring(env, "\tmovl ");
1912                 ia32_emit_immediate(env, node);
1913                 be_emit_cstring(env, ", ");
1914                 ia32_emit_dest_register(env, node, 0);
1915         } else {
1916                 tarval *tv = get_ia32_Immop_tarval(node);
1917                 assert(get_irn_mode(node) == mode_Iu);
1918                 /* beware: in some rare cases mode is mode_b which has no tarval_null() */
1919                 if (tarval_is_null(tv)) {
1920                         if (env->isa->opt_arch == arch_pentium_4) {
1921                                 /* P4 prefers sub r, r, others xor r, r */
1922                                 be_emit_cstring(env, "\tsubl ");
1923                         } else {
1924                                 be_emit_cstring(env, "\txorl ");
1925                         }
1926                         ia32_emit_dest_register(env, node, 0);
1927                         be_emit_cstring(env, ", ");
1928                         ia32_emit_dest_register(env, node, 0);
1929                 } else {
1930                         be_emit_cstring(env, "\tmovl ");
1931                         ia32_emit_immediate(env, node);
1932                         be_emit_cstring(env, ", ");
1933                         ia32_emit_dest_register(env, node, 0);
1934                 }
1935         }
1936         be_emit_finish_line_gas(env, node);
1937 }
1938
1939 /**
1940  * Emits code to load the TLS base
1941  */
1942 static
1943 void emit_ia32_LdTls(ia32_emit_env_t *env, const ir_node *node) {
1944         be_emit_cstring(env, "\tmovl %gs:0, ");
1945         ia32_emit_dest_register(env, node, 0);
1946         be_emit_finish_line_gas(env, node);
1947 }
1948
1949 static
1950 void emit_be_Return(ia32_emit_env_t *env, const ir_node *node)
1951 {
1952         be_emit_cstring(env, "\tret");
1953         be_emit_finish_line_gas(env, node);
1954 }
1955
1956 static
1957 void emit_Nothing(ia32_emit_env_t *env, const ir_node *node)
1958 {
1959         (void) env;
1960         (void) node;
1961 }
1962
1963
1964 /***********************************************************************************
1965  *                  _          __                                             _
1966  *                 (_)        / _|                                           | |
1967  *  _ __ ___   __ _ _ _ __   | |_ _ __ __ _ _ __ ___   _____      _____  _ __| | __
1968  * | '_ ` _ \ / _` | | '_ \  |  _| '__/ _` | '_ ` _ \ / _ \ \ /\ / / _ \| '__| |/ /
1969  * | | | | | | (_| | | | | | | | | | | (_| | | | | | |  __/\ V  V / (_) | |  |   <
1970  * |_| |_| |_|\__,_|_|_| |_| |_| |_|  \__,_|_| |_| |_|\___| \_/\_/ \___/|_|  |_|\_\
1971  *
1972  ***********************************************************************************/
1973
1974 /**
1975  * Enters the emitter functions for handled nodes into the generic
1976  * pointer of an opcode.
1977  */
1978 static
1979 void ia32_register_emitters(void) {
1980
1981 #define IA32_EMIT2(a,b) op_ia32_##a->ops.generic = (op_func)emit_ia32_##b
1982 #define IA32_EMIT(a)    IA32_EMIT2(a,a)
1983 #define EMIT(a)         op_##a->ops.generic = (op_func)emit_##a
1984 #define IGN(a)                  op_##a->ops.generic = (op_func)emit_Nothing
1985 #define BE_EMIT(a)      op_be_##a->ops.generic = (op_func)emit_be_##a
1986 #define BE_IGN(a)               op_be_##a->ops.generic = (op_func)emit_Nothing
1987
1988         /* first clear the generic function pointer for all ops */
1989         clear_irp_opcodes_generic_func();
1990
1991         /* register all emitter functions defined in spec */
1992         ia32_register_spec_emitters();
1993
1994         /* other ia32 emitter functions */
1995         IA32_EMIT(Asm);
1996         IA32_EMIT(CondJmp);
1997         IA32_EMIT(TestJmp);
1998         IA32_EMIT(CmpCMov);
1999         IA32_EMIT(TestCMov);
2000         IA32_EMIT(CmpSet);
2001         IA32_EMIT(TestSet);
2002         IA32_EMIT(SwitchJmp);
2003         IA32_EMIT(CopyB);
2004         IA32_EMIT(CopyB_i);
2005         IA32_EMIT(Conv_I2FP);
2006         IA32_EMIT(Conv_FP2I);
2007         IA32_EMIT(Conv_FP2FP);
2008         IA32_EMIT(Conv_I2I);
2009         IA32_EMIT(Conv_I2I8Bit);
2010         IA32_EMIT(Const);
2011         IA32_EMIT(LdTls);
2012         IA32_EMIT(xCmp);
2013         IA32_EMIT(xCmpSet);
2014         IA32_EMIT(xCmpCMov);
2015         IA32_EMIT(xCondJmp);
2016         IA32_EMIT2(fcomJmp, x87CondJmp);
2017         IA32_EMIT2(fcompJmp, x87CondJmp);
2018         IA32_EMIT2(fcomppJmp, x87CondJmp);
2019         IA32_EMIT2(fcomrJmp, x87CondJmp);
2020         IA32_EMIT2(fcomrpJmp, x87CondJmp);
2021         IA32_EMIT2(fcomrppJmp, x87CondJmp);
2022
2023         /* benode emitter */
2024         BE_EMIT(Call);
2025         BE_EMIT(IncSP);
2026         BE_EMIT(SetSP);
2027         BE_EMIT(Copy);
2028         BE_EMIT(CopyKeep);
2029         BE_EMIT(Perm);
2030         BE_EMIT(Return);
2031
2032         BE_IGN(RegParams);
2033         BE_IGN(Barrier);
2034         BE_IGN(Keep);
2035
2036         /* firm emitter */
2037         EMIT(Jmp);
2038         IGN(Proj);
2039         IGN(Phi);
2040         IGN(Start);
2041
2042 #undef BE_EMIT
2043 #undef EMIT
2044 #undef IGN
2045 #undef IA32_EMIT2
2046 #undef IA32_EMIT
2047 }
2048
2049 static const char *last_name = NULL;
2050 static unsigned last_line = -1;
2051 static unsigned num = -1;
2052
2053 /**
2054  * Emit the debug support for node node.
2055  */
2056 static
2057 void ia32_emit_dbg(ia32_emit_env_t *env, const ir_node *node) {
2058         dbg_info *db = get_irn_dbg_info(node);
2059         unsigned lineno;
2060         const char *fname = be_retrieve_dbg_info(db, &lineno);
2061
2062         if (! env->cg->birg->main_env->options->stabs_debug_support)
2063                 return;
2064
2065         if (fname) {
2066                 if (last_name != fname) {
2067                         last_line = -1;
2068                         be_dbg_include_begin(env->cg->birg->main_env->db_handle, fname);
2069                         last_name = fname;
2070                 }
2071                 if (last_line != lineno) {
2072                         char name[64];
2073
2074                         snprintf(name, sizeof(name), ".LM%u", ++num);
2075                         last_line = lineno;
2076                         be_dbg_line(env->cg->birg->main_env->db_handle, lineno, name);
2077                         be_emit_string(env, name);
2078                         be_emit_cstring(env, ":\n");
2079                         be_emit_write_line(env);
2080                 }
2081         }
2082 }
2083
2084 typedef void (*emit_func_ptr) (ia32_emit_env_t *, const ir_node *);
2085
2086 /**
2087  * Emits code for a node.
2088  */
2089 static
2090 void ia32_emit_node(ia32_emit_env_t *env, const ir_node *node) {
2091         ir_op *op = get_irn_op(node);
2092
2093         DBG((dbg, LEVEL_1, "emitting code for %+F\n", node));
2094
2095         if (op->ops.generic) {
2096                 emit_func_ptr func = (emit_func_ptr) op->ops.generic;
2097                 ia32_emit_dbg(env, node);
2098                 (*func) (env, node);
2099         } else {
2100                 emit_Nothing(env, node);
2101                 ir_fprintf(stderr, "Error: No emit handler for node %+F (%+G, graph %+F)\n", node, node, current_ir_graph);
2102                 abort();
2103         }
2104 }
2105
2106 /**
2107  * Emits gas alignment directives
2108  */
2109 static
2110 void ia32_emit_alignment(ia32_emit_env_t *env, unsigned align, unsigned skip) {
2111         be_emit_cstring(env, "\t.p2align ");
2112         be_emit_irprintf(env->emit, "%u,,%u\n", align, skip);
2113         be_emit_write_line(env);
2114 }
2115
2116 /**
2117  * Emits gas alignment directives for Functions depended on cpu architecture.
2118  */
2119 static
2120 void ia32_emit_align_func(ia32_emit_env_t *env, cpu_support cpu) {
2121         unsigned align;
2122         unsigned maximum_skip;
2123
2124         switch (cpu) {
2125                 case arch_i386:
2126                         align = 2;
2127                         break;
2128                 case arch_i486:
2129                         align = 4;
2130                         break;
2131                 case arch_k6:
2132                         align = 5;
2133                         break;
2134                 default:
2135                         align = 4;
2136         }
2137         maximum_skip = (1 << align) - 1;
2138         ia32_emit_alignment(env, align, maximum_skip);
2139 }
2140
2141 /**
2142  * Emits gas alignment directives for Labels depended on cpu architecture.
2143  */
2144 static
2145 void ia32_emit_align_label(ia32_emit_env_t *env, cpu_support cpu) {
2146         unsigned align; unsigned maximum_skip;
2147
2148         switch (cpu) {
2149                 case arch_i386:
2150                         align = 2;
2151                         break;
2152                 case arch_i486:
2153                         align = 4;
2154                         break;
2155                 case arch_k6:
2156                         align = 5;
2157                         break;
2158                 default:
2159                         align = 4;
2160         }
2161         maximum_skip = (1 << align) - 1;
2162         ia32_emit_alignment(env, align, maximum_skip);
2163 }
2164
2165 /**
2166  * Test wether a block should be aligned.
2167  * For cpus in the P4/Athlon class it is usefull to align jump labels to
2168  * 16 bytes. However we should only do that if the alignment nops before the
2169  * label aren't executed more often than we have jumps to the label.
2170  */
2171 static
2172 int should_align_block(ia32_emit_env_t *env, ir_node *block, ir_node *prev) {
2173         static const double DELTA = .0001;
2174         ir_exec_freq *exec_freq = env->cg->birg->exec_freq;
2175         double        block_freq;
2176         double        prev_freq = 0;  /**< execfreq of the fallthrough block */
2177         double        jmp_freq  = 0;  /**< execfreq of all non-fallthrough blocks */
2178         cpu_support   cpu       = env->isa->opt_arch;
2179         int           i, n_cfgpreds;
2180
2181         if(exec_freq == NULL)
2182                 return 0;
2183         if(cpu == arch_i386 || cpu == arch_i486)
2184                 return 0;
2185
2186         block_freq = get_block_execfreq(exec_freq, block);
2187         if(block_freq < DELTA)
2188                 return 0;
2189
2190         n_cfgpreds = get_Block_n_cfgpreds(block);
2191         for(i = 0; i < n_cfgpreds; ++i) {
2192                 ir_node *pred      = get_Block_cfgpred_block(block, i);
2193                 double   pred_freq = get_block_execfreq(exec_freq, pred);
2194
2195                 if(pred == prev) {
2196                         prev_freq += pred_freq;
2197                 } else {
2198                         jmp_freq  += pred_freq;
2199                 }
2200         }
2201
2202         if(prev_freq < DELTA && !(jmp_freq < DELTA))
2203                 return 1;
2204
2205         jmp_freq /= prev_freq;
2206
2207         switch (cpu) {
2208                 case arch_athlon:
2209                 case arch_athlon_64:
2210                 case arch_k6:
2211                         return jmp_freq > 3;
2212                 default:
2213                         return jmp_freq > 2;
2214         }
2215 }
2216
2217 static
2218 void ia32_emit_block_header(ia32_emit_env_t *env, ir_node *block, ir_node *prev)
2219 {
2220         int           n_cfgpreds;
2221         int           need_label;
2222         int           i, arity;
2223         ir_exec_freq  *exec_freq = env->cg->birg->exec_freq;
2224
2225         n_cfgpreds = get_Block_n_cfgpreds(block);
2226         need_label = (n_cfgpreds != 0);
2227
2228         if (should_align_block(env, block, prev)) {
2229                 assert(need_label);
2230                 ia32_emit_align_label(env, env->isa->opt_arch);
2231         }
2232
2233         if(need_label) {
2234                 ia32_emit_block_name(env, block);
2235                 be_emit_char(env, ':');
2236
2237                 be_emit_pad_comment(env);
2238                 be_emit_cstring(env, "   /* preds:");
2239
2240                 /* emit list of pred blocks in comment */
2241                 arity = get_irn_arity(block);
2242                 for (i = 0; i < arity; ++i) {
2243                         ir_node *predblock = get_Block_cfgpred_block(block, i);
2244                         be_emit_irprintf(env->emit, " %d", get_irn_node_nr(predblock));
2245                 }
2246         } else {
2247                 be_emit_cstring(env, "\t/* ");
2248                 ia32_emit_block_name(env, block);
2249                 be_emit_cstring(env, ": ");
2250         }
2251         if (exec_freq != NULL) {
2252                 be_emit_irprintf(env->emit, " freq: %f",
2253                                  get_block_execfreq(exec_freq, block));
2254         }
2255         be_emit_cstring(env, " */\n");
2256         be_emit_write_line(env);
2257 }
2258
2259 /**
2260  * Walks over the nodes in a block connected by scheduling edges
2261  * and emits code for each node.
2262  */
2263 static
2264 void ia32_gen_block(ia32_emit_env_t *env, ir_node *block, ir_node *last_block)
2265 {
2266         const ir_node *node;
2267
2268         ia32_emit_block_header(env, block, last_block);
2269
2270         /* emit the contents of the block */
2271         ia32_emit_dbg(env, block);
2272         sched_foreach(block, node) {
2273                 ia32_emit_node(env, node);
2274         }
2275 }
2276
2277 /**
2278  * Emits code for function start.
2279  */
2280 static
2281 void ia32_emit_func_prolog(ia32_emit_env_t *env, ir_graph *irg) {
2282         ir_entity  *irg_ent  = get_irg_entity(irg);
2283         const char *irg_name = get_entity_ld_name(irg_ent);
2284         cpu_support cpu      = env->isa->opt_arch;
2285         const be_irg_t *birg = env->cg->birg;
2286
2287         be_emit_write_line(env);
2288         be_gas_emit_switch_section(env->emit, GAS_SECTION_TEXT);
2289         be_dbg_method_begin(birg->main_env->db_handle, irg_ent, be_abi_get_stack_layout(birg->abi));
2290         ia32_emit_align_func(env, cpu);
2291         if (get_entity_visibility(irg_ent) == visibility_external_visible) {
2292                 be_emit_cstring(env, ".global ");
2293                 be_emit_string(env, irg_name);
2294                 be_emit_char(env, '\n');
2295                 be_emit_write_line(env);
2296         }
2297         ia32_emit_function_object(env, irg_name);
2298         be_emit_string(env, irg_name);
2299         be_emit_cstring(env, ":\n");
2300         be_emit_write_line(env);
2301 }
2302
2303 /**
2304  * Emits code for function end
2305  */
2306 static
2307 void ia32_emit_func_epilog(ia32_emit_env_t *env, ir_graph *irg) {
2308         const char *irg_name = get_entity_ld_name(get_irg_entity(irg));
2309         const be_irg_t *birg = env->cg->birg;
2310
2311         ia32_emit_function_size(env, irg_name);
2312         be_dbg_method_end(birg->main_env->db_handle);
2313         be_emit_char(env, '\n');
2314         be_emit_write_line(env);
2315 }
2316
2317 /**
2318  * Block-walker:
2319  * Sets labels for control flow nodes (jump target)
2320  */
2321 static
2322 void ia32_gen_labels(ir_node *block, void *data)
2323 {
2324         ir_node *pred;
2325         int n = get_Block_n_cfgpreds(block);
2326         (void) data;
2327
2328         for (n--; n >= 0; n--) {
2329                 pred = get_Block_cfgpred(block, n);
2330                 set_irn_link(pred, block);
2331         }
2332 }
2333
2334 /**
2335  * Emit an exception label if the current instruction can fail.
2336  */
2337 void ia32_emit_exc_label(ia32_emit_env_t *env, const ir_node *node) {
2338         if (get_ia32_exc_label(node)) {
2339                 be_emit_irprintf(env->emit, ".EXL%u\n", 0);
2340                 be_emit_write_line(env);
2341         }
2342 }
2343
2344 /**
2345  * Main driver. Emits the code for one routine.
2346  */
2347 void ia32_gen_routine(ia32_code_gen_t *cg, ir_graph *irg) {
2348         ia32_emit_env_t env;
2349         ir_node *block;
2350         ir_node *last_block = NULL;
2351         int i, n;
2352
2353         env.isa      = (ia32_isa_t *)cg->arch_env->isa;
2354         env.emit     = &env.isa->emit;
2355         env.arch_env = cg->arch_env;
2356         env.cg       = cg;
2357
2358         ia32_register_emitters();
2359
2360         ia32_emit_func_prolog(&env, irg);
2361         irg_block_walk_graph(irg, ia32_gen_labels, NULL, &env);
2362
2363         n = ARR_LEN(cg->blk_sched);
2364         for (i = 0; i < n;) {
2365                 ir_node *next_bl;
2366
2367                 block   = cg->blk_sched[i];
2368                 ++i;
2369                 next_bl = i < n ? cg->blk_sched[i] : NULL;
2370
2371                 /* set here the link. the emitter expects to find the next block here */
2372                 set_irn_link(block, next_bl);
2373                 ia32_gen_block(&env, block, last_block);
2374                 last_block = block;
2375         }
2376
2377         ia32_emit_func_epilog(&env, irg);
2378 }
2379
2380 void ia32_init_emitter(void)
2381 {
2382         FIRM_DBG_REGISTER(dbg, "firm.be.ia32.emitter");
2383 }