0ed60ca9baba5e23176e848f22c71e2d1d6dcb5b
[libfirm] / ir / be / ia32 / ia32_emitter.c
1 /*
2  * Copyright (C) 1995-2007 University of Karlsruhe.  All right reserved.
3  *
4  * This file is part of libFirm.
5  *
6  * This file may be distributed and/or modified under the terms of the
7  * GNU General Public License version 2 as published by the Free Software
8  * Foundation and appearing in the file LICENSE.GPL included in the
9  * packaging of this file.
10  *
11  * Licensees holding valid libFirm Professional Edition licenses may use
12  * this file in accordance with the libFirm Commercial License.
13  * Agreement provided with the Software.
14  *
15  * This file is provided AS IS with NO WARRANTY OF ANY KIND, INCLUDING THE
16  * WARRANTY OF DESIGN, MERCHANTABILITY AND FITNESS FOR A PARTICULAR
17  * PURPOSE.
18  */
19
20 /**
21  * @file
22  * @brief       This file implements the ia32 node emitter.
23  * @author      Christian Wuerdig, Matthias Braun
24  * @version     $Id$
25  */
26 #ifdef HAVE_CONFIG_H
27 #include "config.h"
28 #endif
29
30 #include <limits.h>
31
32 #include "xmalloc.h"
33 #include "tv.h"
34 #include "iredges.h"
35 #include "debug.h"
36 #include "irgwalk.h"
37 #include "irprintf.h"
38 #include "irop_t.h"
39 #include "irargs_t.h"
40 #include "irprog_t.h"
41 #include "iredges_t.h"
42 #include "execfreq.h"
43 #include "error.h"
44 #include "raw_bitset.h"
45
46 #include "../besched_t.h"
47 #include "../benode_t.h"
48 #include "../beabi.h"
49 #include "../be_dbgout.h"
50 #include "../beemitter.h"
51 #include "../begnuas.h"
52 #include "../beirg_t.h"
53
54 #include "ia32_emitter.h"
55 #include "gen_ia32_emitter.h"
56 #include "gen_ia32_regalloc_if.h"
57 #include "ia32_nodes_attr.h"
58 #include "ia32_new_nodes.h"
59 #include "ia32_map_regs.h"
60 #include "bearch_ia32_t.h"
61
62 DEBUG_ONLY(static firm_dbg_module_t *dbg = NULL;)
63
64 #define BLOCK_PREFIX ".L"
65
66 #define SNPRINTF_BUF_LEN 128
67
68 /**
69  * Returns the register at in position pos.
70  */
71 static
72 const arch_register_t *get_in_reg(ia32_emit_env_t *env, const ir_node *irn,
73                                   int pos)
74 {
75         const arch_env_t       *arch_env = env->arch_env;
76         ir_node                *op;
77         const arch_register_t  *reg = NULL;
78
79         assert(get_irn_arity(irn) > pos && "Invalid IN position");
80
81         /* The out register of the operator at position pos is the
82            in register we need. */
83         op = get_irn_n(irn, pos);
84
85         reg = arch_get_irn_register(arch_env, op);
86
87         assert(reg && "no in register found");
88
89         if(reg == &ia32_gp_regs[REG_GP_NOREG])
90                 panic("trying to emit noreg");
91
92         /* in case of unknown register: just return a valid register */
93         if (reg == &ia32_gp_regs[REG_GP_UKNWN]) {
94                 const arch_register_req_t *req;
95
96                 /* ask for the requirements */
97                 req = arch_get_register_req(arch_env, irn, pos);
98
99                 if (arch_register_req_is(req, limited)) {
100                         /* in case of limited requirements: get the first allowed register */
101                         unsigned idx = rbitset_next(req->limited, 0, 1);
102                         reg = arch_register_for_index(req->cls, idx);
103                 } else {
104                         /* otherwise get first register in class */
105                         reg = arch_register_for_index(req->cls, 0);
106                 }
107         }
108
109         return reg;
110 }
111
112 /**
113  * Returns the register at out position pos.
114  */
115 static
116 const arch_register_t *get_out_reg(ia32_emit_env_t *env, const ir_node *irn,
117                                    int pos)
118 {
119         const arch_env_t      *arch_env = env->arch_env;
120         ir_node               *proj;
121         const arch_register_t *reg = NULL;
122
123         /* 1st case: irn is not of mode_T, so it has only                 */
124         /*           one OUT register -> good                             */
125         /* 2nd case: irn is of mode_T -> collect all Projs and ask the    */
126         /*           Proj with the corresponding projnum for the register */
127
128         if (get_irn_mode(irn) != mode_T) {
129                 reg = arch_get_irn_register(arch_env, irn);
130         } else if (is_ia32_irn(irn)) {
131                 reg = get_ia32_out_reg(irn, pos);
132         } else {
133                 const ir_edge_t *edge;
134
135                 foreach_out_edge(irn, edge) {
136                         proj = get_edge_src_irn(edge);
137                         assert(is_Proj(proj) && "non-Proj from mode_T node");
138                         if (get_Proj_proj(proj) == pos) {
139                                 reg = arch_get_irn_register(arch_env, proj);
140                                 break;
141                         }
142                 }
143         }
144
145         assert(reg && "no out register found");
146         return reg;
147 }
148
149 /**
150  * Determine the gnu assembler suffix that indicates a mode
151  */
152 static
153 char get_mode_suffix(const ir_mode *mode) {
154         if(mode_is_float(mode)) {
155                 switch(get_mode_size_bits(mode)) {
156                 case 32:
157                         return 's';
158                 case 64:
159                         return 'l';
160                 case 80:
161                 case 96:
162                         return 't';
163                 }
164         } else {
165                 assert(mode_is_int(mode) || mode_is_reference(mode) || mode_is_character(mode));
166                 switch(get_mode_size_bits(mode)) {
167                 case 64:
168                         return 'q';
169                 case 32:
170                         return 'l';
171                 case 16:
172                         return 'w';
173                 case 8:
174                         return 'b';
175                 }
176         }
177         panic("Can't output mode_suffix for %+F\n", mode);
178 }
179
180 static
181 int produces_result(const ir_node *node) {
182         return
183                 !is_ia32_CmpSet(node)    &&
184                 !is_ia32_CondJmp(node)   &&
185                 !is_ia32_St(node)        &&
186                 !is_ia32_SwitchJmp(node) &&
187                 !is_ia32_TestJmp(node)   &&
188                 !is_ia32_xCmpSet(node)   &&
189                 !is_ia32_xCondJmp(node);
190 }
191
192 static
193 const char *ia32_get_reg_name_for_mode(ia32_emit_env_t *env, ir_mode *mode,
194                                        const arch_register_t *reg) {
195         switch(get_mode_size_bits(mode)) {
196                 case 8:
197                         return ia32_get_mapped_reg_name(env->isa->regs_8bit, reg);
198                 case 16:
199                         return ia32_get_mapped_reg_name(env->isa->regs_16bit, reg);
200                 default:
201                         return (char *)arch_register_get_name(reg);
202         }
203 }
204
205 /**
206  * Add a number to a prefix. This number will not be used a second time.
207  */
208 static
209 char *get_unique_label(char *buf, size_t buflen, const char *prefix) {
210         static unsigned long id = 0;
211         snprintf(buf, buflen, "%s%lu", prefix, ++id);
212         return buf;
213 }
214
215 /*************************************************************
216  *             _       _    __   _          _
217  *            (_)     | |  / _| | |        | |
218  *  _ __  _ __ _ _ __ | |_| |_  | |__   ___| |_ __   ___ _ __
219  * | '_ \| '__| | '_ \| __|  _| | '_ \ / _ \ | '_ \ / _ \ '__|
220  * | |_) | |  | | | | | |_| |   | | | |  __/ | |_) |  __/ |
221  * | .__/|_|  |_|_| |_|\__|_|   |_| |_|\___|_| .__/ \___|_|
222  * | |                                       | |
223  * |_|                                       |_|
224  *************************************************************/
225
226 // we have no C++ and can't define an implicit ia32_emit_env_t* cast to
227 // be_emit_env_t* so we cheat a bit...
228 #define be_emit_char(env,c)             be_emit_char(env->emit,c)
229 #define be_emit_string(env,s)           be_emit_string(env->emit,s)
230 #undef be_emit_cstring
231 #define be_emit_cstring(env,x)          { be_emit_string_len(env->emit, x, sizeof(x)-1); }
232 #define be_emit_ident(env,i)            be_emit_ident(env->emit,i)
233 #define be_emit_tarval(env,tv)          be_emit_tarval(env->emit,tv)
234 #define be_emit_write_line(env)         be_emit_write_line(env->emit)
235 #define be_emit_finish_line_gas(env,n)  be_emit_finish_line_gas(env->emit,n)
236 #define be_emit_pad_comment(env)        be_emit_pad_comment(env->emit)
237
238 void ia32_emit_source_register(ia32_emit_env_t *env, const ir_node *node, int pos)
239 {
240         const arch_register_t *reg = get_in_reg(env, node, pos);
241         const char *reg_name = arch_register_get_name(reg);
242
243         assert(pos < get_irn_arity(node));
244
245         be_emit_char(env, '%');
246         be_emit_string(env, reg_name);
247 }
248
249 void ia32_emit_dest_register(ia32_emit_env_t *env, const ir_node *node, int pos) {
250         const arch_register_t *reg = get_out_reg(env, node, pos);
251         const char *reg_name = arch_register_get_name(reg);
252
253         be_emit_char(env, '%');
254         be_emit_string(env, reg_name);
255 }
256
257 void ia32_emit_x87_name(ia32_emit_env_t *env, const ir_node *node, int pos)
258 {
259         const ia32_x87_attr_t *attr = get_ia32_x87_attr_const(node);
260
261         assert(pos < 3);
262         be_emit_char(env, '%');
263         be_emit_string(env, attr->x87[pos]->name);
264 }
265
266 void ia32_emit_immediate(ia32_emit_env_t *env, const ir_node *node)
267 {
268         tarval *tv;
269         ir_entity *ent;
270         ident *id;
271
272         be_emit_char(env, '$');
273
274         switch(get_ia32_immop_type(node)) {
275         case ia32_ImmConst:
276                 tv = get_ia32_Immop_tarval(node);
277                 be_emit_tarval(env, tv);
278                 return;
279         case ia32_ImmSymConst:
280                 ent = get_ia32_Immop_symconst(node);
281                 set_entity_backend_marked(ent, 1);
282                 id = get_entity_ld_ident(ent);
283                 be_emit_ident(env, id);
284                 return;
285         case ia32_ImmNone:
286                 break;
287         }
288
289         assert(0);
290         be_emit_string(env, "BAD");
291         return;
292 }
293
294 static
295 void ia32_emit_mode_suffix_mode(ia32_emit_env_t *env, const ir_mode *mode)
296 {
297         be_emit_char(env, get_mode_suffix(mode));
298 }
299
300 void ia32_emit_mode_suffix(ia32_emit_env_t *env, const ir_node *node)
301 {
302         ir_mode *mode = get_ia32_ls_mode(node);
303         if(mode == NULL)
304                 mode = mode_Iu;
305
306         ia32_emit_mode_suffix_mode(env, mode);
307 }
308
309 void ia32_emit_x87_mode_suffix(ia32_emit_env_t *env, const ir_node *node)
310 {
311         ir_mode *mode = get_ia32_ls_mode(node);
312         if(mode != NULL)
313                 ia32_emit_mode_suffix_mode(env, mode);
314 }
315
316 static
317 char get_xmm_mode_suffix(ir_mode *mode)
318 {
319         assert(mode_is_float(mode));
320         switch(get_mode_size_bits(mode)) {
321         case 32:
322                 return 's';
323         case 64:
324                 return 'd';
325         default:
326                 assert(0);
327         }
328         return '%';
329 }
330
331 void ia32_emit_xmm_mode_suffix(ia32_emit_env_t *env, const ir_node *node)
332 {
333         ir_mode *mode = get_ia32_ls_mode(node);
334         assert(mode != NULL);
335         be_emit_char(env, 's');
336         be_emit_char(env, get_xmm_mode_suffix(mode));
337 }
338
339 void ia32_emit_xmm_mode_suffix_s(ia32_emit_env_t *env, const ir_node *node)
340 {
341         ir_mode *mode = get_ia32_ls_mode(node);
342         assert(mode != NULL);
343         be_emit_char(env, get_xmm_mode_suffix(mode));
344 }
345
346 void ia32_emit_extend_suffix(ia32_emit_env_t *env, const ir_mode *mode)
347 {
348         if(get_mode_size_bits(mode) == 32)
349                 return;
350         if(mode_is_signed(mode)) {
351                 be_emit_char(env, 's');
352         } else {
353                 be_emit_char(env, 'z');
354         }
355 }
356
357 static
358 void ia32_emit_function_object(ia32_emit_env_t *env, const char *name)
359 {
360         switch (be_gas_flavour) {
361         case GAS_FLAVOUR_NORMAL:
362                 be_emit_cstring(env, "\t.type\t");
363                 be_emit_string(env, name);
364                 be_emit_cstring(env, ", @function\n");
365                 be_emit_write_line(env);
366                 break;
367         case GAS_FLAVOUR_MINGW:
368                 be_emit_cstring(env, "\t.def\t");
369                 be_emit_string(env, name);
370                 be_emit_cstring(env, ";\t.scl\t2;\t.type\t32;\t.endef\n");
371                 be_emit_write_line(env);
372                 break;
373         default:
374                 break;
375         }
376 }
377
378 static
379 void ia32_emit_function_size(ia32_emit_env_t *env, const char *name)
380 {
381         switch (be_gas_flavour) {
382         case GAS_FLAVOUR_NORMAL:
383                 be_emit_cstring(env, "\t.size\t");
384                 be_emit_string(env, name);
385                 be_emit_cstring(env, ", .-");
386                 be_emit_string(env, name);
387                 be_emit_char(env, '\n');
388                 be_emit_write_line(env);
389                 break;
390         default:
391                 break;
392         }
393 }
394
395
396 static
397 void emit_ia32_Immediate(ia32_emit_env_t *env, const ir_node *node);
398
399 /**
400  * Emits registers and/or address mode of a binary operation.
401  */
402 void ia32_emit_binop(ia32_emit_env_t *env, const ir_node *node) {
403         int            right_pos;
404         const ir_node *right_op = get_irn_n(node, 3);
405
406         switch(get_ia32_op_type(node)) {
407         case ia32_Normal:
408                 if(is_ia32_Immediate(right_op)) {
409                         emit_ia32_Immediate(env, right_op);
410                         be_emit_cstring(env, ", ");
411                         ia32_emit_source_register(env, node, 2);
412                         break;
413                 } else if (is_ia32_ImmConst(node) || is_ia32_ImmSymConst(node)) {
414                         ia32_emit_immediate(env, node);
415                         be_emit_cstring(env, ", ");
416                         ia32_emit_source_register(env, node, 2);
417                 } else {
418                         const arch_register_t *in1 = get_in_reg(env, node, 2);
419                         const arch_register_t *in2 = get_in_reg(env, node, 3);
420                         const arch_register_t *out = produces_result(node) ? get_out_reg(env, node, 0) : NULL;
421                         const arch_register_t *in;
422                         const char            *in_name;
423
424                         in      = out ? (REGS_ARE_EQUAL(out, in2) ? in1 : in2) : in2;
425                         out     = out ? out : in1;
426                         in_name = arch_register_get_name(in);
427
428                         if (is_ia32_emit_cl(node)) {
429                                 assert(REGS_ARE_EQUAL(&ia32_gp_regs[REG_ECX], in) && "shift operation needs ecx");
430                                 in_name = "cl";
431                         }
432
433                         be_emit_char(env, '%');
434                         be_emit_string(env, in_name);
435                         be_emit_cstring(env, ", %");
436                         be_emit_string(env, arch_register_get_name(out));
437                 }
438                 break;
439         case ia32_AddrModeS:
440                 if (is_ia32_ImmConst(node) || is_ia32_ImmSymConst(node)) {
441                         assert(!produces_result(node) &&
442                                         "Source AM with Const must not produce result");
443                         ia32_emit_immediate(env, node);
444                         be_emit_cstring(env, ", ");
445                         ia32_emit_am(env, node);
446                 } else if(is_ia32_Immediate(right_op)) {
447                         assert(!produces_result(node) &&
448                                         "Source AM with Const must not produce result");
449
450                         emit_ia32_Immediate(env, right_op);
451                         be_emit_cstring(env, ", ");
452                         ia32_emit_am(env, node);
453                 } else if (produces_result(node)) {
454                         ia32_emit_am(env, node);
455                         be_emit_cstring(env, ", ");
456                         ia32_emit_dest_register(env, node, 0);
457                 } else {
458                         ia32_emit_am(env, node);
459                         be_emit_cstring(env, ", ");
460                         ia32_emit_source_register(env, node, 2);
461                 }
462                 break;
463         case ia32_AddrModeD:
464                 right_pos = get_irn_arity(node) >= 5 ? 3 : 2;
465                 right_op  = get_irn_n(node, right_pos);
466                 if(is_ia32_Immediate(right_op)) {
467                         emit_ia32_Immediate(env, right_op);
468                         be_emit_cstring(env, ", ");
469                         ia32_emit_am(env, node);
470                         break;
471                 } else if (is_ia32_ImmConst(node) || is_ia32_ImmSymConst(node)) {
472                         ia32_emit_immediate(env, node);
473                         be_emit_cstring(env, ", ");
474                         ia32_emit_am(env, node);
475                 } else {
476                         const arch_register_t *in1 = get_in_reg(env, node, right_pos);
477                         ir_mode               *mode = get_ia32_ls_mode(node);
478                         const char            *in_name;
479
480                         in_name = ia32_get_reg_name_for_mode(env, mode, in1);
481
482                         if (is_ia32_emit_cl(node)) {
483                                 assert(REGS_ARE_EQUAL(&ia32_gp_regs[REG_ECX], in1) && "shift operation needs ecx");
484                                 in_name = "cl";
485                         }
486
487                         be_emit_char(env, '%');
488                         be_emit_string(env, in_name);
489                         be_emit_cstring(env, ", ");
490                         ia32_emit_am(env, node);
491                 }
492                 break;
493         default:
494                 assert(0 && "unsupported op type");
495         }
496 }
497
498 /**
499  * Emits registers and/or address mode of a binary operation.
500  */
501 void ia32_emit_x87_binop(ia32_emit_env_t *env, const ir_node *node) {
502         switch(get_ia32_op_type(node)) {
503                 case ia32_Normal:
504                         if (is_ia32_ImmConst(node) || is_ia32_ImmSymConst(node)) {
505                                 // should not happen...
506                                 assert(0);
507                         } else {
508                                 const ia32_x87_attr_t *x87_attr = get_ia32_x87_attr_const(node);
509                                 const arch_register_t *in1      = x87_attr->x87[0];
510                                 const arch_register_t *in2      = x87_attr->x87[1];
511                                 const arch_register_t *out      = x87_attr->x87[2];
512                                 const arch_register_t *in;
513
514                                 in  = out ? (REGS_ARE_EQUAL(out, in2) ? in1 : in2) : in2;
515                                 out = out ? out : in1;
516
517                                 be_emit_char(env, '%');
518                                 be_emit_string(env, arch_register_get_name(in));
519                                 be_emit_cstring(env, ", %");
520                                 be_emit_string(env, arch_register_get_name(out));
521                         }
522                         break;
523                 case ia32_AddrModeS:
524                 case ia32_AddrModeD:
525                         ia32_emit_am(env, node);
526                         break;
527                 default:
528                         assert(0 && "unsupported op type");
529         }
530 }
531
532 void ia32_emit_am_or_dest_register(ia32_emit_env_t *env, const ir_node *node,
533                                    int pos) {
534         if(get_ia32_op_type(node) == ia32_Normal) {
535                 ia32_emit_dest_register(env, node, pos);
536         } else {
537                 assert(get_ia32_op_type(node) == ia32_AddrModeD);
538                 ia32_emit_am(env, node);
539         }
540 }
541
542 /**
543  * Emits registers and/or address mode of a unary operation.
544  */
545 void ia32_emit_unop(ia32_emit_env_t *env, const ir_node *node, int pos) {
546         const ir_node *op;
547
548         switch(get_ia32_op_type(node)) {
549         case ia32_Normal:
550                 op = get_irn_n(node, pos);
551                 if (is_ia32_Immediate(op)) {
552                         emit_ia32_Immediate(env, op);
553                 } else if (is_ia32_ImmConst(node) || is_ia32_ImmSymConst(node)) {
554                         ia32_emit_immediate(env, node);
555                 } else {
556                         ia32_emit_source_register(env, node, pos);
557                 }
558                 break;
559         case ia32_AddrModeS:
560         case ia32_AddrModeD:
561                 ia32_emit_am(env, node);
562                 break;
563         default:
564                 assert(0 && "unsupported op type");
565         }
566 }
567
568 /**
569  * Emits address mode.
570  */
571 void ia32_emit_am(ia32_emit_env_t *env, const ir_node *node) {
572         ir_entity *ent       = get_ia32_am_sc(node);
573         int        offs      = get_ia32_am_offs_int(node);
574         ir_node   *base      = get_irn_n(node, 0);
575         int        has_base  = !is_ia32_NoReg_GP(base);
576         ir_node   *index     = get_irn_n(node, 1);
577         int        has_index = !is_ia32_NoReg_GP(index);
578
579         /* just to be sure... */
580         assert(!is_ia32_use_frame(node) || get_ia32_frame_ent(node) != NULL);
581
582         /* emit offset */
583         if (ent != NULL) {
584                 ident *id;
585
586                 set_entity_backend_marked(ent, 1);
587                 id = get_entity_ld_ident(ent);
588                 if (is_ia32_am_sc_sign(node))
589                         be_emit_char(env, '-');
590                 be_emit_ident(env, id);
591
592                 if(get_entity_owner(ent) == get_tls_type()) {
593                         if (get_entity_visibility(ent) == visibility_external_allocated) {
594                                 be_emit_cstring(env, "@INDNTPOFF");
595                         } else {
596                                 be_emit_cstring(env, "@NTPOFF");
597                         }
598                 }
599         }
600
601         if(offs != 0) {
602                 if(ent != NULL) {
603                         be_emit_irprintf(env->emit, "%+d", offs);
604                 } else {
605                         be_emit_irprintf(env->emit, "%d", offs);
606                 }
607         }
608
609         if (has_base || has_index) {
610                 be_emit_char(env, '(');
611
612                 /* emit base */
613                 if (has_base) {
614                         ia32_emit_source_register(env, node, 0);
615                 }
616
617                 /* emit index + scale */
618                 if (has_index) {
619                         int scale;
620                         be_emit_char(env, ',');
621                         ia32_emit_source_register(env, node, 1);
622
623                         scale = get_ia32_am_scale(node);
624                         if (scale > 0) {
625                                 be_emit_irprintf(env->emit, ",%d", 1 << get_ia32_am_scale(node));
626                         }
627                 }
628                 be_emit_char(env, ')');
629         }
630 }
631
632 /*************************************************
633  *                 _ _                         _
634  *                (_) |                       | |
635  *   ___ _ __ ___  _| |_    ___ ___  _ __   __| |
636  *  / _ \ '_ ` _ \| | __|  / __/ _ \| '_ \ / _` |
637  * |  __/ | | | | | | |_  | (_| (_) | | | | (_| |
638  *  \___|_| |_| |_|_|\__|  \___\___/|_| |_|\__,_|
639  *
640  *************************************************/
641
642 #undef IA32_DO_EMIT
643 #define IA32_DO_EMIT(irn) ia32_fprintf_format(F, irn, cmd_buf, cmnt_buf)
644
645 /*
646  * coding of conditions
647  */
648 struct cmp2conditon_t {
649         const char *name;
650         pn_Cmp      num;
651 };
652
653 /*
654  * positive conditions for signed compares
655  */
656 static
657 const struct cmp2conditon_t cmp2condition_s[] = {
658         { NULL,              pn_Cmp_False },  /* always false */
659         { "e",               pn_Cmp_Eq },     /* == */
660         { "l",               pn_Cmp_Lt },     /* < */
661         { "le",              pn_Cmp_Le },     /* <= */
662         { "g",               pn_Cmp_Gt },     /* > */
663         { "ge",              pn_Cmp_Ge },     /* >= */
664         { "ne",              pn_Cmp_Lg },     /* != */
665         { NULL,              pn_Cmp_Leg},     /* Floating point: ordered */
666         { NULL,              pn_Cmp_Uo },     /* Floating point: unordered */
667         { "e",               pn_Cmp_Ue },     /* Floating point: unordered or == */
668         { "b",               pn_Cmp_Ul },     /* Floating point: unordered or < */
669         { "be",              pn_Cmp_Ule },    /* Floating point: unordered or <= */
670         { "a",               pn_Cmp_Ug },     /* Floating point: unordered or > */
671         { "ae",              pn_Cmp_Uge },    /* Floating point: unordered or >= */
672         { "ne",              pn_Cmp_Ne },     /* Floating point: unordered or != */
673         { NULL,              pn_Cmp_True },   /* always true */
674 };
675
676 /*
677  * positive conditions for unsigned compares
678  */
679 static
680 const struct cmp2conditon_t cmp2condition_u[] = {
681         { NULL,              pn_Cmp_False },  /* always false */
682         { "e",               pn_Cmp_Eq },     /* == */
683         { "b",               pn_Cmp_Lt },     /* < */
684         { "be",              pn_Cmp_Le },     /* <= */
685         { "a",               pn_Cmp_Gt },     /* > */
686         { "ae",              pn_Cmp_Ge },     /* >= */
687         { "ne",              pn_Cmp_Lg },     /* != */
688         { NULL,              pn_Cmp_True },   /* always true */
689 };
690
691 /*
692  * returns the condition code
693  */
694 static
695 const char *get_cmp_suffix(pn_Cmp cmp_code)
696 {
697         assert( (cmp2condition_s[cmp_code & 15].num) == (cmp_code & 15));
698         assert( (cmp2condition_u[cmp_code & 7].num) == (cmp_code & 7));
699
700         if((cmp_code & ia32_pn_Cmp_Unsigned)) {
701                 return cmp2condition_u[cmp_code & 7].name;
702         } else {
703                 return cmp2condition_s[cmp_code & 15].name;
704         }
705 }
706
707 void ia32_emit_cmp_suffix(ia32_emit_env_t *env, long pnc)
708 {
709         be_emit_string(env, get_cmp_suffix(pnc));
710 }
711
712
713 /**
714  * Returns the target block for a control flow node.
715  */
716 static
717 ir_node *get_cfop_target_block(const ir_node *irn) {
718         return get_irn_link(irn);
719 }
720
721 /**
722  * Emits a block label for the given block.
723  */
724 static
725 void ia32_emit_block_name(ia32_emit_env_t *env, const ir_node *block)
726 {
727         be_emit_cstring(env, BLOCK_PREFIX);
728         be_emit_irprintf(env->emit, "%d", get_irn_node_nr(block));
729 }
730
731 /**
732  * Emits the target label for a control flow node.
733  */
734 static
735 void ia32_emit_cfop_target(ia32_emit_env_t * env, const ir_node *node) {
736         ir_node *block = get_cfop_target_block(node);
737
738         ia32_emit_block_name(env, block);
739 }
740
741 /** Return the next block in Block schedule */
742 static ir_node *next_blk_sched(const ir_node *block) {
743         return get_irn_link(block);
744 }
745
746 /**
747  * Returns the Proj with projection number proj and NOT mode_M
748  */
749 static
750 ir_node *get_proj(const ir_node *node, long proj) {
751         const ir_edge_t *edge;
752         ir_node         *src;
753
754         assert(get_irn_mode(node) == mode_T && "expected mode_T node");
755
756         foreach_out_edge(node, edge) {
757                 src = get_edge_src_irn(edge);
758
759                 assert(is_Proj(src) && "Proj expected");
760                 if (get_irn_mode(src) == mode_M)
761                         continue;
762
763                 if (get_Proj_proj(src) == proj)
764                         return src;
765         }
766         return NULL;
767 }
768
769 /**
770  * Emits the jump sequence for a conditional jump (cmp + jmp_true + jmp_false)
771  */
772 static
773 void finish_CondJmp(ia32_emit_env_t *env, const ir_node *node, ir_mode *mode,
774                     long pnc) {
775         const ir_node *proj_true;
776         const ir_node *proj_false;
777         const ir_node *block;
778         const ir_node *next_block;
779         int flipped = 0;
780
781         /* get both Proj's */
782         proj_true = get_proj(node, pn_Cond_true);
783         assert(proj_true && "CondJmp without true Proj");
784
785         proj_false = get_proj(node, pn_Cond_false);
786         assert(proj_false && "CondJmp without false Proj");
787
788         /* for now, the code works for scheduled and non-schedules blocks */
789         block = get_nodes_block(node);
790
791         /* we have a block schedule */
792         next_block = next_blk_sched(block);
793
794         if (get_cfop_target_block(proj_true) == next_block) {
795                 /* exchange both proj's so the second one can be omitted */
796                 const ir_node *t = proj_true;
797
798                 proj_true  = proj_false;
799                 proj_false = t;
800                 flipped    = 1;
801                 pnc        = get_negated_pnc(pnc, mode);
802         }
803
804         /* in case of unordered compare, check for parity */
805         if (pnc & pn_Cmp_Uo) {
806                 be_emit_cstring(env, "\tjp ");
807                 ia32_emit_cfop_target(env, proj_true);
808                 be_emit_finish_line_gas(env, proj_true);
809         }
810
811         be_emit_cstring(env, "\tj");
812         ia32_emit_cmp_suffix(env, pnc);
813         be_emit_char(env, ' ');
814         ia32_emit_cfop_target(env, proj_true);
815         be_emit_finish_line_gas(env, proj_true);
816
817         /* the second Proj might be a fallthrough */
818         if (get_cfop_target_block(proj_false) != next_block) {
819                 be_emit_cstring(env, "\tjmp ");
820                 ia32_emit_cfop_target(env, proj_false);
821                 be_emit_finish_line_gas(env, proj_false);
822         } else {
823                 be_emit_cstring(env, "\t/* fallthrough to ");
824                 ia32_emit_cfop_target(env, proj_false);
825                 be_emit_cstring(env, " */");
826                 be_emit_finish_line_gas(env, proj_false);
827         }
828 }
829
830 /**
831  * Emits code for conditional jump.
832  */
833 static
834 void CondJmp_emitter(ia32_emit_env_t *env, const ir_node *node) {
835         be_emit_cstring(env, "\tcmp");
836         ia32_emit_mode_suffix(env, node);
837         be_emit_char(env, ' ');
838         ia32_emit_binop(env, node);
839         be_emit_finish_line_gas(env, node);
840
841         finish_CondJmp(env, node, mode_Iu, get_ia32_pncode(node));
842 }
843
844 /**
845  * Emits code for conditional jump with two variables.
846  */
847 static
848 void emit_ia32_CondJmp(ia32_emit_env_t *env, const ir_node *node) {
849         CondJmp_emitter(env, node);
850 }
851
852 /**
853  * Emits code for conditional test and jump.
854  */
855 static
856 void TestJmp_emitter(ia32_emit_env_t *env, const ir_node *node) {
857         be_emit_cstring(env, "\ttest");
858         ia32_emit_mode_suffix(env, node);
859         be_emit_char(env, ' ');
860
861         ia32_emit_binop(env, node);
862         be_emit_finish_line_gas(env, node);
863
864         finish_CondJmp(env, node, mode_Iu, get_ia32_pncode(node));
865 }
866
867 /**
868  * Emits code for conditional test and jump with two variables.
869  */
870 static
871 void emit_ia32_TestJmp(ia32_emit_env_t *env, const ir_node *node) {
872         TestJmp_emitter(env, node);
873 }
874
875 static
876 void emit_ia32_CJmp(ia32_emit_env_t *env, const ir_node *node) {
877         be_emit_cstring(env, "/* omitted redundant test */");
878         be_emit_finish_line_gas(env, node);
879
880         finish_CondJmp(env, node, mode_Is, get_ia32_pncode(node));
881 }
882
883 static
884 void emit_ia32_CJmpAM(ia32_emit_env_t *env, const ir_node *node) {
885         be_emit_cstring(env, "/* omitted redundant test/cmp */");
886         be_emit_finish_line_gas(env, node);
887
888         finish_CondJmp(env, node, mode_Is, get_ia32_pncode(node));
889 }
890
891 /**
892  * Emits code for conditional SSE floating point jump with two variables.
893  */
894 static
895 void emit_ia32_xCondJmp(ia32_emit_env_t *env, const ir_node *node) {
896         be_emit_cstring(env, "\tucomi");
897         ia32_emit_xmm_mode_suffix(env, node);
898         be_emit_char(env, ' ');
899         ia32_emit_binop(env, node);
900         be_emit_finish_line_gas(env, node);
901
902         finish_CondJmp(env, node, mode_F, get_ia32_pncode(node));
903 }
904
905 /**
906  * Emits code for conditional x87 floating point jump with two variables.
907  */
908 static
909 void emit_ia32_x87CondJmp(ia32_emit_env_t *env, const ir_node *node) {
910         const ia32_x87_attr_t *x87_attr = get_ia32_x87_attr_const(node);
911         const char            *reg      = x87_attr->x87[1]->name;
912         long                   pnc      = get_ia32_pncode(node);
913
914         switch (get_ia32_irn_opcode(node)) {
915         case iro_ia32_fcomrJmp:
916                 pnc = get_inversed_pnc(pnc);
917                 reg = x87_attr->x87[0]->name;
918         case iro_ia32_fcomJmp:
919         default:
920                 be_emit_cstring(env, "\tfucom ");
921                 break;
922         case iro_ia32_fcomrpJmp:
923                 pnc = get_inversed_pnc(pnc);
924                 reg = x87_attr->x87[0]->name;
925         case iro_ia32_fcompJmp:
926                 be_emit_cstring(env, "\tfucomp ");
927                 break;
928         case iro_ia32_fcomrppJmp:
929                 pnc = get_inversed_pnc(pnc);
930         case iro_ia32_fcomppJmp:
931                 be_emit_cstring(env, "\tfucompp ");
932                 reg = "";
933                 break;
934         }
935
936         if(reg[0] != '\0') {
937                 be_emit_char(env, '%');
938                 be_emit_string(env, reg);
939         }
940         be_emit_finish_line_gas(env, node);
941
942         be_emit_cstring(env, "\tfnstsw %ax");
943         be_emit_finish_line_gas(env, node);
944         be_emit_cstring(env, "\tsahf");
945         be_emit_finish_line_gas(env, node);
946
947         finish_CondJmp(env, node, mode_E, pnc);
948 }
949
950 static
951 void emit_register_or_immediate(ia32_emit_env_t *env, const ir_node *node,
952                                 int pos)
953 {
954         ir_node *op = get_irn_n(node, pos);
955         if(is_ia32_Immediate(op)) {
956                 emit_ia32_Immediate(env, op);
957         } else {
958                 ia32_emit_source_register(env, node, pos);
959         }
960 }
961
962 static
963 int is_ia32_Immediate_0(const ir_node *node)
964 {
965         const ia32_immediate_attr_t *attr = get_ia32_immediate_attr_const(node);
966
967         return attr->offset == 0 && attr->symconst == NULL;
968 }
969
970 static
971 void CMov_emitter(ia32_emit_env_t *env, const ir_node *node)
972 {
973         long pnc = get_ia32_pncode(node);
974         const arch_register_t *in1, *in2, *out;
975
976         out = arch_get_irn_register(env->arch_env, node);
977         in1 = arch_get_irn_register(env->arch_env, get_irn_n(node, 2));
978         in2 = arch_get_irn_register(env->arch_env, get_irn_n(node, 3));
979
980         /* we have to emit the cmp first, because the destination register */
981         /* could be one of the compare registers                           */
982         if (is_ia32_CmpCMov(node)) {
983                 long pncr = pnc & ~ia32_pn_Cmp_Unsigned;
984                 ir_node *cmp_right = get_irn_n(node, 1);
985
986                 if( (pncr == pn_Cmp_Eq || pncr == pn_Cmp_Lg)
987                                 && is_ia32_Immediate(cmp_right)
988                                 && is_ia32_Immediate_0(cmp_right)) {
989                         be_emit_cstring(env, "\ttest ");
990                         ia32_emit_source_register(env, node, 0);
991                         be_emit_cstring(env, ", ");
992                         ia32_emit_source_register(env, node, 0);
993                 } else {
994                         be_emit_cstring(env, "\tcmp ");
995                         emit_register_or_immediate(env, node, 1);
996                         be_emit_cstring(env, ", ");
997                         ia32_emit_source_register(env, node, 0);
998                 }
999         } else if (is_ia32_xCmpCMov(node)) {
1000                 be_emit_cstring(env, "\tucomis");
1001                 ia32_emit_mode_suffix_mode(env, get_irn_mode(node));
1002                 be_emit_char(env, ' ');
1003                 ia32_emit_source_register(env, node, 1);
1004                 be_emit_cstring(env, ", ");
1005                 ia32_emit_source_register(env, node, 0);
1006         } else {
1007                 assert(0 && "unsupported CMov");
1008         }
1009         be_emit_finish_line_gas(env, node);
1010
1011         if (REGS_ARE_EQUAL(out, in2)) {
1012                 /* best case: default in == out -> do nothing */
1013         } else if (REGS_ARE_EQUAL(out, in1)) {
1014                 ir_node *n = (ir_node*) node;
1015                 /* true in == out -> need complement compare and exchange true and default in */
1016                 ir_node *t = get_irn_n(n, 2);
1017                 set_irn_n(n, 2, get_irn_n(n, 3));
1018                 set_irn_n(n, 3, t);
1019
1020                 pnc = get_negated_pnc(pnc, get_irn_mode(node));
1021         } else {
1022                 /* out is different from in: need copy default -> out */
1023                 be_emit_cstring(env, "\tmovl ");
1024                 ia32_emit_source_register(env, node, n_ia32_CmpCMov_val_false);
1025                 be_emit_cstring(env, ", ");
1026                 ia32_emit_dest_register(env, node, 0);
1027                 be_emit_finish_line_gas(env, node);
1028         }
1029
1030         be_emit_cstring(env, "\tcmov");
1031         ia32_emit_cmp_suffix(env, pnc);
1032         be_emit_cstring(env, "l ");
1033         ia32_emit_source_register(env, node, n_ia32_CmpCMov_val_true);
1034         be_emit_cstring(env, ", ");
1035         ia32_emit_dest_register(env, node, 0);
1036         be_emit_finish_line_gas(env, node);
1037 }
1038
1039 static
1040 void emit_ia32_CmpCMov(ia32_emit_env_t *env, const ir_node *node)
1041 {
1042         CMov_emitter(env, node);
1043 }
1044
1045 static
1046 void emit_ia32_xCmpCMov(ia32_emit_env_t *env, const ir_node *node)
1047 {
1048         CMov_emitter(env, node);
1049 }
1050
1051 static
1052 void Set_emitter(ia32_emit_env_t *env, const ir_node *node)
1053 {
1054         long pnc = get_ia32_pncode(node);
1055         const char *reg8bit;
1056         const arch_register_t *out;
1057
1058         out     = arch_get_irn_register(env->arch_env, node);
1059         reg8bit = ia32_get_mapped_reg_name(env->isa->regs_8bit, out);
1060
1061         if (is_ia32_CmpSet(node)) {
1062                 long     pncr      = pnc & ~ia32_pn_Cmp_Unsigned;
1063                 ir_node *cmp_right = get_irn_n(node, n_ia32_CmpSet_cmp_right);
1064
1065                 if( (pncr == pn_Cmp_Eq || pncr == pn_Cmp_Lg)
1066                                 && is_ia32_Immediate(cmp_right)
1067                                 && is_ia32_Immediate_0(cmp_right)) {
1068                         be_emit_cstring(env, "\ttest ");
1069                         ia32_emit_source_register(env, node, n_ia32_CmpSet_cmp_left);
1070                         be_emit_cstring(env, ", ");
1071                         ia32_emit_source_register(env, node, n_ia32_CmpSet_cmp_left);
1072                 } else {
1073                         be_emit_cstring(env, "\tcmp ");
1074                         ia32_emit_binop(env, node);
1075                 }
1076         } else if (is_ia32_xCmpSet(node)) {
1077                 be_emit_cstring(env, "\tucomis");
1078                 ia32_emit_mode_suffix_mode(env, get_irn_mode(get_irn_n(node, 2)));
1079                 be_emit_char(env, ' ');
1080                 ia32_emit_binop(env, node);
1081         } else {
1082                 assert(0 && "unsupported Set");
1083         }
1084         be_emit_finish_line_gas(env, node);
1085
1086         /* use mov to clear target because it doesn't affect the eflags */
1087         be_emit_cstring(env, "\tmovl $0, %");
1088         be_emit_string(env, arch_register_get_name(out));
1089         be_emit_finish_line_gas(env, node);
1090
1091         be_emit_cstring(env, "\tset");
1092         ia32_emit_cmp_suffix(env, pnc);
1093         be_emit_cstring(env, " %");
1094         be_emit_string(env, reg8bit);
1095         be_emit_finish_line_gas(env, node);
1096 }
1097
1098 static
1099 void emit_ia32_CmpSet(ia32_emit_env_t *env, const ir_node *node) {
1100         Set_emitter(env, node);
1101 }
1102
1103 static
1104 void emit_ia32_xCmpSet(ia32_emit_env_t *env, const ir_node *node) {
1105         Set_emitter(env, node);
1106 }
1107
1108 static
1109 void emit_ia32_xCmp(ia32_emit_env_t *env, const ir_node *node) {
1110         int  sse_pnc  = -1;
1111         long pnc      = get_ia32_pncode(node);
1112         long unord    = pnc & pn_Cmp_Uo;
1113
1114         assert( (pnc & ia32_pn_Cmp_Unsigned) == 0);
1115
1116         switch (pnc) {
1117                 case pn_Cmp_Leg: /* odered */
1118                         sse_pnc = 7;
1119                         break;
1120                 case pn_Cmp_Uo:  /* unordered */
1121                         sse_pnc = 3;
1122                         break;
1123                 case pn_Cmp_Ue:
1124                 case pn_Cmp_Eq:  /* == */
1125                         sse_pnc = 0;
1126                         break;
1127                 case pn_Cmp_Ul:
1128                 case pn_Cmp_Lt:  /* < */
1129                         sse_pnc = 1;
1130                         break;
1131                 case pn_Cmp_Ule:
1132                 case pn_Cmp_Le: /* <= */
1133                         sse_pnc = 2;
1134                         break;
1135                 case pn_Cmp_Ug:
1136                 case pn_Cmp_Gt:  /* > */
1137                         sse_pnc = 6;
1138                         break;
1139                 case pn_Cmp_Uge:
1140                 case pn_Cmp_Ge: /* >= */
1141                         sse_pnc = 5;
1142                         break;
1143                 case pn_Cmp_Ne:
1144                 case pn_Cmp_Lg:  /* != */
1145                         sse_pnc = 4;
1146                         break;
1147         }
1148
1149         assert(sse_pnc >= 0 && "unsupported compare");
1150
1151         if (unord && sse_pnc != 3) {
1152                 /*
1153                         We need a separate compare against unordered.
1154                         Quick and Dirty solution:
1155                         - get some memory on stack
1156                         - compare
1157                         - store result
1158                         - compare
1159                         - and result and stored result
1160                     - cleanup stack
1161                 */
1162                 be_emit_cstring(env, "\tsubl $8, %esp");
1163                 be_emit_finish_line_gas(env, node);
1164
1165                 be_emit_cstring(env, "\tcmpsd $3, ");
1166                 ia32_emit_binop(env, node);
1167                 be_emit_finish_line_gas(env, node);
1168
1169                 be_emit_cstring(env, "\tmovsd ");
1170                 ia32_emit_dest_register(env, node, 0);
1171                 be_emit_cstring(env, ", (%esp)");
1172                 be_emit_finish_line_gas(env, node);
1173         }
1174
1175         be_emit_cstring(env, "\tcmpsd ");
1176         be_emit_irprintf(env->emit, "%d, ", sse_pnc);
1177         ia32_emit_binop(env, node);
1178         be_emit_finish_line_gas(env, node);
1179
1180         if (unord && sse_pnc != 3) {
1181                 be_emit_cstring(env, "\tandpd (%esp), ");
1182                 ia32_emit_dest_register(env, node, 0);
1183                 be_emit_finish_line_gas(env, node);
1184
1185                 be_emit_cstring(env, "\taddl $8, %esp");
1186                 be_emit_finish_line_gas(env, node);
1187         }
1188 }
1189
1190 /*********************************************************
1191  *                 _ _       _
1192  *                (_) |     (_)
1193  *   ___ _ __ ___  _| |_     _ _   _ _ __ ___  _ __  ___
1194  *  / _ \ '_ ` _ \| | __|   | | | | | '_ ` _ \| '_ \/ __|
1195  * |  __/ | | | | | | |_    | | |_| | | | | | | |_) \__ \
1196  *  \___|_| |_| |_|_|\__|   | |\__,_|_| |_| |_| .__/|___/
1197  *                         _/ |               | |
1198  *                        |__/                |_|
1199  *********************************************************/
1200
1201 /* jump table entry (target and corresponding number) */
1202 typedef struct _branch_t {
1203         ir_node *target;
1204         int      value;
1205 } branch_t;
1206
1207 /* jump table for switch generation */
1208 typedef struct _jmp_tbl_t {
1209         ir_node  *defProj;         /**< default target */
1210         long      min_value;       /**< smallest switch case */
1211         long      max_value;       /**< largest switch case */
1212         long      num_branches;    /**< number of jumps */
1213         char     *label;           /**< label of the jump table */
1214         branch_t *branches;        /**< jump array */
1215 } jmp_tbl_t;
1216
1217 /**
1218  * Compare two variables of type branch_t. Used to sort all switch cases
1219  */
1220 static
1221 int ia32_cmp_branch_t(const void *a, const void *b) {
1222         branch_t *b1 = (branch_t *)a;
1223         branch_t *b2 = (branch_t *)b;
1224
1225         if (b1->value <= b2->value)
1226                 return -1;
1227         else
1228                 return 1;
1229 }
1230
1231 /**
1232  * Emits code for a SwitchJmp (creates a jump table if
1233  * possible otherwise a cmp-jmp cascade). Port from
1234  * cggg ia32 backend
1235  */
1236 static
1237 void emit_ia32_SwitchJmp(ia32_emit_env_t *env, const ir_node *node) {
1238         unsigned long       interval;
1239         int                 last_value, i;
1240         long                pnc;
1241         jmp_tbl_t           tbl;
1242         ir_node            *proj;
1243         const ir_edge_t    *edge;
1244
1245         /* fill the table structure */
1246         tbl.label        = xmalloc(SNPRINTF_BUF_LEN);
1247         tbl.label        = get_unique_label(tbl.label, SNPRINTF_BUF_LEN, ".TBL_");
1248         tbl.defProj      = NULL;
1249         tbl.num_branches = get_irn_n_edges(node);
1250         tbl.branches     = xcalloc(tbl.num_branches, sizeof(tbl.branches[0]));
1251         tbl.min_value    = INT_MAX;
1252         tbl.max_value    = INT_MIN;
1253
1254         i = 0;
1255         /* go over all proj's and collect them */
1256         foreach_out_edge(node, edge) {
1257                 proj = get_edge_src_irn(edge);
1258                 assert(is_Proj(proj) && "Only proj allowed at SwitchJmp");
1259
1260                 pnc = get_Proj_proj(proj);
1261
1262                 /* create branch entry */
1263                 tbl.branches[i].target = proj;
1264                 tbl.branches[i].value  = pnc;
1265
1266                 tbl.min_value = pnc < tbl.min_value ? pnc : tbl.min_value;
1267                 tbl.max_value = pnc > tbl.max_value ? pnc : tbl.max_value;
1268
1269                 /* check for default proj */
1270                 if (pnc == get_ia32_pncode(node)) {
1271                         assert(tbl.defProj == NULL && "found two defProjs at SwitchJmp");
1272                         tbl.defProj = proj;
1273                 }
1274
1275                 i++;
1276         }
1277
1278         /* sort the branches by their number */
1279         qsort(tbl.branches, tbl.num_branches, sizeof(tbl.branches[0]), ia32_cmp_branch_t);
1280
1281         /* two-complement's magic make this work without overflow */
1282         interval = tbl.max_value - tbl.min_value;
1283
1284         /* emit the table */
1285         be_emit_cstring(env, "\tcmpl $");
1286         be_emit_irprintf(env->emit, "%u, ", interval);
1287         ia32_emit_source_register(env, node, 0);
1288         be_emit_finish_line_gas(env, node);
1289
1290         be_emit_cstring(env, "\tja ");
1291         ia32_emit_cfop_target(env, tbl.defProj);
1292         be_emit_finish_line_gas(env, node);
1293
1294         if (tbl.num_branches > 1) {
1295                 /* create table */
1296                 be_emit_cstring(env, "\tjmp *");
1297                 be_emit_string(env, tbl.label);
1298                 be_emit_cstring(env, "(,");
1299                 ia32_emit_source_register(env, node, 0);
1300                 be_emit_cstring(env, ",4)");
1301                 be_emit_finish_line_gas(env, node);
1302
1303                 be_gas_emit_switch_section(env->emit, GAS_SECTION_RODATA);
1304                 be_emit_cstring(env, "\t.align 4\n");
1305                 be_emit_write_line(env);
1306
1307                 be_emit_string(env, tbl.label);
1308                 be_emit_cstring(env, ":\n");
1309                 be_emit_write_line(env);
1310
1311                 be_emit_cstring(env, ".long ");
1312                 ia32_emit_cfop_target(env, tbl.branches[0].target);
1313                 be_emit_finish_line_gas(env, NULL);
1314
1315                 last_value = tbl.branches[0].value;
1316                 for (i = 1; i < tbl.num_branches; ++i) {
1317                         while (++last_value < tbl.branches[i].value) {
1318                                 be_emit_cstring(env, ".long ");
1319                                 ia32_emit_cfop_target(env, tbl.defProj);
1320                                 be_emit_finish_line_gas(env, NULL);
1321                         }
1322                         be_emit_cstring(env, ".long ");
1323                         ia32_emit_cfop_target(env, tbl.branches[i].target);
1324                         be_emit_finish_line_gas(env, NULL);
1325                 }
1326                 be_gas_emit_switch_section(env->emit, GAS_SECTION_TEXT);
1327         } else {
1328                 /* one jump is enough */
1329                 be_emit_cstring(env, "\tjmp ");
1330                 ia32_emit_cfop_target(env, tbl.branches[0].target);
1331                 be_emit_finish_line_gas(env, node);
1332         }
1333
1334         if (tbl.label)
1335                 free(tbl.label);
1336         if (tbl.branches)
1337                 free(tbl.branches);
1338 }
1339
1340 /**
1341  * Emits code for a unconditional jump.
1342  */
1343 static
1344 void emit_Jmp(ia32_emit_env_t *env, const ir_node *node) {
1345         ir_node *block, *next_block;
1346
1347         /* for now, the code works for scheduled and non-schedules blocks */
1348         block = get_nodes_block(node);
1349
1350         /* we have a block schedule */
1351         next_block = next_blk_sched(block);
1352         if (get_cfop_target_block(node) != next_block) {
1353                 be_emit_cstring(env, "\tjmp ");
1354                 ia32_emit_cfop_target(env, node);
1355         } else {
1356                 be_emit_cstring(env, "\t/* fallthrough to ");
1357                 ia32_emit_cfop_target(env, node);
1358                 be_emit_cstring(env, " */");
1359         }
1360         be_emit_finish_line_gas(env, node);
1361 }
1362
1363 static
1364 void emit_ia32_Immediate(ia32_emit_env_t *env, const ir_node *node)
1365 {
1366         const ia32_immediate_attr_t *attr = get_ia32_immediate_attr_const(node);
1367
1368         be_emit_char(env, '$');
1369         if(attr->symconst != NULL) {
1370                 ident *id = get_entity_ld_ident(attr->symconst);
1371
1372                 if(attr->attr.data.am_sc_sign)
1373                         be_emit_char(env, '-');
1374                 be_emit_ident(env, id);
1375         }
1376         if(attr->symconst == NULL || attr->offset != 0) {
1377                 if(attr->symconst != NULL)
1378                         be_emit_char(env, '+');
1379                 be_emit_irprintf(env->emit, "%d", attr->offset);
1380         }
1381 }
1382
1383 static
1384 const char* emit_asm_operand(ia32_emit_env_t *env, const ir_node *node,
1385                              const char *s)
1386 {
1387         const arch_register_t *reg;
1388         const char            *reg_name;
1389         char                   c;
1390         char                   modifier = 0;
1391         int                    num      = -1;
1392         const ia32_attr_t     *attr;
1393         int                    n_outs;
1394         int                    p;
1395
1396         assert(*s == '%');
1397         c = *(++s);
1398
1399         /* parse modifiers */
1400         switch(c) {
1401         case 0:
1402                 ir_fprintf(stderr, "Warning: asm text (%+F) ends with %\n", node);
1403                 be_emit_char(env, '%');
1404                 return s + 1;
1405         case '%':
1406                 be_emit_char(env, '%');
1407                 return s + 1;
1408         case 'w':
1409         case 'b':
1410         case 'h':
1411                 modifier = c;
1412                 ++s;
1413                 break;
1414         case '0':
1415         case '1':
1416         case '2':
1417         case '3':
1418         case '4':
1419         case '5':
1420         case '6':
1421         case '7':
1422         case '8':
1423         case '9':
1424                 break;
1425         default:
1426                 ir_fprintf(stderr, "Warning: asm text (%+F) contains unknown modifier "
1427                            "'%c' for asm op\n", node, c);
1428                 ++s;
1429                 break;
1430         }
1431
1432         /* parse number */
1433         sscanf(s, "%d%n", &num, &p);
1434         if(num < 0) {
1435                 ir_fprintf(stderr, "Warning: Couldn't parse assembler operand (%+F)\n",
1436                            node);
1437                 return s;
1438         } else {
1439                 s += p;
1440         }
1441
1442         /* get register */
1443         attr   = get_ia32_attr_const(node);
1444         n_outs = ARR_LEN(attr->slots);
1445         if(num < n_outs) {
1446                 reg = get_out_reg(env, node, num);
1447         } else {
1448                 ir_node *pred;
1449                 int      in = num - n_outs;
1450                 if(in >= get_irn_arity(node)) {
1451                         ir_fprintf(stderr, "Warning: Invalid input %d specified in asm "
1452                                    "op (%+F)\n", num, node);
1453                         return s;
1454                 }
1455                 pred = get_irn_n(node, in);
1456                 /* might be an immediate value */
1457                 if(is_ia32_Immediate(pred)) {
1458                         emit_ia32_Immediate(env, pred);
1459                         return s;
1460                 }
1461                 reg = get_in_reg(env, node, in);
1462         }
1463         if(reg == NULL) {
1464                 ir_fprintf(stderr, "Warning: no register assigned for %d asm op "
1465                            "(%+F)\n", num, node);
1466                 return s;
1467         }
1468
1469         /* emit it */
1470         be_emit_char(env, '%');
1471         switch(modifier) {
1472         case 0:
1473                 reg_name = arch_register_get_name(reg);
1474                 break;
1475         case 'b':
1476                 reg_name = ia32_get_mapped_reg_name(env->isa->regs_8bit, reg);
1477                 break;
1478         case 'h':
1479                 reg_name = ia32_get_mapped_reg_name(env->isa->regs_8bit_high, reg);
1480                 break;
1481         case 'w':
1482                 reg_name = ia32_get_mapped_reg_name(env->isa->regs_16bit, reg);
1483                 break;
1484         default:
1485                 panic("Invalid asm op modifier");
1486         }
1487         be_emit_string(env, reg_name);
1488
1489         return s;
1490 }
1491
1492 /**
1493  * Emits code for an ASM pseudo op.
1494  */
1495 static
1496 void emit_ia32_Asm(ia32_emit_env_t *env, const ir_node *node)
1497 {
1498         const void            *gen_attr = get_irn_generic_attr_const(node);
1499         const ia32_asm_attr_t *attr
1500                 = CONST_CAST_IA32_ATTR(ia32_asm_attr_t, gen_attr);
1501         ident                 *asm_text = attr->asm_text;
1502         const char            *s        = get_id_str(asm_text);
1503
1504         be_emit_cstring(env, "# Begin ASM \t");
1505         be_emit_finish_line_gas(env, node);
1506
1507         if (s[0] != '\t')
1508                 be_emit_char(env, '\t');
1509
1510         while(*s != 0) {
1511                 if(*s == '%') {
1512                         s = emit_asm_operand(env, node, s);
1513                         continue;
1514                 } else {
1515                         be_emit_char(env, *s);
1516                 }
1517                 ++s;
1518         }
1519
1520         be_emit_char(env, '\n');
1521         be_emit_write_line(env);
1522
1523         be_emit_cstring(env, "# End ASM\n");
1524         be_emit_write_line(env);
1525 }
1526
1527 /**********************************
1528  *   _____                  ____
1529  *  / ____|                |  _ \
1530  * | |     ___  _ __  _   _| |_) |
1531  * | |    / _ \| '_ \| | | |  _ <
1532  * | |___| (_) | |_) | |_| | |_) |
1533  *  \_____\___/| .__/ \__, |____/
1534  *             | |     __/ |
1535  *             |_|    |___/
1536  **********************************/
1537
1538 /**
1539  * Emit movsb/w instructions to make mov count divideable by 4
1540  */
1541 static
1542 void emit_CopyB_prolog(ia32_emit_env_t *env, int rem) {
1543         be_emit_cstring(env, "\tcld");
1544         be_emit_finish_line_gas(env, NULL);
1545
1546         switch(rem) {
1547         case 1:
1548                 be_emit_cstring(env, "\tmovsb");
1549                 be_emit_finish_line_gas(env, NULL);
1550                 break;
1551         case 2:
1552                 be_emit_cstring(env, "\tmovsw");
1553                 be_emit_finish_line_gas(env, NULL);
1554                 break;
1555         case 3:
1556                 be_emit_cstring(env, "\tmovsb");
1557                 be_emit_finish_line_gas(env, NULL);
1558                 be_emit_cstring(env, "\tmovsw");
1559                 be_emit_finish_line_gas(env, NULL);
1560                 break;
1561         }
1562 }
1563
1564 /**
1565  * Emit rep movsd instruction for memcopy.
1566  */
1567 static
1568 void emit_ia32_CopyB(ia32_emit_env_t *env, const ir_node *node) {
1569         tarval *tv = get_ia32_Immop_tarval(node);
1570         int    rem = get_tarval_long(tv);
1571
1572         emit_CopyB_prolog(env, rem);
1573
1574         be_emit_cstring(env, "\trep movsd");
1575         be_emit_finish_line_gas(env, node);
1576 }
1577
1578 /**
1579  * Emits unrolled memcopy.
1580  */
1581 static
1582 void emit_ia32_CopyB_i(ia32_emit_env_t *env, const ir_node *node) {
1583         tarval *tv   = get_ia32_Immop_tarval(node);
1584         int     size = get_tarval_long(tv);
1585
1586         emit_CopyB_prolog(env, size & 0x3);
1587
1588         size >>= 2;
1589         while (size--) {
1590                 be_emit_cstring(env, "\tmovsd");
1591                 be_emit_finish_line_gas(env, NULL);
1592         }
1593 }
1594
1595
1596
1597 /***************************
1598  *   _____
1599  *  / ____|
1600  * | |     ___  _ ____   __
1601  * | |    / _ \| '_ \ \ / /
1602  * | |___| (_) | | | \ V /
1603  *  \_____\___/|_| |_|\_/
1604  *
1605  ***************************/
1606
1607 /**
1608  * Emit code for conversions (I, FP), (FP, I) and (FP, FP).
1609  */
1610 static
1611 void emit_ia32_Conv_with_FP(ia32_emit_env_t *env, const ir_node *node) {
1612         ir_mode            *ls_mode = get_ia32_ls_mode(node);
1613         int                 ls_bits = get_mode_size_bits(ls_mode);
1614
1615         be_emit_cstring(env, "\tcvt");
1616
1617         if(is_ia32_Conv_I2FP(node)) {
1618                 if(ls_bits == 32) {
1619                         be_emit_cstring(env, "si2ss");
1620                 } else {
1621                         be_emit_cstring(env, "si2sd");
1622                 }
1623         } else if(is_ia32_Conv_FP2I(node)) {
1624                 if(ls_bits == 32) {
1625                         be_emit_cstring(env, "ss2si");
1626                 } else {
1627                         be_emit_cstring(env, "sd2si");
1628                 }
1629         } else {
1630                 assert(is_ia32_Conv_FP2FP(node));
1631                 if(ls_bits == 32) {
1632                         be_emit_cstring(env, "sd2ss");
1633                 } else {
1634                         be_emit_cstring(env, "ss2sd");
1635                 }
1636         }
1637         be_emit_char(env, ' ');
1638
1639         switch(get_ia32_op_type(node)) {
1640                 case ia32_Normal:
1641                         ia32_emit_source_register(env, node, 2);
1642                         be_emit_cstring(env, ", ");
1643                         ia32_emit_dest_register(env, node, 0);
1644                         break;
1645                 case ia32_AddrModeS:
1646                         ia32_emit_dest_register(env, node, 0);
1647                         be_emit_cstring(env, ", ");
1648                         ia32_emit_am(env, node);
1649                         break;
1650                 default:
1651                         assert(0 && "unsupported op type for Conv");
1652         }
1653         be_emit_finish_line_gas(env, node);
1654 }
1655
1656 static
1657 void emit_ia32_Conv_I2FP(ia32_emit_env_t *env, const ir_node *node) {
1658         emit_ia32_Conv_with_FP(env, node);
1659 }
1660
1661 static
1662 void emit_ia32_Conv_FP2I(ia32_emit_env_t *env, const ir_node *node) {
1663         emit_ia32_Conv_with_FP(env, node);
1664 }
1665
1666 static
1667 void emit_ia32_Conv_FP2FP(ia32_emit_env_t *env, const ir_node *node) {
1668         emit_ia32_Conv_with_FP(env, node);
1669 }
1670
1671 /**
1672  * Emits code for an Int conversion.
1673  */
1674 static
1675 void emit_ia32_Conv_I2I(ia32_emit_env_t *env, const ir_node *node) {
1676         const char *sign_suffix;
1677         ir_mode *smaller_mode = get_ia32_ls_mode(node);
1678         int smaller_bits = get_mode_size_bits(smaller_mode);
1679         int signed_mode;
1680         const arch_register_t *in_reg, *out_reg;
1681
1682         assert(!mode_is_float(smaller_mode));
1683         assert(smaller_bits == 8 || smaller_bits == 16 || smaller_bits == 32);
1684
1685         signed_mode = mode_is_signed(smaller_mode);
1686         if(smaller_bits == 32) {
1687                 // this should not happen as it's no convert
1688                 assert(0);
1689                 sign_suffix = "";
1690         } else {
1691                 sign_suffix = signed_mode ? "s" : "z";
1692         }
1693
1694         switch(get_ia32_op_type(node)) {
1695                 case ia32_Normal:
1696                         in_reg  = get_in_reg(env, node, 2);
1697                         out_reg = get_out_reg(env, node, 0);
1698
1699                         if (REGS_ARE_EQUAL(in_reg, &ia32_gp_regs[REG_EAX]) &&
1700                                 REGS_ARE_EQUAL(out_reg, in_reg)                &&
1701                                 signed_mode &&
1702                                 smaller_bits == 16)
1703                         {
1704                                 /* argument and result are both in EAX and */
1705                                 /* signedness is ok: -> use the smaller cwtl opcode */
1706                                 be_emit_cstring(env, "\tcwtl");
1707                         } else {
1708                                 const char *sreg = ia32_get_reg_name_for_mode(env, smaller_mode, in_reg);
1709
1710                                 be_emit_cstring(env, "\tmov");
1711                                 be_emit_string(env, sign_suffix);
1712                                 ia32_emit_mode_suffix_mode(env, smaller_mode);
1713                                 be_emit_cstring(env, "l %");
1714                                 be_emit_string(env, sreg);
1715                                 be_emit_cstring(env, ", ");
1716                                 ia32_emit_dest_register(env, node, 0);
1717                         }
1718                         break;
1719                 case ia32_AddrModeS: {
1720                         be_emit_cstring(env, "\tmov");
1721                         be_emit_string(env, sign_suffix);
1722                         ia32_emit_mode_suffix_mode(env, smaller_mode);
1723                         be_emit_cstring(env, "l %");
1724                         ia32_emit_am(env, node);
1725                         be_emit_cstring(env, ", ");
1726                         ia32_emit_dest_register(env, node, 0);
1727                         break;
1728                 }
1729                 default:
1730                         assert(0 && "unsupported op type for Conv");
1731         }
1732         be_emit_finish_line_gas(env, node);
1733 }
1734
1735 /**
1736  * Emits code for an 8Bit Int conversion.
1737  */
1738 void emit_ia32_Conv_I2I8Bit(ia32_emit_env_t *env, const ir_node *node) {
1739         emit_ia32_Conv_I2I(env, node);
1740 }
1741
1742
1743 /*******************************************
1744  *  _                          _
1745  * | |                        | |
1746  * | |__   ___ _ __   ___   __| | ___  ___
1747  * | '_ \ / _ \ '_ \ / _ \ / _` |/ _ \/ __|
1748  * | |_) |  __/ | | | (_) | (_| |  __/\__ \
1749  * |_.__/ \___|_| |_|\___/ \__,_|\___||___/
1750  *
1751  *******************************************/
1752
1753 /**
1754  * Emits a backend call
1755  */
1756 static
1757 void emit_be_Call(ia32_emit_env_t *env, const ir_node *node) {
1758         ir_entity *ent = be_Call_get_entity(node);
1759
1760         be_emit_cstring(env, "\tcall ");
1761         if (ent) {
1762                 set_entity_backend_marked(ent, 1);
1763                 be_emit_string(env, get_entity_ld_name(ent));
1764         } else {
1765                 be_emit_char(env, '*');
1766                 ia32_emit_dest_register(env, get_irn_n(node, be_pos_Call_ptr), 0);
1767         }
1768         be_emit_finish_line_gas(env, node);
1769 }
1770
1771 /**
1772  * Emits code to increase stack pointer.
1773  */
1774 static
1775 void emit_be_IncSP(ia32_emit_env_t *env, const ir_node *node) {
1776         int offs = be_get_IncSP_offset(node);
1777
1778         if (offs == 0)
1779                 return;
1780
1781         if (offs > 0) {
1782                 be_emit_cstring(env, "\tsubl $");
1783                 be_emit_irprintf(env->emit, "%u, ", offs);
1784                 ia32_emit_source_register(env, node, 0);
1785         } else {
1786                 be_emit_cstring(env, "\taddl $");
1787                 be_emit_irprintf(env->emit, "%u, ", -offs);
1788                 ia32_emit_source_register(env, node, 0);
1789         }
1790         be_emit_finish_line_gas(env, node);
1791 }
1792
1793 /**
1794  * Emits code to set stack pointer.
1795  */
1796 static
1797 void emit_be_SetSP(ia32_emit_env_t *env, const ir_node *node) {
1798         be_emit_cstring(env, "\tmovl ");
1799         ia32_emit_source_register(env, node, 2);
1800         be_emit_cstring(env, ", ");
1801         ia32_emit_dest_register(env, node, 0);
1802         be_emit_finish_line_gas(env, node);
1803 }
1804
1805 /**
1806  * Emits code for Copy/CopyKeep.
1807  */
1808 static
1809 void Copy_emitter(ia32_emit_env_t *env, const ir_node *node, const ir_node *op)
1810 {
1811         const arch_env_t *aenv = env->arch_env;
1812         ir_mode *mode;
1813
1814         if (REGS_ARE_EQUAL(arch_get_irn_register(aenv, node), arch_get_irn_register(aenv, op)) ||
1815                 arch_register_type_is(arch_get_irn_register(aenv, op), virtual))
1816                 return;
1817
1818         mode = get_irn_mode(node);
1819         if (mode == mode_E) {
1820                 be_emit_cstring(env, "\tmovsd ");
1821                 ia32_emit_source_register(env, node, 0);
1822                 be_emit_cstring(env, ", ");
1823                 ia32_emit_dest_register(env, node, 0);
1824         } else {
1825                 be_emit_cstring(env, "\tmovl ");
1826                 ia32_emit_source_register(env, node, 0);
1827                 be_emit_cstring(env, ", ");
1828                 ia32_emit_dest_register(env, node, 0);
1829         }
1830         be_emit_finish_line_gas(env, node);
1831 }
1832
1833 static
1834 void emit_be_Copy(ia32_emit_env_t *env, const ir_node *node) {
1835         Copy_emitter(env, node, be_get_Copy_op(node));
1836 }
1837
1838 static
1839 void emit_be_CopyKeep(ia32_emit_env_t *env, const ir_node *node) {
1840         Copy_emitter(env, node, be_get_CopyKeep_op(node));
1841 }
1842
1843 /**
1844  * Emits code for exchange.
1845  */
1846 static
1847 void emit_be_Perm(ia32_emit_env_t *env, const ir_node *node) {
1848         const arch_register_t *in1, *in2;
1849         const arch_register_class_t *cls1, *cls2;
1850
1851         in1 = arch_get_irn_register(env->arch_env, get_irn_n(node, 0));
1852         in2 = arch_get_irn_register(env->arch_env, get_irn_n(node, 1));
1853
1854         cls1 = arch_register_get_class(in1);
1855         cls2 = arch_register_get_class(in2);
1856
1857         assert(cls1 == cls2 && "Register class mismatch at Perm");
1858
1859         if (cls1 == &ia32_reg_classes[CLASS_ia32_gp]) {
1860                 be_emit_cstring(env, "\txchg ");
1861                 ia32_emit_source_register(env, node, 1);
1862                 be_emit_cstring(env, ", ");
1863                 ia32_emit_source_register(env, node, 0);
1864                 be_emit_finish_line_gas(env, node);
1865         } else if (cls1 == &ia32_reg_classes[CLASS_ia32_xmm]) {
1866                 be_emit_cstring(env, "\txorpd ");
1867                 ia32_emit_source_register(env, node, 1);
1868                 be_emit_cstring(env, ", ");
1869                 ia32_emit_source_register(env, node, 0);
1870                 be_emit_finish_line_gas(env, NULL);
1871
1872                 be_emit_cstring(env, "\txorpd ");
1873                 ia32_emit_source_register(env, node, 0);
1874                 be_emit_cstring(env, ", ");
1875                 ia32_emit_source_register(env, node, 1);
1876                 be_emit_finish_line_gas(env, NULL);
1877
1878                 be_emit_cstring(env, "\txorpd ");
1879                 ia32_emit_source_register(env, node, 1);
1880                 be_emit_cstring(env, ", ");
1881                 ia32_emit_source_register(env, node, 0);
1882                 be_emit_finish_line_gas(env, node);
1883         } else if (cls1 == &ia32_reg_classes[CLASS_ia32_vfp]) {
1884                 /* is a NOP */
1885         } else if (cls1 == &ia32_reg_classes[CLASS_ia32_st]) {
1886                 /* is a NOP */
1887         }
1888 }
1889
1890 /**
1891  * Emits code for Constant loading.
1892  */
1893 static
1894 void emit_ia32_Const(ia32_emit_env_t *env, const ir_node *node) {
1895         ia32_immop_type_t imm_tp = get_ia32_immop_type(node);
1896
1897         if (imm_tp == ia32_ImmSymConst) {
1898                 be_emit_cstring(env, "\tmovl ");
1899                 ia32_emit_immediate(env, node);
1900                 be_emit_cstring(env, ", ");
1901                 ia32_emit_dest_register(env, node, 0);
1902         } else {
1903                 tarval *tv = get_ia32_Immop_tarval(node);
1904                 assert(get_irn_mode(node) == mode_Iu);
1905                 /* beware: in some rare cases mode is mode_b which has no tarval_null() */
1906                 if (tarval_is_null(tv)) {
1907                         if (env->isa->opt_arch == arch_pentium_4) {
1908                                 /* P4 prefers sub r, r, others xor r, r */
1909                                 be_emit_cstring(env, "\tsubl ");
1910                         } else {
1911                                 be_emit_cstring(env, "\txorl ");
1912                         }
1913                         ia32_emit_dest_register(env, node, 0);
1914                         be_emit_cstring(env, ", ");
1915                         ia32_emit_dest_register(env, node, 0);
1916                 } else {
1917                         be_emit_cstring(env, "\tmovl ");
1918                         ia32_emit_immediate(env, node);
1919                         be_emit_cstring(env, ", ");
1920                         ia32_emit_dest_register(env, node, 0);
1921                 }
1922         }
1923         be_emit_finish_line_gas(env, node);
1924 }
1925
1926 /**
1927  * Emits code to load the TLS base
1928  */
1929 static
1930 void emit_ia32_LdTls(ia32_emit_env_t *env, const ir_node *node) {
1931         be_emit_cstring(env, "\tmovl %gs:0, ");
1932         ia32_emit_dest_register(env, node, 0);
1933         be_emit_finish_line_gas(env, node);
1934 }
1935
1936 static
1937 void emit_be_Return(ia32_emit_env_t *env, const ir_node *node)
1938 {
1939         be_emit_cstring(env, "\tret");
1940         be_emit_finish_line_gas(env, node);
1941 }
1942
1943 static
1944 void emit_Nothing(ia32_emit_env_t *env, const ir_node *node)
1945 {
1946         (void) env;
1947         (void) node;
1948 }
1949
1950
1951 /***********************************************************************************
1952  *                  _          __                                             _
1953  *                 (_)        / _|                                           | |
1954  *  _ __ ___   __ _ _ _ __   | |_ _ __ __ _ _ __ ___   _____      _____  _ __| | __
1955  * | '_ ` _ \ / _` | | '_ \  |  _| '__/ _` | '_ ` _ \ / _ \ \ /\ / / _ \| '__| |/ /
1956  * | | | | | | (_| | | | | | | | | | | (_| | | | | | |  __/\ V  V / (_) | |  |   <
1957  * |_| |_| |_|\__,_|_|_| |_| |_| |_|  \__,_|_| |_| |_|\___| \_/\_/ \___/|_|  |_|\_\
1958  *
1959  ***********************************************************************************/
1960
1961 /**
1962  * Enters the emitter functions for handled nodes into the generic
1963  * pointer of an opcode.
1964  */
1965 static
1966 void ia32_register_emitters(void) {
1967
1968 #define IA32_EMIT2(a,b) op_ia32_##a->ops.generic = (op_func)emit_ia32_##b
1969 #define IA32_EMIT(a)    IA32_EMIT2(a,a)
1970 #define EMIT(a)         op_##a->ops.generic = (op_func)emit_##a
1971 #define IGN(a)                  op_##a->ops.generic = (op_func)emit_Nothing
1972 #define BE_EMIT(a)      op_be_##a->ops.generic = (op_func)emit_be_##a
1973 #define BE_IGN(a)               op_be_##a->ops.generic = (op_func)emit_Nothing
1974
1975         /* first clear the generic function pointer for all ops */
1976         clear_irp_opcodes_generic_func();
1977
1978         /* register all emitter functions defined in spec */
1979         ia32_register_spec_emitters();
1980
1981         /* other ia32 emitter functions */
1982         IA32_EMIT(Asm);
1983         IA32_EMIT(CondJmp);
1984         IA32_EMIT(TestJmp);
1985         IA32_EMIT(CJmp);
1986         IA32_EMIT(CJmpAM);
1987         IA32_EMIT(CmpCMov);
1988         IA32_EMIT(CmpSet);
1989         IA32_EMIT(SwitchJmp);
1990         IA32_EMIT(CopyB);
1991         IA32_EMIT(CopyB_i);
1992         IA32_EMIT(Conv_I2FP);
1993         IA32_EMIT(Conv_FP2I);
1994         IA32_EMIT(Conv_FP2FP);
1995         IA32_EMIT(Conv_I2I);
1996         IA32_EMIT(Conv_I2I8Bit);
1997         IA32_EMIT(Const);
1998         IA32_EMIT(LdTls);
1999         IA32_EMIT(xCmp);
2000         IA32_EMIT(xCmpSet);
2001         IA32_EMIT(xCmpCMov);
2002         IA32_EMIT(xCondJmp);
2003         IA32_EMIT2(fcomJmp, x87CondJmp);
2004         IA32_EMIT2(fcompJmp, x87CondJmp);
2005         IA32_EMIT2(fcomppJmp, x87CondJmp);
2006         IA32_EMIT2(fcomrJmp, x87CondJmp);
2007         IA32_EMIT2(fcomrpJmp, x87CondJmp);
2008         IA32_EMIT2(fcomrppJmp, x87CondJmp);
2009
2010         /* benode emitter */
2011         BE_EMIT(Call);
2012         BE_EMIT(IncSP);
2013         BE_EMIT(SetSP);
2014         BE_EMIT(Copy);
2015         BE_EMIT(CopyKeep);
2016         BE_EMIT(Perm);
2017         BE_EMIT(Return);
2018
2019         BE_IGN(RegParams);
2020         BE_IGN(Barrier);
2021         BE_IGN(Keep);
2022
2023         /* firm emitter */
2024         EMIT(Jmp);
2025         IGN(Proj);
2026         IGN(Phi);
2027         IGN(Start);
2028
2029 #undef BE_EMIT
2030 #undef EMIT
2031 #undef IGN
2032 #undef IA32_EMIT2
2033 #undef IA32_EMIT
2034 }
2035
2036 static const char *last_name = NULL;
2037 static unsigned last_line = -1;
2038 static unsigned num = -1;
2039
2040 /**
2041  * Emit the debug support for node node.
2042  */
2043 static
2044 void ia32_emit_dbg(ia32_emit_env_t *env, const ir_node *node) {
2045         dbg_info *db = get_irn_dbg_info(node);
2046         unsigned lineno;
2047         const char *fname = be_retrieve_dbg_info(db, &lineno);
2048
2049         if (! env->cg->birg->main_env->options->stabs_debug_support)
2050                 return;
2051
2052         if (fname) {
2053                 if (last_name != fname) {
2054                         last_line = -1;
2055                         be_dbg_include_begin(env->cg->birg->main_env->db_handle, fname);
2056                         last_name = fname;
2057                 }
2058                 if (last_line != lineno) {
2059                         char name[64];
2060
2061                         snprintf(name, sizeof(name), ".LM%u", ++num);
2062                         last_line = lineno;
2063                         be_dbg_line(env->cg->birg->main_env->db_handle, lineno, name);
2064                         be_emit_string(env, name);
2065                         be_emit_cstring(env, ":\n");
2066                         be_emit_write_line(env);
2067                 }
2068         }
2069 }
2070
2071 typedef void (*emit_func_ptr) (ia32_emit_env_t *, const ir_node *);
2072
2073 /**
2074  * Emits code for a node.
2075  */
2076 static
2077 void ia32_emit_node(ia32_emit_env_t *env, const ir_node *node) {
2078         ir_op *op = get_irn_op(node);
2079
2080         DBG((dbg, LEVEL_1, "emitting code for %+F\n", node));
2081
2082         if (op->ops.generic) {
2083                 emit_func_ptr func = (emit_func_ptr) op->ops.generic;
2084                 ia32_emit_dbg(env, node);
2085                 (*func) (env, node);
2086         } else {
2087                 emit_Nothing(env, node);
2088                 ir_fprintf(stderr, "Warning: No emit handler for node %+F (%+G)\n", node, node);
2089         }
2090 }
2091
2092 /**
2093  * Emits gas alignment directives
2094  */
2095 static
2096 void ia32_emit_alignment(ia32_emit_env_t *env, unsigned align, unsigned skip) {
2097         be_emit_cstring(env, "\t.p2align ");
2098         be_emit_irprintf(env->emit, "%u,,%u\n", align, skip);
2099         be_emit_write_line(env);
2100 }
2101
2102 /**
2103  * Emits gas alignment directives for Functions depended on cpu architecture.
2104  */
2105 static
2106 void ia32_emit_align_func(ia32_emit_env_t *env, cpu_support cpu) {
2107         unsigned align;
2108         unsigned maximum_skip;
2109
2110         switch (cpu) {
2111                 case arch_i386:
2112                         align = 2;
2113                         break;
2114                 case arch_i486:
2115                         align = 4;
2116                         break;
2117                 case arch_k6:
2118                         align = 5;
2119                         break;
2120                 default:
2121                         align = 4;
2122         }
2123         maximum_skip = (1 << align) - 1;
2124         ia32_emit_alignment(env, align, maximum_skip);
2125 }
2126
2127 /**
2128  * Emits gas alignment directives for Labels depended on cpu architecture.
2129  */
2130 static
2131 void ia32_emit_align_label(ia32_emit_env_t *env, cpu_support cpu) {
2132         unsigned align; unsigned maximum_skip;
2133
2134         switch (cpu) {
2135                 case arch_i386:
2136                         align = 2;
2137                         break;
2138                 case arch_i486:
2139                         align = 4;
2140                         break;
2141                 case arch_k6:
2142                         align = 5;
2143                         break;
2144                 default:
2145                         align = 4;
2146         }
2147         maximum_skip = (1 << align) - 1;
2148         ia32_emit_alignment(env, align, maximum_skip);
2149 }
2150
2151 /**
2152  * Test wether a block should be aligned.
2153  * For cpus in the P4/Athlon class it is usefull to align jump labels to
2154  * 16 bytes. However we should only do that if the alignment nops before the
2155  * label aren't executed more often than we have jumps to the label.
2156  */
2157 static
2158 int should_align_block(ia32_emit_env_t *env, ir_node *block, ir_node *prev) {
2159         static const double DELTA = .0001;
2160         ir_exec_freq *exec_freq = env->cg->birg->exec_freq;
2161         double        block_freq;
2162         double        prev_freq = 0;  /**< execfreq of the fallthrough block */
2163         double        jmp_freq  = 0;  /**< execfreq of all non-fallthrough blocks */
2164         cpu_support   cpu       = env->isa->opt_arch;
2165         int           i, n_cfgpreds;
2166
2167         if(exec_freq == NULL)
2168                 return 0;
2169         if(cpu == arch_i386 || cpu == arch_i486)
2170                 return 0;
2171
2172         block_freq = get_block_execfreq(exec_freq, block);
2173         if(block_freq < DELTA)
2174                 return 0;
2175
2176         n_cfgpreds = get_Block_n_cfgpreds(block);
2177         for(i = 0; i < n_cfgpreds; ++i) {
2178                 ir_node *pred      = get_Block_cfgpred_block(block, i);
2179                 double   pred_freq = get_block_execfreq(exec_freq, pred);
2180
2181                 if(pred == prev) {
2182                         prev_freq += pred_freq;
2183                 } else {
2184                         jmp_freq  += pred_freq;
2185                 }
2186         }
2187
2188         if(prev_freq < DELTA && !(jmp_freq < DELTA))
2189                 return 1;
2190
2191         jmp_freq /= prev_freq;
2192
2193         switch (cpu) {
2194                 case arch_athlon:
2195                 case arch_athlon_64:
2196                 case arch_k6:
2197                         return jmp_freq > 3;
2198                 default:
2199                         return jmp_freq > 2;
2200         }
2201 }
2202
2203 static
2204 void ia32_emit_block_header(ia32_emit_env_t *env, ir_node *block, ir_node *prev)
2205 {
2206         int           n_cfgpreds;
2207         int           need_label;
2208         int           i, arity;
2209         ir_exec_freq  *exec_freq = env->cg->birg->exec_freq;
2210
2211         need_label = 1;
2212         n_cfgpreds = get_Block_n_cfgpreds(block);
2213         if (n_cfgpreds == 0) {
2214                 need_label = 0;
2215         } else if (n_cfgpreds == 1) {
2216                 ir_node *pred       = get_Block_cfgpred(block, 0);
2217                 ir_node *pred_block = get_nodes_block(pred);
2218
2219                 /* we don't need labels for fallthrough blocks, however switch-jmps
2220                  * are no fallthroughs */
2221                 if(pred_block == prev &&
2222                                 !(is_Proj(pred) && is_ia32_SwitchJmp(get_Proj_pred(pred)))) {
2223                         need_label = 0;
2224                 } else {
2225                         need_label = 1;
2226                 }
2227         } else {
2228                 need_label = 1;
2229         }
2230
2231         if (should_align_block(env, block, prev)) {
2232                 assert(need_label);
2233                 ia32_emit_align_label(env, env->isa->opt_arch);
2234         }
2235
2236         if(need_label) {
2237                 ia32_emit_block_name(env, block);
2238                 be_emit_char(env, ':');
2239
2240                 be_emit_pad_comment(env);
2241                 be_emit_cstring(env, "   /* preds:");
2242
2243                 /* emit list of pred blocks in comment */
2244                 arity = get_irn_arity(block);
2245                 for (i = 0; i < arity; ++i) {
2246                         ir_node *predblock = get_Block_cfgpred_block(block, i);
2247                         be_emit_irprintf(env->emit, " %d", get_irn_node_nr(predblock));
2248                 }
2249         } else {
2250                 be_emit_cstring(env, "\t/* ");
2251                 ia32_emit_block_name(env, block);
2252                 be_emit_cstring(env, ": ");
2253         }
2254         if (exec_freq != NULL) {
2255                 be_emit_irprintf(env->emit, " freq: %f",
2256                                  get_block_execfreq(exec_freq, block));
2257         }
2258         be_emit_cstring(env, " */\n");
2259         be_emit_write_line(env);
2260 }
2261
2262 /**
2263  * Walks over the nodes in a block connected by scheduling edges
2264  * and emits code for each node.
2265  */
2266 static
2267 void ia32_gen_block(ia32_emit_env_t *env, ir_node *block, ir_node *last_block)
2268 {
2269         const ir_node *node;
2270
2271         ia32_emit_block_header(env, block, last_block);
2272
2273         /* emit the contents of the block */
2274         ia32_emit_dbg(env, block);
2275         sched_foreach(block, node) {
2276                 ia32_emit_node(env, node);
2277         }
2278 }
2279
2280 /**
2281  * Emits code for function start.
2282  */
2283 static
2284 void ia32_emit_func_prolog(ia32_emit_env_t *env, ir_graph *irg) {
2285         ir_entity  *irg_ent  = get_irg_entity(irg);
2286         const char *irg_name = get_entity_ld_name(irg_ent);
2287         cpu_support cpu      = env->isa->opt_arch;
2288         const be_irg_t *birg = env->cg->birg;
2289
2290         be_emit_write_line(env);
2291         be_gas_emit_switch_section(env->emit, GAS_SECTION_TEXT);
2292         be_dbg_method_begin(birg->main_env->db_handle, irg_ent, be_abi_get_stack_layout(birg->abi));
2293         ia32_emit_align_func(env, cpu);
2294         if (get_entity_visibility(irg_ent) == visibility_external_visible) {
2295                 be_emit_cstring(env, ".global ");
2296                 be_emit_string(env, irg_name);
2297                 be_emit_char(env, '\n');
2298                 be_emit_write_line(env);
2299         }
2300         ia32_emit_function_object(env, irg_name);
2301         be_emit_string(env, irg_name);
2302         be_emit_cstring(env, ":\n");
2303         be_emit_write_line(env);
2304 }
2305
2306 /**
2307  * Emits code for function end
2308  */
2309 static
2310 void ia32_emit_func_epilog(ia32_emit_env_t *env, ir_graph *irg) {
2311         const char *irg_name = get_entity_ld_name(get_irg_entity(irg));
2312         const be_irg_t *birg = env->cg->birg;
2313
2314         ia32_emit_function_size(env, irg_name);
2315         be_dbg_method_end(birg->main_env->db_handle);
2316         be_emit_char(env, '\n');
2317         be_emit_write_line(env);
2318 }
2319
2320 /**
2321  * Block-walker:
2322  * Sets labels for control flow nodes (jump target)
2323  */
2324 static
2325 void ia32_gen_labels(ir_node *block, void *data)
2326 {
2327         ir_node *pred;
2328         int n = get_Block_n_cfgpreds(block);
2329         (void) data;
2330
2331         for (n--; n >= 0; n--) {
2332                 pred = get_Block_cfgpred(block, n);
2333                 set_irn_link(pred, block);
2334         }
2335 }
2336
2337 /**
2338  * Emit an exception label if the current instruction can fail.
2339  */
2340 void ia32_emit_exc_label(ia32_emit_env_t *env, const ir_node *node) {
2341         if (get_ia32_exc_label(node)) {
2342                 be_emit_irprintf(env->emit, ".EXL%u\n", 0);
2343                 be_emit_write_line(env);
2344         }
2345 }
2346
2347 /**
2348  * Main driver. Emits the code for one routine.
2349  */
2350 void ia32_gen_routine(ia32_code_gen_t *cg, ir_graph *irg) {
2351         ia32_emit_env_t env;
2352         ir_node *block;
2353         ir_node *last_block = NULL;
2354         int i, n;
2355
2356         env.isa      = (ia32_isa_t *)cg->arch_env->isa;
2357         env.emit     = &env.isa->emit;
2358         env.arch_env = cg->arch_env;
2359         env.cg       = cg;
2360
2361         ia32_register_emitters();
2362
2363         ia32_emit_func_prolog(&env, irg);
2364         irg_block_walk_graph(irg, ia32_gen_labels, NULL, &env);
2365
2366         n = ARR_LEN(cg->blk_sched);
2367         for (i = 0; i < n;) {
2368                 ir_node *next_bl;
2369
2370                 block   = cg->blk_sched[i];
2371                 ++i;
2372                 next_bl = i < n ? cg->blk_sched[i] : NULL;
2373
2374                 /* set here the link. the emitter expects to find the next block here */
2375                 set_irn_link(block, next_bl);
2376                 ia32_gen_block(&env, block, last_block);
2377                 last_block = block;
2378         }
2379
2380         ia32_emit_func_epilog(&env, irg);
2381 }
2382
2383 void ia32_init_emitter(void)
2384 {
2385         FIRM_DBG_REGISTER(dbg, "firm.be.ia32.emitter");
2386 }