- never use (broken) sequential load/store in abi
[libfirm] / ir / be / ia32 / ia32_emitter.c
1 /*
2  * Copyright (C) 1995-2007 University of Karlsruhe.  All right reserved.
3  *
4  * This file is part of libFirm.
5  *
6  * This file may be distributed and/or modified under the terms of the
7  * GNU General Public License version 2 as published by the Free Software
8  * Foundation and appearing in the file LICENSE.GPL included in the
9  * packaging of this file.
10  *
11  * Licensees holding valid libFirm Professional Edition licenses may use
12  * this file in accordance with the libFirm Commercial License.
13  * Agreement provided with the Software.
14  *
15  * This file is provided AS IS with NO WARRANTY OF ANY KIND, INCLUDING THE
16  * WARRANTY OF DESIGN, MERCHANTABILITY AND FITNESS FOR A PARTICULAR
17  * PURPOSE.
18  */
19
20 /**
21  * @file
22  * @brief       This file implements the ia32 node emitter.
23  * @author      Christian Wuerdig, Matthias Braun
24  * @version     $Id$
25  */
26 #ifdef HAVE_CONFIG_H
27 #include "config.h"
28 #endif
29
30 #include <limits.h>
31
32 #include "xmalloc.h"
33 #include "tv.h"
34 #include "iredges.h"
35 #include "debug.h"
36 #include "irgwalk.h"
37 #include "irprintf.h"
38 #include "irop_t.h"
39 #include "irargs_t.h"
40 #include "irprog_t.h"
41 #include "iredges_t.h"
42 #include "execfreq.h"
43 #include "error.h"
44 #include "raw_bitset.h"
45
46 #include "../besched_t.h"
47 #include "../benode_t.h"
48 #include "../beabi.h"
49 #include "../be_dbgout.h"
50 #include "../beemitter.h"
51 #include "../begnuas.h"
52 #include "../beirg_t.h"
53
54 #include "ia32_emitter.h"
55 #include "gen_ia32_emitter.h"
56 #include "gen_ia32_regalloc_if.h"
57 #include "ia32_nodes_attr.h"
58 #include "ia32_new_nodes.h"
59 #include "ia32_map_regs.h"
60 #include "bearch_ia32_t.h"
61
62 DEBUG_ONLY(static firm_dbg_module_t *dbg = NULL;)
63
64 #define BLOCK_PREFIX ".L"
65
66 #define SNPRINTF_BUF_LEN 128
67
68 /**
69  * Returns the register at in position pos.
70  */
71 static
72 const arch_register_t *get_in_reg(ia32_emit_env_t *env, const ir_node *irn,
73                                   int pos)
74 {
75         const arch_env_t       *arch_env = env->arch_env;
76         ir_node                *op;
77         const arch_register_t  *reg = NULL;
78
79         assert(get_irn_arity(irn) > pos && "Invalid IN position");
80
81         /* The out register of the operator at position pos is the
82            in register we need. */
83         op = get_irn_n(irn, pos);
84
85         reg = arch_get_irn_register(arch_env, op);
86
87         assert(reg && "no in register found");
88
89         if(reg == &ia32_gp_regs[REG_GP_NOREG])
90                 panic("trying to emit noreg for %+F input %d", irn, pos);
91
92         /* in case of unknown register: just return a valid register */
93         if (reg == &ia32_gp_regs[REG_GP_UKNWN]) {
94                 const arch_register_req_t *req;
95
96                 /* ask for the requirements */
97                 req = arch_get_register_req(arch_env, irn, pos);
98
99                 if (arch_register_req_is(req, limited)) {
100                         /* in case of limited requirements: get the first allowed register */
101                         unsigned idx = rbitset_next(req->limited, 0, 1);
102                         reg = arch_register_for_index(req->cls, idx);
103                 } else {
104                         /* otherwise get first register in class */
105                         reg = arch_register_for_index(req->cls, 0);
106                 }
107         }
108
109         return reg;
110 }
111
112 /**
113  * Returns the register at out position pos.
114  */
115 static
116 const arch_register_t *get_out_reg(ia32_emit_env_t *env, const ir_node *irn,
117                                    int pos)
118 {
119         const arch_env_t      *arch_env = env->arch_env;
120         ir_node               *proj;
121         const arch_register_t *reg = NULL;
122
123         /* 1st case: irn is not of mode_T, so it has only                 */
124         /*           one OUT register -> good                             */
125         /* 2nd case: irn is of mode_T -> collect all Projs and ask the    */
126         /*           Proj with the corresponding projnum for the register */
127
128         if (get_irn_mode(irn) != mode_T) {
129                 reg = arch_get_irn_register(arch_env, irn);
130         } else if (is_ia32_irn(irn)) {
131                 reg = get_ia32_out_reg(irn, pos);
132         } else {
133                 const ir_edge_t *edge;
134
135                 foreach_out_edge(irn, edge) {
136                         proj = get_edge_src_irn(edge);
137                         assert(is_Proj(proj) && "non-Proj from mode_T node");
138                         if (get_Proj_proj(proj) == pos) {
139                                 reg = arch_get_irn_register(arch_env, proj);
140                                 break;
141                         }
142                 }
143         }
144
145         assert(reg && "no out register found");
146         return reg;
147 }
148
149 /**
150  * Determine the gnu assembler suffix that indicates a mode
151  */
152 static
153 char get_mode_suffix(const ir_mode *mode) {
154         if(mode_is_float(mode)) {
155                 switch(get_mode_size_bits(mode)) {
156                 case 32:
157                         return 's';
158                 case 64:
159                         return 'l';
160                 case 80:
161                 case 96:
162                         return 't';
163                 }
164         } else {
165                 assert(mode_is_int(mode) || mode_is_reference(mode));
166                 switch(get_mode_size_bits(mode)) {
167                 case 64:
168                         return 'q';
169                 case 32:
170                         return 'l';
171                 case 16:
172                         return 'w';
173                 case 8:
174                         return 'b';
175                 }
176         }
177         panic("Can't output mode_suffix for %+F\n", mode);
178 }
179
180 static
181 const char *ia32_get_reg_name_for_mode(ia32_emit_env_t *env, ir_mode *mode,
182                                        const arch_register_t *reg) {
183         switch(get_mode_size_bits(mode)) {
184                 case 8:
185                         return ia32_get_mapped_reg_name(env->isa->regs_8bit, reg);
186                 case 16:
187                         return ia32_get_mapped_reg_name(env->isa->regs_16bit, reg);
188                 default:
189                         return (char *)arch_register_get_name(reg);
190         }
191 }
192
193 /**
194  * Add a number to a prefix. This number will not be used a second time.
195  */
196 static
197 char *get_unique_label(char *buf, size_t buflen, const char *prefix) {
198         static unsigned long id = 0;
199         snprintf(buf, buflen, "%s%lu", prefix, ++id);
200         return buf;
201 }
202
203 /*************************************************************
204  *             _       _    __   _          _
205  *            (_)     | |  / _| | |        | |
206  *  _ __  _ __ _ _ __ | |_| |_  | |__   ___| |_ __   ___ _ __
207  * | '_ \| '__| | '_ \| __|  _| | '_ \ / _ \ | '_ \ / _ \ '__|
208  * | |_) | |  | | | | | |_| |   | | | |  __/ | |_) |  __/ |
209  * | .__/|_|  |_|_| |_|\__|_|   |_| |_|\___|_| .__/ \___|_|
210  * | |                                       | |
211  * |_|                                       |_|
212  *************************************************************/
213
214 // we have no C++ and can't define an implicit ia32_emit_env_t* cast to
215 // be_emit_env_t* so we cheat a bit...
216 #define be_emit_char(env,c)             be_emit_char(env->emit,c)
217 #define be_emit_string(env,s)           be_emit_string(env->emit,s)
218 #undef be_emit_cstring
219 #define be_emit_cstring(env,x)          { be_emit_string_len(env->emit, x, sizeof(x)-1); }
220 #define be_emit_ident(env,i)            be_emit_ident(env->emit,i)
221 #define be_emit_tarval(env,tv)          be_emit_tarval(env->emit,tv)
222 #define be_emit_write_line(env)         be_emit_write_line(env->emit)
223 #define be_emit_finish_line_gas(env,n)  be_emit_finish_line_gas(env->emit,n)
224 #define be_emit_pad_comment(env)        be_emit_pad_comment(env->emit)
225
226 void ia32_emit_source_register(ia32_emit_env_t *env, const ir_node *node, int pos)
227 {
228         const arch_register_t *reg = get_in_reg(env, node, pos);
229         const char *reg_name = arch_register_get_name(reg);
230
231         assert(pos < get_irn_arity(node));
232
233         be_emit_char(env, '%');
234         be_emit_string(env, reg_name);
235 }
236
237 void ia32_emit_dest_register(ia32_emit_env_t *env, const ir_node *node, int pos) {
238         const arch_register_t *reg = get_out_reg(env, node, pos);
239         const char *reg_name = arch_register_get_name(reg);
240
241         be_emit_char(env, '%');
242         be_emit_string(env, reg_name);
243 }
244
245 static void ia32_emit_register(ia32_emit_env_t *env, const arch_register_t *reg)
246 {
247         const char *reg_name = arch_register_get_name(reg);
248
249         be_emit_char(env, '%');
250         be_emit_string(env, reg_name);
251 }
252
253 void ia32_emit_x87_name(ia32_emit_env_t *env, const ir_node *node, int pos)
254 {
255         const ia32_x87_attr_t *attr = get_ia32_x87_attr_const(node);
256
257         assert(pos < 3);
258         be_emit_char(env, '%');
259         be_emit_string(env, attr->x87[pos]->name);
260 }
261
262 static
263 void ia32_emit_mode_suffix_mode(ia32_emit_env_t *env, const ir_mode *mode)
264 {
265         be_emit_char(env, get_mode_suffix(mode));
266 }
267
268 void ia32_emit_mode_suffix(ia32_emit_env_t *env, const ir_node *node)
269 {
270         ir_mode *mode = get_ia32_ls_mode(node);
271         if(mode == NULL)
272                 mode = mode_Iu;
273
274         ia32_emit_mode_suffix_mode(env, mode);
275 }
276
277 void ia32_emit_x87_mode_suffix(ia32_emit_env_t *env, const ir_node *node)
278 {
279         ir_mode *mode = get_ia32_ls_mode(node);
280         if(mode != NULL)
281                 ia32_emit_mode_suffix_mode(env, mode);
282 }
283
284 static
285 char get_xmm_mode_suffix(ir_mode *mode)
286 {
287         assert(mode_is_float(mode));
288         switch(get_mode_size_bits(mode)) {
289         case 32:
290                 return 's';
291         case 64:
292                 return 'd';
293         default:
294                 assert(0);
295         }
296         return '%';
297 }
298
299 void ia32_emit_xmm_mode_suffix(ia32_emit_env_t *env, const ir_node *node)
300 {
301         ir_mode *mode = get_ia32_ls_mode(node);
302         assert(mode != NULL);
303         be_emit_char(env, 's');
304         be_emit_char(env, get_xmm_mode_suffix(mode));
305 }
306
307 void ia32_emit_xmm_mode_suffix_s(ia32_emit_env_t *env, const ir_node *node)
308 {
309         ir_mode *mode = get_ia32_ls_mode(node);
310         assert(mode != NULL);
311         be_emit_char(env, get_xmm_mode_suffix(mode));
312 }
313
314 void ia32_emit_extend_suffix(ia32_emit_env_t *env, const ir_mode *mode)
315 {
316         if(get_mode_size_bits(mode) == 32)
317                 return;
318         if(mode_is_signed(mode)) {
319                 be_emit_char(env, 's');
320         } else {
321                 be_emit_char(env, 'z');
322         }
323 }
324
325 static
326 void ia32_emit_function_object(ia32_emit_env_t *env, const char *name)
327 {
328         switch (be_gas_flavour) {
329         case GAS_FLAVOUR_NORMAL:
330                 be_emit_cstring(env, "\t.type\t");
331                 be_emit_string(env, name);
332                 be_emit_cstring(env, ", @function\n");
333                 be_emit_write_line(env);
334                 break;
335         case GAS_FLAVOUR_MINGW:
336                 be_emit_cstring(env, "\t.def\t");
337                 be_emit_string(env, name);
338                 be_emit_cstring(env, ";\t.scl\t2;\t.type\t32;\t.endef\n");
339                 be_emit_write_line(env);
340                 break;
341         default:
342                 break;
343         }
344 }
345
346 static
347 void ia32_emit_function_size(ia32_emit_env_t *env, const char *name)
348 {
349         switch (be_gas_flavour) {
350         case GAS_FLAVOUR_NORMAL:
351                 be_emit_cstring(env, "\t.size\t");
352                 be_emit_string(env, name);
353                 be_emit_cstring(env, ", .-");
354                 be_emit_string(env, name);
355                 be_emit_char(env, '\n');
356                 be_emit_write_line(env);
357                 break;
358         default:
359                 break;
360         }
361 }
362
363
364 static
365 void emit_ia32_Immediate(ia32_emit_env_t *env, const ir_node *node);
366
367 void ia32_emit_8bit_source_register(ia32_emit_env_t *env, const ir_node *node,
368                                     int pos)
369 {
370         const arch_register_t *reg;
371         const char            *reg_name;
372         ir_node               *in;
373
374         in = get_irn_n(node, pos);
375         if(is_ia32_Immediate(in)) {
376                 emit_ia32_Immediate(env, in);
377                 return;
378         }
379
380         reg      = get_in_reg(env, node, pos);
381         reg_name = arch_register_get_name(reg);
382
383         be_emit_char(env, '%');
384         be_emit_char(env, reg_name[1]);
385         be_emit_char(env, 'l');
386 }
387
388 void ia32_emit_16bit_source_register(ia32_emit_env_t *env, const ir_node *node,
389                                      int pos)
390 {
391         const arch_register_t *reg;
392         const char            *reg_name;
393         ir_node               *in;
394
395         in = get_irn_n(node, pos);
396         if(is_ia32_Immediate(in)) {
397                 emit_ia32_Immediate(env, in);
398                 return;
399         }
400
401         reg      = get_in_reg(env, node, pos);
402         reg_name = arch_register_get_name(reg);
403
404         be_emit_char(env, '%');
405         be_emit_string(env, &reg_name[1]);
406         be_emit_char(env, 'x');
407 }
408
409 void ia32_emit_8bit_dest_register(ia32_emit_env_t *env, const ir_node *node,
410                                   int pos)
411 {
412         const arch_register_t *reg      = get_out_reg(env, node, pos);
413         const char            *reg_name = arch_register_get_name(reg);
414
415         be_emit_char(env, '%');
416         be_emit_char(env, reg_name[1]);
417         be_emit_char(env, 'l');
418 }
419
420 void ia32_emit_source_register_or_immediate(ia32_emit_env_t *env,
421                                             const ir_node *node, int pos)
422 {
423         ir_node *in = get_irn_n(node, pos);
424         if(is_ia32_Immediate(in)) {
425                 emit_ia32_Immediate(env, in);
426         } else {
427                 ia32_emit_source_register(env, node, pos);
428         }
429 }
430
431 /**
432  * Emits registers and/or address mode of a binary operation.
433  */
434 void ia32_emit_binop(ia32_emit_env_t *env, const ir_node *node, int produces_result) {
435         const ir_node *right_op = get_irn_n(node, n_ia32_binary_right);
436
437         switch(get_ia32_op_type(node)) {
438         case ia32_Normal:
439                 if(is_ia32_Immediate(right_op)) {
440                         emit_ia32_Immediate(env, right_op);
441                         be_emit_cstring(env, ", ");
442                         ia32_emit_source_register(env, node, n_ia32_binary_left);
443                         break;
444                 } else {
445                         const arch_register_t *in1 = get_in_reg(env, node, n_ia32_binary_left);
446                         const arch_register_t *in2 = get_in_reg(env, node, n_ia32_binary_right);
447                         const arch_register_t *out = produces_result ? get_out_reg(env, node, 0) : NULL;
448                         const arch_register_t *in;
449                         const char            *in_name;
450
451                         in      = out ? ((out == in2) ? in1 : in2) : in2;
452                         out     = out ? out : in1;
453                         in_name = arch_register_get_name(in);
454
455                         be_emit_char(env, '%');
456                         be_emit_string(env, in_name);
457                         be_emit_cstring(env, ", %");
458                         be_emit_string(env, arch_register_get_name(out));
459                 }
460                 break;
461         case ia32_AddrModeS:
462                 if(is_ia32_Immediate(right_op)) {
463                         assert(!produces_result && "Source AM with Const must not produce result");
464
465                         emit_ia32_Immediate(env, right_op);
466                         be_emit_cstring(env, ", ");
467                         ia32_emit_am(env, node);
468                 } else if (produces_result) {
469                         ia32_emit_am(env, node);
470                         be_emit_cstring(env, ", ");
471                         ia32_emit_dest_register(env, node, 0);
472                 } else {
473                         ia32_emit_am(env, node);
474                         be_emit_cstring(env, ", ");
475                         ia32_emit_source_register(env, node, n_ia32_binary_left);
476                 }
477                 break;
478         case ia32_AddrModeD:
479                 panic("DestMode can't be output by %%binop anymore");
480                 break;
481         default:
482                 assert(0 && "unsupported op type");
483         }
484 }
485
486 /**
487  * Emits registers and/or address mode of a binary operation.
488  */
489 void ia32_emit_x87_binop(ia32_emit_env_t *env, const ir_node *node) {
490         switch(get_ia32_op_type(node)) {
491                 case ia32_Normal:
492                         {
493                                 const ia32_x87_attr_t *x87_attr = get_ia32_x87_attr_const(node);
494                                 const arch_register_t *in1      = x87_attr->x87[0];
495                                 const arch_register_t *in2      = x87_attr->x87[1];
496                                 const arch_register_t *out      = x87_attr->x87[2];
497                                 const arch_register_t *in;
498
499                                 in  = out ? ((out == in2) ? in1 : in2) : in2;
500                                 out = out ? out : in1;
501
502                                 be_emit_char(env, '%');
503                                 be_emit_string(env, arch_register_get_name(in));
504                                 be_emit_cstring(env, ", %");
505                                 be_emit_string(env, arch_register_get_name(out));
506                         }
507                         break;
508                 case ia32_AddrModeS:
509                         ia32_emit_am(env, node);
510                         break;
511                 case ia32_AddrModeD:
512                 default:
513                         assert(0 && "unsupported op type");
514         }
515 }
516
517 void ia32_emit_am_or_dest_register(ia32_emit_env_t *env, const ir_node *node,
518                                    int pos) {
519         if(get_ia32_op_type(node) == ia32_Normal) {
520                 ia32_emit_dest_register(env, node, pos);
521         } else {
522                 assert(get_ia32_op_type(node) == ia32_AddrModeD);
523                 ia32_emit_am(env, node);
524         }
525 }
526
527 /**
528  * Emits registers and/or address mode of a unary operation.
529  */
530 void ia32_emit_unop(ia32_emit_env_t *env, const ir_node *node, int pos) {
531         const ir_node *op;
532
533         switch(get_ia32_op_type(node)) {
534         case ia32_Normal:
535                 op = get_irn_n(node, pos);
536                 if (is_ia32_Immediate(op)) {
537                         emit_ia32_Immediate(env, op);
538                 } else {
539                         ia32_emit_source_register(env, node, pos);
540                 }
541                 break;
542         case ia32_AddrModeS:
543         case ia32_AddrModeD:
544                 ia32_emit_am(env, node);
545                 break;
546         default:
547                 assert(0 && "unsupported op type");
548         }
549 }
550
551 /**
552  * Emits address mode.
553  */
554 void ia32_emit_am(ia32_emit_env_t *env, const ir_node *node) {
555         ir_entity *ent       = get_ia32_am_sc(node);
556         int        offs      = get_ia32_am_offs_int(node);
557         ir_node   *base      = get_irn_n(node, 0);
558         int        has_base  = !is_ia32_NoReg_GP(base);
559         ir_node   *index     = get_irn_n(node, 1);
560         int        has_index = !is_ia32_NoReg_GP(index);
561
562         /* just to be sure... */
563         assert(!is_ia32_use_frame(node) || get_ia32_frame_ent(node) != NULL);
564
565         /* emit offset */
566         if (ent != NULL) {
567                 ident *id;
568
569                 set_entity_backend_marked(ent, 1);
570                 id = get_entity_ld_ident(ent);
571                 if (is_ia32_am_sc_sign(node))
572                         be_emit_char(env, '-');
573                 be_emit_ident(env, id);
574
575                 if(get_entity_owner(ent) == get_tls_type()) {
576                         if (get_entity_visibility(ent) == visibility_external_allocated) {
577                                 be_emit_cstring(env, "@INDNTPOFF");
578                         } else {
579                                 be_emit_cstring(env, "@NTPOFF");
580                         }
581                 }
582         }
583
584         if(offs != 0) {
585                 if(ent != NULL) {
586                         be_emit_irprintf(env->emit, "%+d", offs);
587                 } else {
588                         be_emit_irprintf(env->emit, "%d", offs);
589                 }
590         }
591
592         if (has_base || has_index) {
593                 be_emit_char(env, '(');
594
595                 /* emit base */
596                 if (has_base) {
597                         ia32_emit_source_register(env, node, n_ia32_base);
598                 }
599
600                 /* emit index + scale */
601                 if (has_index) {
602                         int scale;
603                         be_emit_char(env, ',');
604                         ia32_emit_source_register(env, node, n_ia32_index);
605
606                         scale = get_ia32_am_scale(node);
607                         if (scale > 0) {
608                                 be_emit_irprintf(env->emit, ",%d", 1 << get_ia32_am_scale(node));
609                         }
610                 }
611                 be_emit_char(env, ')');
612         }
613
614         /* special case if nothing is set */
615         if(ent == NULL && offs == 0 && !has_base && !has_index) {
616                 be_emit_char(env, '0');
617         }
618 }
619
620 /*************************************************
621  *                 _ _                         _
622  *                (_) |                       | |
623  *   ___ _ __ ___  _| |_    ___ ___  _ __   __| |
624  *  / _ \ '_ ` _ \| | __|  / __/ _ \| '_ \ / _` |
625  * |  __/ | | | | | | |_  | (_| (_) | | | | (_| |
626  *  \___|_| |_| |_|_|\__|  \___\___/|_| |_|\__,_|
627  *
628  *************************************************/
629
630 #undef IA32_DO_EMIT
631 #define IA32_DO_EMIT(irn) ia32_fprintf_format(F, irn, cmd_buf, cmnt_buf)
632
633 /*
634  * coding of conditions
635  */
636 struct cmp2conditon_t {
637         const char *name;
638         int         num;
639 };
640
641 /*
642  * positive conditions for signed compares
643  */
644 static const struct cmp2conditon_t cmp2condition_s[] = {
645         { NULL,              pn_Cmp_False },  /* always false */
646         { "e",               pn_Cmp_Eq },     /* == */
647         { "l",               pn_Cmp_Lt },     /* < */
648         { "le",              pn_Cmp_Le },     /* <= */
649         { "g",               pn_Cmp_Gt },     /* > */
650         { "ge",              pn_Cmp_Ge },     /* >= */
651         { "ne",              pn_Cmp_Lg },     /* != */
652         { NULL,              pn_Cmp_Leg},     /* always true */
653 };
654
655 /*
656  * positive conditions for unsigned compares
657  */
658 static const struct cmp2conditon_t cmp2condition_u[] = {
659         { NULL,              pn_Cmp_False },  /* always false */
660         { "e",               pn_Cmp_Eq },     /* == */
661         { "b",               pn_Cmp_Lt },     /* < */
662         { "be",              pn_Cmp_Le },     /* <= */
663         { "a",               pn_Cmp_Gt },     /* > */
664         { "ae",              pn_Cmp_Ge },     /* >= */
665         { "ne",              pn_Cmp_Lg },     /* != */
666         { NULL,              pn_Cmp_Leg },   /* always true  */
667 };
668
669 enum {
670         ia32_pn_Cmp_unsigned = 0x1000,
671         ia32_pn_Cmp_float    = 0x2000,
672 };
673
674 /**
675  * walks up a tree of copies/perms/spills/reloads to find the original value
676  * that is moved around
677  */
678 static ir_node *find_original_value(ir_node *node)
679 {
680         inc_irg_visited(current_ir_graph);
681         while(1) {
682                 mark_irn_visited(node);
683                 if(be_is_Copy(node)) {
684                         node = be_get_Copy_op(node);
685                 } else if(be_is_CopyKeep(node)) {
686                         node = be_get_CopyKeep_op(node);
687                 } else if(is_Proj(node)) {
688                         ir_node *pred = get_Proj_pred(node);
689                         if(be_is_Perm(pred)) {
690                                 node = get_irn_n(pred, get_Proj_proj(node));
691                         } else if(be_is_MemPerm(pred)) {
692                                 node = get_irn_n(pred, get_Proj_proj(node) + 1);
693                         } else if(is_ia32_Load(pred)) {
694                                 node = get_irn_n(pred, n_ia32_Load_mem);
695                         } else {
696                                 return node;
697                         }
698                 } else if(is_Store(node)) {
699                         node = get_irn_n(node, n_ia32_Store_val);
700                 } else if(is_Phi(node)) {
701                         int i, arity;
702                         arity = get_irn_arity(node);
703                         for(i = 0; i < arity; ++i) {
704                                 ir_node *in = get_irn_n(node, i);
705                                 if(irn_visited(in))
706                                         continue;
707                                 node = in;
708                                 break;
709                         }
710                         assert(i < arity);
711                 } else {
712                         return node;
713                 }
714         }
715 }
716
717 static int determine_final_pnc(const ir_node *node, int flags_pos,
718                                int pnc)
719 {
720         ir_node           *flags = get_irn_n(node, flags_pos);
721         const ia32_attr_t *flags_attr;
722         flags = skip_Proj(flags);
723
724         if(is_ia32_Sahf(flags)) {
725                 ir_node *cmp = get_irn_n(flags, n_ia32_Sahf_val);
726                 if(!is_ia32_FucomFnstsw(cmp) || is_ia32_FucompFnstsw(cmp)
727                                 || is_ia32_FucomppFnstsw(cmp)) {
728                         cmp = find_original_value(cmp);
729                         assert(is_ia32_FucomFnstsw(cmp) || is_ia32_FucompFnstsw(cmp)
730                                || is_ia32_FucomppFnstsw(cmp));
731                 }
732
733                 flags_attr = get_ia32_attr_const(cmp);
734                 if(flags_attr->data.cmp_flipped)
735                         pnc = get_mirrored_pnc(pnc);
736                 pnc |= ia32_pn_Cmp_float;
737         } else if(is_ia32_Ucomi(flags)) {
738                 flags_attr = get_ia32_attr_const(flags);
739
740                 if(flags_attr->data.cmp_flipped)
741                         pnc = get_mirrored_pnc(pnc);
742                 pnc |= ia32_pn_Cmp_float;
743         } else {
744                 assert(is_ia32_Cmp(flags) || is_ia32_Test(flags)
745                                 || is_ia32_Cmp8Bit(flags) || is_ia32_Test8Bit(flags));
746                 flags_attr = get_ia32_attr_const(flags);
747
748                 if(flags_attr->data.cmp_flipped)
749                         pnc = get_mirrored_pnc(pnc);
750                 if(flags_attr->data.cmp_unsigned)
751                         pnc |= ia32_pn_Cmp_unsigned;
752         }
753
754         return pnc;
755 }
756
757 static void ia32_emit_cmp_suffix(ia32_emit_env_t *env, int pnc)
758 {
759         const char        *str;
760
761         if((pnc & ia32_pn_Cmp_float) || (pnc & ia32_pn_Cmp_unsigned)) {
762                 pnc = pnc & 7;
763                 assert(cmp2condition_u[pnc].num == pnc);
764                 str = cmp2condition_u[pnc].name;
765         } else {
766                 pnc = pnc & 7;
767                 assert(cmp2condition_s[pnc].num == pnc);
768                 str = cmp2condition_s[pnc].name;
769         }
770
771         be_emit_string(env, str);
772 }
773
774 void ia32_emit_cmp_suffix_node(ia32_emit_env_t *env, const ir_node *node,
775                                int flags_pos)
776 {
777         pn_Cmp pnc = get_ia32_pncode(node);
778
779         pnc = determine_final_pnc(node, flags_pos, pnc);
780         ia32_emit_cmp_suffix(env, pnc);
781 }
782
783 /**
784  * Returns the target block for a control flow node.
785  */
786 static
787 ir_node *get_cfop_target_block(const ir_node *irn) {
788         return get_irn_link(irn);
789 }
790
791 /**
792  * Emits a block label for the given block.
793  */
794 static
795 void ia32_emit_block_name(ia32_emit_env_t *env, const ir_node *block)
796 {
797         if (has_Block_label(block)) {
798                 be_emit_string(env, be_gas_label_prefix());
799                 be_emit_irprintf(env->emit, "%u", (unsigned)get_Block_label(block));
800         } else {
801                 be_emit_cstring(env, BLOCK_PREFIX);
802                 be_emit_irprintf(env->emit, "%d", get_irn_node_nr(block));
803         }
804 }
805
806 /**
807  * Emits the target label for a control flow node.
808  */
809 static
810 void ia32_emit_cfop_target(ia32_emit_env_t * env, const ir_node *node) {
811         ir_node *block = get_cfop_target_block(node);
812
813         ia32_emit_block_name(env, block);
814 }
815
816 /** Return the next block in Block schedule */
817 static ir_node *next_blk_sched(const ir_node *block) {
818         return get_irn_link(block);
819 }
820
821 /**
822  * Returns the Proj with projection number proj and NOT mode_M
823  */
824 static ir_node *get_proj(const ir_node *node, long proj) {
825         const ir_edge_t *edge;
826         ir_node         *src;
827
828         assert(get_irn_mode(node) == mode_T && "expected mode_T node");
829
830         foreach_out_edge(node, edge) {
831                 src = get_edge_src_irn(edge);
832
833                 assert(is_Proj(src) && "Proj expected");
834                 if (get_irn_mode(src) == mode_M)
835                         continue;
836
837                 if (get_Proj_proj(src) == proj)
838                         return src;
839         }
840         return NULL;
841 }
842
843 /**
844  * Emits the jump sequence for a conditional jump (cmp + jmp_true + jmp_false)
845  */
846 static void emit_ia32_Jcc(ia32_emit_env_t *env, const ir_node *node)
847 {
848         const ir_node *proj_true;
849         const ir_node *proj_false;
850         const ir_node *block;
851         const ir_node *next_block;
852         pn_Cmp         pnc = get_ia32_pncode(node);
853
854         pnc = determine_final_pnc(node, 0, pnc);
855
856         /* get both Projs */
857         proj_true = get_proj(node, pn_ia32_Jcc_true);
858         assert(proj_true && "Jcc without true Proj");
859
860         proj_false = get_proj(node, pn_ia32_Jcc_false);
861         assert(proj_false && "Jcc without false Proj");
862
863         block      = get_nodes_block(node);
864         next_block = next_blk_sched(block);
865
866         if (get_cfop_target_block(proj_true) == next_block) {
867                 /* exchange both proj's so the second one can be omitted */
868                 const ir_node *t = proj_true;
869
870                 proj_true  = proj_false;
871                 proj_false = t;
872                 if(pnc & ia32_pn_Cmp_float) {
873                         pnc = get_negated_pnc(pnc, mode_F);
874                 } else {
875                         pnc = get_negated_pnc(pnc, mode_Iu);
876                 }
877         }
878
879         if (pnc & ia32_pn_Cmp_float) {
880                 /* Some floating point comparisons require a test of the parity flag,
881                  * which indicates that the result is unordered */
882                 switch (pnc & 15) {
883                         case pn_Cmp_Uo:
884                                 be_emit_cstring(env, "\tjp ");
885                                 ia32_emit_cfop_target(env, proj_true);
886                                 be_emit_finish_line_gas(env, proj_true);
887                                 break;
888
889                         case pn_Cmp_Leg:
890                                 be_emit_cstring(env, "\tjnp ");
891                                 ia32_emit_cfop_target(env, proj_true);
892                                 be_emit_finish_line_gas(env, proj_true);
893                                 break;
894
895                         case pn_Cmp_Eq:
896                         case pn_Cmp_Lt:
897                         case pn_Cmp_Le:
898                                 be_emit_cstring(env, "\tjp ");
899                                 ia32_emit_cfop_target(env, proj_false);
900                                 be_emit_finish_line_gas(env, proj_false);
901                                 goto emit_jcc;
902
903                         case pn_Cmp_Ug:
904                         case pn_Cmp_Uge:
905                         case pn_Cmp_Ne:
906                                 be_emit_cstring(env, "\tjp ");
907                                 ia32_emit_cfop_target(env, proj_true);
908                                 be_emit_finish_line_gas(env, proj_true);
909                                 goto emit_jcc;
910
911                         default:
912                                 goto emit_jcc;
913                 }
914         } else {
915 emit_jcc:
916                 be_emit_cstring(env, "\tj");
917                 ia32_emit_cmp_suffix(env, pnc);
918                 be_emit_char(env, ' ');
919                 ia32_emit_cfop_target(env, proj_true);
920                 be_emit_finish_line_gas(env, proj_true);
921         }
922
923         /* the second Proj might be a fallthrough */
924         if (get_cfop_target_block(proj_false) != next_block) {
925                 be_emit_cstring(env, "\tjmp ");
926                 ia32_emit_cfop_target(env, proj_false);
927                 be_emit_finish_line_gas(env, proj_false);
928         } else {
929                 be_emit_cstring(env, "\t/* fallthrough to ");
930                 ia32_emit_cfop_target(env, proj_false);
931                 be_emit_cstring(env, " */");
932                 be_emit_finish_line_gas(env, proj_false);
933         }
934 }
935
936 #if 0
937 /**
938  * Emits code for conditional SSE floating point jump with two variables.
939  */
940 static
941 void emit_ia32_xCmpJmp(ia32_emit_env_t *env, const ir_node *node) {
942         be_emit_cstring(env, "\tucomi");
943         ia32_emit_xmm_mode_suffix(env, node);
944         be_emit_char(env, ' ');
945         ia32_emit_binop(env, node, 0);
946         be_emit_finish_line_gas(env, node);
947
948         finish_CondJmp(env, node, mode_F, get_ia32_pncode(node));
949 }
950
951 /**
952  * Emits code for conditional x87 floating point jump with two variables.
953  */
954 static
955 void emit_ia32_x87CmpJmp(ia32_emit_env_t *env, const ir_node *node) {
956         const ia32_x87_attr_t *x87_attr = get_ia32_x87_attr_const(node);
957         const char            *reg      = x87_attr->x87[1]->name;
958         long                   pnc      = get_ia32_pncode(node);
959
960         switch (get_ia32_irn_opcode(node)) {
961         case iro_ia32_fcomrJmp:
962                 pnc = get_inversed_pnc(pnc);
963                 reg = x87_attr->x87[0]->name;
964         case iro_ia32_fcomJmp:
965         default:
966                 be_emit_cstring(env, "\tfucom ");
967                 break;
968         case iro_ia32_fcomrpJmp:
969                 pnc = get_inversed_pnc(pnc);
970                 reg = x87_attr->x87[0]->name;
971         case iro_ia32_fcompJmp:
972                 be_emit_cstring(env, "\tfucomp ");
973                 break;
974         case iro_ia32_fcomrppJmp:
975                 pnc = get_inversed_pnc(pnc);
976         case iro_ia32_fcomppJmp:
977                 be_emit_cstring(env, "\tfucompp ");
978                 reg = "";
979                 break;
980         }
981
982         if(reg[0] != '\0') {
983                 be_emit_char(env, '%');
984                 be_emit_string(env, reg);
985         }
986         be_emit_finish_line_gas(env, node);
987
988         be_emit_cstring(env, "\tfnstsw %ax");
989         be_emit_finish_line_gas(env, node);
990         be_emit_cstring(env, "\tsahf");
991         be_emit_finish_line_gas(env, node);
992
993         finish_CondJmp(env, node, mode_E, pnc);
994 }
995 #endif
996
997 static void emit_ia32_CMov(ia32_emit_env_t *env, const ir_node *node)
998 {
999         const arch_register_t *out = arch_get_irn_register(env->arch_env, node);
1000         const arch_register_t *in_true;
1001         const arch_register_t *in_false;
1002         pn_Cmp                 pnc = get_ia32_pncode(node);
1003
1004         pnc = determine_final_pnc(node, n_ia32_CMov_eflags, pnc);
1005
1006         in_true  = arch_get_irn_register(env->arch_env,
1007                                          get_irn_n(node, n_ia32_CMov_val_true));
1008         in_false = arch_get_irn_register(env->arch_env,
1009                                          get_irn_n(node, n_ia32_CMov_val_false));
1010
1011         /* should be same constraint fullfilled? */
1012         if(out == in_false) {
1013                 /* yes -> nothing to do */
1014         } else if(out == in_true) {
1015                 const arch_register_t *tmp;
1016
1017                 /* swap left/right and negate pnc */
1018                 pnc = get_negated_pnc(pnc, mode_Iu);
1019
1020                 tmp      = in_true;
1021                 in_true  = in_false;
1022                 in_false = tmp;
1023         } else {
1024                 /* we need a mov */
1025                 be_emit_cstring(env, "\tmovl ");
1026                 ia32_emit_register(env, in_false);
1027                 be_emit_cstring(env, ", ");
1028                 ia32_emit_register(env, out);
1029                 be_emit_finish_line_gas(env, node);
1030         }
1031
1032         be_emit_cstring(env, "\tcmov");
1033         ia32_emit_cmp_suffix(env, pnc);
1034         be_emit_char(env, ' ');
1035         if(get_ia32_op_type(node) == ia32_AddrModeS) {
1036                 ia32_emit_am(env, node);
1037         } else {
1038                 ia32_emit_register(env, in_true);
1039         }
1040         be_emit_cstring(env, ", ");
1041         ia32_emit_register(env, out);
1042         be_emit_finish_line_gas(env, node);
1043 }
1044
1045 #if 0
1046 static
1047 void emit_ia32_xCmp(ia32_emit_env_t *env, const ir_node *node) {
1048         int  sse_pnc  = -1;
1049         long pnc      = get_ia32_pncode(node);
1050         long unord    = pnc & pn_Cmp_Uo;
1051
1052         assert( (pnc & ia32_pn_Cmp_Unsigned) == 0);
1053
1054         switch (pnc) {
1055                 case pn_Cmp_Leg: /* odered */
1056                         sse_pnc = 7;
1057                         break;
1058                 case pn_Cmp_Uo:  /* unordered */
1059                         sse_pnc = 3;
1060                         break;
1061                 case pn_Cmp_Ue:
1062                 case pn_Cmp_Eq:  /* == */
1063                         sse_pnc = 0;
1064                         break;
1065                 case pn_Cmp_Ul:
1066                 case pn_Cmp_Lt:  /* < */
1067                         sse_pnc = 1;
1068                         break;
1069                 case pn_Cmp_Ule:
1070                 case pn_Cmp_Le: /* <= */
1071                         sse_pnc = 2;
1072                         break;
1073                 case pn_Cmp_Ug:
1074                 case pn_Cmp_Gt:  /* > */
1075                         sse_pnc = 6;
1076                         break;
1077                 case pn_Cmp_Uge:
1078                 case pn_Cmp_Ge: /* >= */
1079                         sse_pnc = 5;
1080                         break;
1081                 case pn_Cmp_Ne:
1082                 case pn_Cmp_Lg:  /* != */
1083                         sse_pnc = 4;
1084                         break;
1085         }
1086
1087         assert(sse_pnc >= 0 && "unsupported compare");
1088
1089         if (unord && sse_pnc != 3) {
1090                 /*
1091                         We need a separate compare against unordered.
1092                         Quick and Dirty solution:
1093                         - get some memory on stack
1094                         - compare
1095                         - store result
1096                         - compare
1097                         - and result and stored result
1098                     - cleanup stack
1099                 */
1100                 be_emit_cstring(env, "\tsubl $8, %esp");
1101                 be_emit_finish_line_gas(env, node);
1102
1103                 be_emit_cstring(env, "\tcmpsd $3, ");
1104                 ia32_emit_binop(env, node, 0);
1105                 be_emit_finish_line_gas(env, node);
1106
1107                 be_emit_cstring(env, "\tmovsd ");
1108                 ia32_emit_dest_register(env, node, 0);
1109                 be_emit_cstring(env, ", (%esp)");
1110                 be_emit_finish_line_gas(env, node);
1111         }
1112
1113         be_emit_cstring(env, "\tcmpsd ");
1114         be_emit_irprintf(env->emit, "%d, ", sse_pnc);
1115         ia32_emit_binop(env, node, 0);
1116         be_emit_finish_line_gas(env, node);
1117
1118         if (unord && sse_pnc != 3) {
1119                 be_emit_cstring(env, "\tandpd (%esp), ");
1120                 ia32_emit_dest_register(env, node, 0);
1121                 be_emit_finish_line_gas(env, node);
1122
1123                 be_emit_cstring(env, "\taddl $8, %esp");
1124                 be_emit_finish_line_gas(env, node);
1125         }
1126 }
1127 #endif
1128
1129 /*********************************************************
1130  *                 _ _       _
1131  *                (_) |     (_)
1132  *   ___ _ __ ___  _| |_     _ _   _ _ __ ___  _ __  ___
1133  *  / _ \ '_ ` _ \| | __|   | | | | | '_ ` _ \| '_ \/ __|
1134  * |  __/ | | | | | | |_    | | |_| | | | | | | |_) \__ \
1135  *  \___|_| |_| |_|_|\__|   | |\__,_|_| |_| |_| .__/|___/
1136  *                         _/ |               | |
1137  *                        |__/                |_|
1138  *********************************************************/
1139
1140 /* jump table entry (target and corresponding number) */
1141 typedef struct _branch_t {
1142         ir_node *target;
1143         int      value;
1144 } branch_t;
1145
1146 /* jump table for switch generation */
1147 typedef struct _jmp_tbl_t {
1148         ir_node  *defProj;         /**< default target */
1149         long      min_value;       /**< smallest switch case */
1150         long      max_value;       /**< largest switch case */
1151         long      num_branches;    /**< number of jumps */
1152         char     *label;           /**< label of the jump table */
1153         branch_t *branches;        /**< jump array */
1154 } jmp_tbl_t;
1155
1156 /**
1157  * Compare two variables of type branch_t. Used to sort all switch cases
1158  */
1159 static
1160 int ia32_cmp_branch_t(const void *a, const void *b) {
1161         branch_t *b1 = (branch_t *)a;
1162         branch_t *b2 = (branch_t *)b;
1163
1164         if (b1->value <= b2->value)
1165                 return -1;
1166         else
1167                 return 1;
1168 }
1169
1170 /**
1171  * Emits code for a SwitchJmp (creates a jump table if
1172  * possible otherwise a cmp-jmp cascade). Port from
1173  * cggg ia32 backend
1174  */
1175 static
1176 void emit_ia32_SwitchJmp(ia32_emit_env_t *env, const ir_node *node) {
1177         unsigned long       interval;
1178         int                 last_value, i;
1179         long                pnc;
1180         jmp_tbl_t           tbl;
1181         ir_node            *proj;
1182         const ir_edge_t    *edge;
1183
1184         /* fill the table structure */
1185         tbl.label        = xmalloc(SNPRINTF_BUF_LEN);
1186         tbl.label        = get_unique_label(tbl.label, SNPRINTF_BUF_LEN, ".TBL_");
1187         tbl.defProj      = NULL;
1188         tbl.num_branches = get_irn_n_edges(node);
1189         tbl.branches     = xcalloc(tbl.num_branches, sizeof(tbl.branches[0]));
1190         tbl.min_value    = INT_MAX;
1191         tbl.max_value    = INT_MIN;
1192
1193         i = 0;
1194         /* go over all proj's and collect them */
1195         foreach_out_edge(node, edge) {
1196                 proj = get_edge_src_irn(edge);
1197                 assert(is_Proj(proj) && "Only proj allowed at SwitchJmp");
1198
1199                 pnc = get_Proj_proj(proj);
1200
1201                 /* create branch entry */
1202                 tbl.branches[i].target = proj;
1203                 tbl.branches[i].value  = pnc;
1204
1205                 tbl.min_value = pnc < tbl.min_value ? pnc : tbl.min_value;
1206                 tbl.max_value = pnc > tbl.max_value ? pnc : tbl.max_value;
1207
1208                 /* check for default proj */
1209                 if (pnc == get_ia32_pncode(node)) {
1210                         assert(tbl.defProj == NULL && "found two defProjs at SwitchJmp");
1211                         tbl.defProj = proj;
1212                 }
1213
1214                 i++;
1215         }
1216
1217         /* sort the branches by their number */
1218         qsort(tbl.branches, tbl.num_branches, sizeof(tbl.branches[0]), ia32_cmp_branch_t);
1219
1220         /* two-complement's magic make this work without overflow */
1221         interval = tbl.max_value - tbl.min_value;
1222
1223         /* emit the table */
1224         be_emit_cstring(env, "\tcmpl $");
1225         be_emit_irprintf(env->emit, "%u, ", interval);
1226         ia32_emit_source_register(env, node, 0);
1227         be_emit_finish_line_gas(env, node);
1228
1229         be_emit_cstring(env, "\tja ");
1230         ia32_emit_cfop_target(env, tbl.defProj);
1231         be_emit_finish_line_gas(env, node);
1232
1233         if (tbl.num_branches > 1) {
1234                 /* create table */
1235                 be_emit_cstring(env, "\tjmp *");
1236                 be_emit_string(env, tbl.label);
1237                 be_emit_cstring(env, "(,");
1238                 ia32_emit_source_register(env, node, 0);
1239                 be_emit_cstring(env, ",4)");
1240                 be_emit_finish_line_gas(env, node);
1241
1242                 be_gas_emit_switch_section(env->emit, GAS_SECTION_RODATA);
1243                 be_emit_cstring(env, "\t.align 4\n");
1244                 be_emit_write_line(env);
1245
1246                 be_emit_string(env, tbl.label);
1247                 be_emit_cstring(env, ":\n");
1248                 be_emit_write_line(env);
1249
1250                 be_emit_cstring(env, ".long ");
1251                 ia32_emit_cfop_target(env, tbl.branches[0].target);
1252                 be_emit_finish_line_gas(env, NULL);
1253
1254                 last_value = tbl.branches[0].value;
1255                 for (i = 1; i < tbl.num_branches; ++i) {
1256                         while (++last_value < tbl.branches[i].value) {
1257                                 be_emit_cstring(env, ".long ");
1258                                 ia32_emit_cfop_target(env, tbl.defProj);
1259                                 be_emit_finish_line_gas(env, NULL);
1260                         }
1261                         be_emit_cstring(env, ".long ");
1262                         ia32_emit_cfop_target(env, tbl.branches[i].target);
1263                         be_emit_finish_line_gas(env, NULL);
1264                 }
1265                 be_gas_emit_switch_section(env->emit, GAS_SECTION_TEXT);
1266         } else {
1267                 /* one jump is enough */
1268                 be_emit_cstring(env, "\tjmp ");
1269                 ia32_emit_cfop_target(env, tbl.branches[0].target);
1270                 be_emit_finish_line_gas(env, node);
1271         }
1272
1273         if (tbl.label)
1274                 free(tbl.label);
1275         if (tbl.branches)
1276                 free(tbl.branches);
1277 }
1278
1279 /**
1280  * Emits code for a unconditional jump.
1281  */
1282 static
1283 void emit_Jmp(ia32_emit_env_t *env, const ir_node *node) {
1284         ir_node *block, *next_block;
1285
1286         /* for now, the code works for scheduled and non-schedules blocks */
1287         block = get_nodes_block(node);
1288
1289         /* we have a block schedule */
1290         next_block = next_blk_sched(block);
1291         if (get_cfop_target_block(node) != next_block) {
1292                 be_emit_cstring(env, "\tjmp ");
1293                 ia32_emit_cfop_target(env, node);
1294         } else {
1295                 be_emit_cstring(env, "\t/* fallthrough to ");
1296                 ia32_emit_cfop_target(env, node);
1297                 be_emit_cstring(env, " */");
1298         }
1299         be_emit_finish_line_gas(env, node);
1300 }
1301
1302 static
1303 void emit_ia32_Immediate(ia32_emit_env_t *env, const ir_node *node)
1304 {
1305         const ia32_immediate_attr_t *attr = get_ia32_immediate_attr_const(node);
1306
1307         be_emit_char(env, '$');
1308         if(attr->symconst != NULL) {
1309                 ident *id = get_entity_ld_ident(attr->symconst);
1310
1311                 if(attr->attr.data.am_sc_sign)
1312                         be_emit_char(env, '-');
1313                 be_emit_ident(env, id);
1314         }
1315         if(attr->symconst == NULL || attr->offset != 0) {
1316                 if(attr->symconst != NULL) {
1317                         be_emit_irprintf(env->emit, "%+d", attr->offset);
1318                 } else {
1319                         be_emit_irprintf(env->emit, "0x%X", attr->offset);
1320                 }
1321         }
1322 }
1323
1324 static
1325 const char* emit_asm_operand(ia32_emit_env_t *env, const ir_node *node,
1326                              const char *s)
1327 {
1328         const arch_register_t *reg;
1329         const char            *reg_name;
1330         char                   c;
1331         char                   modifier = 0;
1332         int                    num      = -1;
1333         const ia32_attr_t     *attr;
1334         int                    n_outs;
1335         int                    p;
1336
1337         assert(*s == '%');
1338         c = *(++s);
1339
1340         /* parse modifiers */
1341         switch(c) {
1342         case 0:
1343                 ir_fprintf(stderr, "Warning: asm text (%+F) ends with %\n", node);
1344                 be_emit_char(env, '%');
1345                 return s + 1;
1346         case '%':
1347                 be_emit_char(env, '%');
1348                 return s + 1;
1349         case 'w':
1350         case 'b':
1351         case 'h':
1352                 modifier = c;
1353                 ++s;
1354                 break;
1355         case '0':
1356         case '1':
1357         case '2':
1358         case '3':
1359         case '4':
1360         case '5':
1361         case '6':
1362         case '7':
1363         case '8':
1364         case '9':
1365                 break;
1366         default:
1367                 ir_fprintf(stderr, "Warning: asm text (%+F) contains unknown modifier "
1368                            "'%c' for asm op\n", node, c);
1369                 ++s;
1370                 break;
1371         }
1372
1373         /* parse number */
1374         sscanf(s, "%d%n", &num, &p);
1375         if(num < 0) {
1376                 ir_fprintf(stderr, "Warning: Couldn't parse assembler operand (%+F)\n",
1377                            node);
1378                 return s;
1379         } else {
1380                 s += p;
1381         }
1382
1383         /* get register */
1384         attr   = get_ia32_attr_const(node);
1385         n_outs = ARR_LEN(attr->slots);
1386         if(num < n_outs) {
1387                 reg = get_out_reg(env, node, num);
1388         } else {
1389                 ir_node *pred;
1390                 int      in = num - n_outs;
1391                 if(in >= get_irn_arity(node)) {
1392                         ir_fprintf(stderr, "Warning: Invalid input %d specified in asm "
1393                                    "op (%+F)\n", num, node);
1394                         return s;
1395                 }
1396                 pred = get_irn_n(node, in);
1397                 /* might be an immediate value */
1398                 if(is_ia32_Immediate(pred)) {
1399                         emit_ia32_Immediate(env, pred);
1400                         return s;
1401                 }
1402                 reg = get_in_reg(env, node, in);
1403         }
1404         if(reg == NULL) {
1405                 ir_fprintf(stderr, "Warning: no register assigned for %d asm op "
1406                            "(%+F)\n", num, node);
1407                 return s;
1408         }
1409
1410         /* emit it */
1411         be_emit_char(env, '%');
1412         switch(modifier) {
1413         case 0:
1414                 reg_name = arch_register_get_name(reg);
1415                 break;
1416         case 'b':
1417                 reg_name = ia32_get_mapped_reg_name(env->isa->regs_8bit, reg);
1418                 break;
1419         case 'h':
1420                 reg_name = ia32_get_mapped_reg_name(env->isa->regs_8bit_high, reg);
1421                 break;
1422         case 'w':
1423                 reg_name = ia32_get_mapped_reg_name(env->isa->regs_16bit, reg);
1424                 break;
1425         default:
1426                 panic("Invalid asm op modifier");
1427         }
1428         be_emit_string(env, reg_name);
1429
1430         return s;
1431 }
1432
1433 /**
1434  * Emits code for an ASM pseudo op.
1435  */
1436 static
1437 void emit_ia32_Asm(ia32_emit_env_t *env, const ir_node *node)
1438 {
1439         const void            *gen_attr = get_irn_generic_attr_const(node);
1440         const ia32_asm_attr_t *attr
1441                 = CONST_CAST_IA32_ATTR(ia32_asm_attr_t, gen_attr);
1442         ident                 *asm_text = attr->asm_text;
1443         const char            *s        = get_id_str(asm_text);
1444
1445         be_emit_cstring(env, "# Begin ASM \t");
1446         be_emit_finish_line_gas(env, node);
1447
1448         if (s[0] != '\t')
1449                 be_emit_char(env, '\t');
1450
1451         while(*s != 0) {
1452                 if(*s == '%') {
1453                         s = emit_asm_operand(env, node, s);
1454                         continue;
1455                 } else {
1456                         be_emit_char(env, *s);
1457                 }
1458                 ++s;
1459         }
1460
1461         be_emit_char(env, '\n');
1462         be_emit_write_line(env);
1463
1464         be_emit_cstring(env, "# End ASM\n");
1465         be_emit_write_line(env);
1466 }
1467
1468 /**********************************
1469  *   _____                  ____
1470  *  / ____|                |  _ \
1471  * | |     ___  _ __  _   _| |_) |
1472  * | |    / _ \| '_ \| | | |  _ <
1473  * | |___| (_) | |_) | |_| | |_) |
1474  *  \_____\___/| .__/ \__, |____/
1475  *             | |     __/ |
1476  *             |_|    |___/
1477  **********************************/
1478
1479 /**
1480  * Emit movsb/w instructions to make mov count divideable by 4
1481  */
1482 static
1483 void emit_CopyB_prolog(ia32_emit_env_t *env, int rem) {
1484         be_emit_cstring(env, "\tcld");
1485         be_emit_finish_line_gas(env, NULL);
1486
1487         switch(rem) {
1488         case 1:
1489                 be_emit_cstring(env, "\tmovsb");
1490                 be_emit_finish_line_gas(env, NULL);
1491                 break;
1492         case 2:
1493                 be_emit_cstring(env, "\tmovsw");
1494                 be_emit_finish_line_gas(env, NULL);
1495                 break;
1496         case 3:
1497                 be_emit_cstring(env, "\tmovsb");
1498                 be_emit_finish_line_gas(env, NULL);
1499                 be_emit_cstring(env, "\tmovsw");
1500                 be_emit_finish_line_gas(env, NULL);
1501                 break;
1502         }
1503 }
1504
1505 /**
1506  * Emit rep movsd instruction for memcopy.
1507  */
1508 static
1509 void emit_ia32_CopyB(ia32_emit_env_t *env, const ir_node *node) {
1510         int rem = get_ia32_pncode(node);
1511
1512         emit_CopyB_prolog(env, rem);
1513
1514         be_emit_cstring(env, "\trep movsd");
1515         be_emit_finish_line_gas(env, node);
1516 }
1517
1518 /**
1519  * Emits unrolled memcopy.
1520  */
1521 static
1522 void emit_ia32_CopyB_i(ia32_emit_env_t *env, const ir_node *node) {
1523         int size = get_ia32_pncode(node);
1524
1525         emit_CopyB_prolog(env, size & 0x3);
1526
1527         size >>= 2;
1528         while (size--) {
1529                 be_emit_cstring(env, "\tmovsd");
1530                 be_emit_finish_line_gas(env, NULL);
1531         }
1532 }
1533
1534
1535
1536 /***************************
1537  *   _____
1538  *  / ____|
1539  * | |     ___  _ ____   __
1540  * | |    / _ \| '_ \ \ / /
1541  * | |___| (_) | | | \ V /
1542  *  \_____\___/|_| |_|\_/
1543  *
1544  ***************************/
1545
1546 /**
1547  * Emit code for conversions (I, FP), (FP, I) and (FP, FP).
1548  */
1549 static
1550 void emit_ia32_Conv_with_FP(ia32_emit_env_t *env, const ir_node *node) {
1551         ir_mode            *ls_mode = get_ia32_ls_mode(node);
1552         int                 ls_bits = get_mode_size_bits(ls_mode);
1553
1554         be_emit_cstring(env, "\tcvt");
1555
1556         if(is_ia32_Conv_I2FP(node)) {
1557                 if(ls_bits == 32) {
1558                         be_emit_cstring(env, "si2ss");
1559                 } else {
1560                         be_emit_cstring(env, "si2sd");
1561                 }
1562         } else if(is_ia32_Conv_FP2I(node)) {
1563                 if(ls_bits == 32) {
1564                         be_emit_cstring(env, "ss2si");
1565                 } else {
1566                         be_emit_cstring(env, "sd2si");
1567                 }
1568         } else {
1569                 assert(is_ia32_Conv_FP2FP(node));
1570                 if(ls_bits == 32) {
1571                         be_emit_cstring(env, "sd2ss");
1572                 } else {
1573                         be_emit_cstring(env, "ss2sd");
1574                 }
1575         }
1576         be_emit_char(env, ' ');
1577
1578         switch(get_ia32_op_type(node)) {
1579                 case ia32_Normal:
1580                         ia32_emit_source_register(env, node, n_ia32_unary_op);
1581                         be_emit_cstring(env, ", ");
1582                         ia32_emit_dest_register(env, node, 0);
1583                         break;
1584                 case ia32_AddrModeS:
1585                         ia32_emit_dest_register(env, node, 0);
1586                         be_emit_cstring(env, ", ");
1587                         ia32_emit_am(env, node);
1588                         break;
1589                 default:
1590                         assert(0 && "unsupported op type for Conv");
1591         }
1592         be_emit_finish_line_gas(env, node);
1593 }
1594
1595 static
1596 void emit_ia32_Conv_I2FP(ia32_emit_env_t *env, const ir_node *node) {
1597         emit_ia32_Conv_with_FP(env, node);
1598 }
1599
1600 static
1601 void emit_ia32_Conv_FP2I(ia32_emit_env_t *env, const ir_node *node) {
1602         emit_ia32_Conv_with_FP(env, node);
1603 }
1604
1605 static
1606 void emit_ia32_Conv_FP2FP(ia32_emit_env_t *env, const ir_node *node) {
1607         emit_ia32_Conv_with_FP(env, node);
1608 }
1609
1610 /**
1611  * Emits code for an Int conversion.
1612  */
1613 static
1614 void emit_ia32_Conv_I2I(ia32_emit_env_t *env, const ir_node *node) {
1615         const char *sign_suffix;
1616         ir_mode *smaller_mode = get_ia32_ls_mode(node);
1617         int smaller_bits = get_mode_size_bits(smaller_mode);
1618         int signed_mode;
1619         const arch_register_t *in_reg, *out_reg;
1620
1621         assert(!mode_is_float(smaller_mode));
1622         assert(smaller_bits == 8 || smaller_bits == 16 || smaller_bits == 32);
1623
1624         signed_mode = mode_is_signed(smaller_mode);
1625         if(smaller_bits == 32) {
1626                 // this should not happen as it's no convert
1627                 assert(0);
1628                 sign_suffix = "";
1629         } else {
1630                 sign_suffix = signed_mode ? "s" : "z";
1631         }
1632
1633         switch(get_ia32_op_type(node)) {
1634                 case ia32_Normal:
1635                         in_reg  = get_in_reg(env, node, n_ia32_unary_op);
1636                         out_reg = get_out_reg(env, node, 0);
1637
1638                         if (in_reg  == &ia32_gp_regs[REG_EAX] &&
1639                                 out_reg == &ia32_gp_regs[REG_EAX] &&
1640                                 signed_mode &&
1641                                 smaller_bits == 16)
1642                         {
1643                                 /* argument and result are both in EAX and */
1644                                 /* signedness is ok: -> use the smaller cwtl opcode */
1645                                 be_emit_cstring(env, "\tcwtl");
1646                         } else {
1647                                 const char *sreg = ia32_get_reg_name_for_mode(env, smaller_mode, in_reg);
1648
1649                                 be_emit_cstring(env, "\tmov");
1650                                 be_emit_string(env, sign_suffix);
1651                                 ia32_emit_mode_suffix_mode(env, smaller_mode);
1652                                 be_emit_cstring(env, "l %");
1653                                 be_emit_string(env, sreg);
1654                                 be_emit_cstring(env, ", ");
1655                                 ia32_emit_dest_register(env, node, 0);
1656                         }
1657                         break;
1658                 case ia32_AddrModeS: {
1659                         be_emit_cstring(env, "\tmov");
1660                         be_emit_string(env, sign_suffix);
1661                         ia32_emit_mode_suffix_mode(env, smaller_mode);
1662                         be_emit_cstring(env, "l ");
1663                         ia32_emit_am(env, node);
1664                         be_emit_cstring(env, ", ");
1665                         ia32_emit_dest_register(env, node, 0);
1666                         break;
1667                 }
1668                 default:
1669                         assert(0 && "unsupported op type for Conv");
1670         }
1671         be_emit_finish_line_gas(env, node);
1672 }
1673
1674 /**
1675  * Emits code for an 8Bit Int conversion.
1676  */
1677 void emit_ia32_Conv_I2I8Bit(ia32_emit_env_t *env, const ir_node *node) {
1678         emit_ia32_Conv_I2I(env, node);
1679 }
1680
1681
1682 /*******************************************
1683  *  _                          _
1684  * | |                        | |
1685  * | |__   ___ _ __   ___   __| | ___  ___
1686  * | '_ \ / _ \ '_ \ / _ \ / _` |/ _ \/ __|
1687  * | |_) |  __/ | | | (_) | (_| |  __/\__ \
1688  * |_.__/ \___|_| |_|\___/ \__,_|\___||___/
1689  *
1690  *******************************************/
1691
1692 /**
1693  * Emits a backend call
1694  */
1695 static
1696 void emit_be_Call(ia32_emit_env_t *env, const ir_node *node) {
1697         ir_entity *ent = be_Call_get_entity(node);
1698
1699         be_emit_cstring(env, "\tcall ");
1700         if (ent) {
1701                 set_entity_backend_marked(ent, 1);
1702                 be_emit_string(env, get_entity_ld_name(ent));
1703         } else {
1704                 be_emit_char(env, '*');
1705                 ia32_emit_dest_register(env, get_irn_n(node, be_pos_Call_ptr), 0);
1706         }
1707         be_emit_finish_line_gas(env, node);
1708 }
1709
1710 /**
1711  * Emits code to increase stack pointer.
1712  */
1713 static
1714 void emit_be_IncSP(ia32_emit_env_t *env, const ir_node *node) {
1715         int offs = be_get_IncSP_offset(node);
1716
1717         if (offs == 0)
1718                 return;
1719
1720         if (offs > 0) {
1721                 be_emit_cstring(env, "\tsubl $");
1722                 be_emit_irprintf(env->emit, "%u, ", offs);
1723                 ia32_emit_source_register(env, node, 0);
1724         } else {
1725                 be_emit_cstring(env, "\taddl $");
1726                 be_emit_irprintf(env->emit, "%u, ", -offs);
1727                 ia32_emit_source_register(env, node, 0);
1728         }
1729         be_emit_finish_line_gas(env, node);
1730 }
1731
1732 /**
1733  * Emits code for Copy/CopyKeep.
1734  */
1735 static
1736 void Copy_emitter(ia32_emit_env_t *env, const ir_node *node, const ir_node *op)
1737 {
1738         const arch_env_t      *arch_env = env->arch_env;
1739         const arch_register_t *in       = arch_get_irn_register(arch_env, op);
1740         const arch_register_t *out      = arch_get_irn_register(arch_env, node);
1741         ir_mode *mode;
1742
1743         if(in == out) {
1744                 return;
1745         }
1746         if(is_unknown_reg(in))
1747                 return;
1748         /* copies of vf nodes aren't real... */
1749         if(arch_register_get_class(in) == &ia32_reg_classes[CLASS_ia32_vfp])
1750                 return;
1751
1752         mode = get_irn_mode(node);
1753         if (mode == mode_E) {
1754                 be_emit_cstring(env, "\tmovsd ");
1755                 ia32_emit_register(env, in);
1756                 be_emit_cstring(env, ", ");
1757                 ia32_emit_register(env, out);
1758         } else {
1759                 be_emit_cstring(env, "\tmovl ");
1760                 ia32_emit_register(env, in);
1761                 be_emit_cstring(env, ", ");
1762                 ia32_emit_register(env, out);
1763         }
1764         be_emit_finish_line_gas(env, node);
1765 }
1766
1767 static
1768 void emit_be_Copy(ia32_emit_env_t *env, const ir_node *node) {
1769         Copy_emitter(env, node, be_get_Copy_op(node));
1770 }
1771
1772 static
1773 void emit_be_CopyKeep(ia32_emit_env_t *env, const ir_node *node) {
1774         Copy_emitter(env, node, be_get_CopyKeep_op(node));
1775 }
1776
1777 /**
1778  * Emits code for exchange.
1779  */
1780 static
1781 void emit_be_Perm(ia32_emit_env_t *env, const ir_node *node) {
1782         const arch_register_t *in1, *in2;
1783         const arch_register_class_t *cls1, *cls2;
1784
1785         in1 = arch_get_irn_register(env->arch_env, get_irn_n(node, 0));
1786         in2 = arch_get_irn_register(env->arch_env, get_irn_n(node, 1));
1787
1788         cls1 = arch_register_get_class(in1);
1789         cls2 = arch_register_get_class(in2);
1790
1791         assert(cls1 == cls2 && "Register class mismatch at Perm");
1792
1793         if (cls1 == &ia32_reg_classes[CLASS_ia32_gp]) {
1794                 be_emit_cstring(env, "\txchg ");
1795                 ia32_emit_source_register(env, node, 1);
1796                 be_emit_cstring(env, ", ");
1797                 ia32_emit_source_register(env, node, 0);
1798                 be_emit_finish_line_gas(env, node);
1799         } else if (cls1 == &ia32_reg_classes[CLASS_ia32_xmm]) {
1800                 be_emit_cstring(env, "\txorpd ");
1801                 ia32_emit_source_register(env, node, 1);
1802                 be_emit_cstring(env, ", ");
1803                 ia32_emit_source_register(env, node, 0);
1804                 be_emit_finish_line_gas(env, NULL);
1805
1806                 be_emit_cstring(env, "\txorpd ");
1807                 ia32_emit_source_register(env, node, 0);
1808                 be_emit_cstring(env, ", ");
1809                 ia32_emit_source_register(env, node, 1);
1810                 be_emit_finish_line_gas(env, NULL);
1811
1812                 be_emit_cstring(env, "\txorpd ");
1813                 ia32_emit_source_register(env, node, 1);
1814                 be_emit_cstring(env, ", ");
1815                 ia32_emit_source_register(env, node, 0);
1816                 be_emit_finish_line_gas(env, node);
1817         } else if (cls1 == &ia32_reg_classes[CLASS_ia32_vfp]) {
1818                 /* is a NOP */
1819         } else if (cls1 == &ia32_reg_classes[CLASS_ia32_st]) {
1820                 /* is a NOP */
1821         }
1822 }
1823
1824 /**
1825  * Emits code for Constant loading.
1826  */
1827 static
1828 void emit_ia32_Const(ia32_emit_env_t *env, const ir_node *node) {
1829         const ia32_immediate_attr_t *attr = get_ia32_immediate_attr_const(node);
1830
1831         /* a zero? */
1832         if(attr->symconst == NULL && attr->offset == 0) {
1833                 assert(get_ia32_flags(node) & arch_irn_flags_modify_flags);
1834                 be_emit_cstring(env, "\txorl ");
1835                 ia32_emit_dest_register(env, node, 0);
1836                 be_emit_cstring(env, ", ");
1837                 ia32_emit_dest_register(env, node, 0);
1838         } else {
1839                 be_emit_cstring(env, "\tmovl ");
1840                 emit_ia32_Immediate(env, node);
1841                 be_emit_cstring(env, ", ");
1842                 ia32_emit_dest_register(env, node, 0);
1843         }
1844
1845         be_emit_finish_line_gas(env, node);
1846 }
1847
1848 /**
1849  * Emits code to load the TLS base
1850  */
1851 static
1852 void emit_ia32_LdTls(ia32_emit_env_t *env, const ir_node *node) {
1853         be_emit_cstring(env, "\tmovl %gs:0, ");
1854         ia32_emit_dest_register(env, node, 0);
1855         be_emit_finish_line_gas(env, node);
1856 }
1857
1858 /* helper function for emit_ia32_Minus64Bit */
1859 static void emit_mov(ia32_emit_env_t *env, const ir_node* node, const arch_register_t *src, const arch_register_t *dst)
1860 {
1861         be_emit_cstring(env, "\tmovl ");
1862         ia32_emit_register(env, src);
1863         be_emit_cstring(env, ", ");
1864         ia32_emit_register(env, dst);
1865         be_emit_finish_line_gas(env, node);
1866 }
1867
1868 /* helper function for emit_ia32_Minus64Bit */
1869 static void emit_neg(ia32_emit_env_t *env, const ir_node* node, const arch_register_t *reg)
1870 {
1871         be_emit_cstring(env, "\tnegl ");
1872         ia32_emit_register(env, reg);
1873         be_emit_finish_line_gas(env, node);
1874 }
1875
1876 /* helper function for emit_ia32_Minus64Bit */
1877 static void emit_sbb0(ia32_emit_env_t *env, const ir_node* node, const arch_register_t *reg)
1878 {
1879         be_emit_cstring(env, "\tsbbl $0, ");
1880         ia32_emit_register(env, reg);
1881         be_emit_finish_line_gas(env, node);
1882 }
1883
1884 /* helper function for emit_ia32_Minus64Bit */
1885 static void emit_sbb(ia32_emit_env_t *env, const ir_node* node, const arch_register_t *src, const arch_register_t *dst)
1886 {
1887         be_emit_cstring(env, "\tsbbl ");
1888         ia32_emit_register(env, src);
1889         be_emit_cstring(env, ", ");
1890         ia32_emit_register(env, dst);
1891         be_emit_finish_line_gas(env, node);
1892 }
1893
1894 /* helper function for emit_ia32_Minus64Bit */
1895 static void emit_xchg(ia32_emit_env_t *env, const ir_node* node, const arch_register_t *src, const arch_register_t *dst)
1896 {
1897         be_emit_cstring(env, "\txchgl ");
1898         ia32_emit_register(env, src);
1899         be_emit_cstring(env, ", ");
1900         ia32_emit_register(env, dst);
1901         be_emit_finish_line_gas(env, node);
1902 }
1903
1904 /* helper function for emit_ia32_Minus64Bit */
1905 static void emit_zero(ia32_emit_env_t *env, const ir_node* node, const arch_register_t *reg)
1906 {
1907         be_emit_cstring(env, "\txorl ");
1908         ia32_emit_register(env, reg);
1909         be_emit_cstring(env, ", ");
1910         ia32_emit_register(env, reg);
1911         be_emit_finish_line_gas(env, node);
1912 }
1913
1914 static void emit_ia32_Minus64Bit(ia32_emit_env_t *env, const ir_node *node)
1915 {
1916         const arch_register_t *in_lo  = get_in_reg( env, node, 0);
1917         const arch_register_t *in_hi  = get_in_reg( env, node, 1);
1918         const arch_register_t *out_lo = get_out_reg(env, node, 0);
1919         const arch_register_t *out_hi = get_out_reg(env, node, 1);
1920
1921         if (out_lo == in_lo) {
1922                 if (out_hi != in_hi) {
1923                         /* a -> a, b -> d */
1924                         goto zero_neg;
1925                 } else {
1926                         /* a -> a, b -> b */
1927                         goto normal_neg;
1928                 }
1929         } else if (out_lo == in_hi) {
1930                 if (out_hi == in_lo) {
1931                         /* a -> b, b -> a */
1932                         emit_xchg(env, node, in_lo, in_hi);
1933                         goto normal_neg;
1934                 } else {
1935                         /* a -> b, b -> d */
1936                         emit_mov(env, node, in_hi, out_hi);
1937                         emit_mov(env, node, in_lo, out_lo);
1938                         goto normal_neg;
1939                 }
1940         } else {
1941                 if (out_hi == in_lo) {
1942                         /* a -> c, b -> a */
1943                         emit_mov(env, node, in_lo, out_lo);
1944                         goto zero_neg;
1945                 } else if (out_hi == in_hi) {
1946                         /* a -> c, b -> b */
1947                         emit_mov(env, node, in_lo, out_lo);
1948                         goto normal_neg;
1949                 } else {
1950                         /* a -> c, b -> d */
1951                         emit_mov(env, node, in_lo, out_lo);
1952                         goto zero_neg;
1953                 }
1954         }
1955
1956 normal_neg:
1957         emit_neg( env, node, out_hi);
1958         emit_neg( env, node, out_lo);
1959         emit_sbb0(env, node, out_hi);
1960         return;
1961
1962 zero_neg:
1963         emit_zero(env, node, out_hi);
1964         emit_neg( env, node, out_lo);
1965         emit_sbb( env, node, in_hi, out_hi);
1966 }
1967
1968 static
1969 void emit_be_Return(ia32_emit_env_t *env, const ir_node *node)
1970 {
1971         be_emit_cstring(env, "\tret");
1972         be_emit_finish_line_gas(env, node);
1973 }
1974
1975 static
1976 void emit_Nothing(ia32_emit_env_t *env, const ir_node *node)
1977 {
1978         (void) env;
1979         (void) node;
1980 }
1981
1982
1983 /***********************************************************************************
1984  *                  _          __                                             _
1985  *                 (_)        / _|                                           | |
1986  *  _ __ ___   __ _ _ _ __   | |_ _ __ __ _ _ __ ___   _____      _____  _ __| | __
1987  * | '_ ` _ \ / _` | | '_ \  |  _| '__/ _` | '_ ` _ \ / _ \ \ /\ / / _ \| '__| |/ /
1988  * | | | | | | (_| | | | | | | | | | | (_| | | | | | |  __/\ V  V / (_) | |  |   <
1989  * |_| |_| |_|\__,_|_|_| |_| |_| |_|  \__,_|_| |_| |_|\___| \_/\_/ \___/|_|  |_|\_\
1990  *
1991  ***********************************************************************************/
1992
1993 /**
1994  * Enters the emitter functions for handled nodes into the generic
1995  * pointer of an opcode.
1996  */
1997 static
1998 void ia32_register_emitters(void) {
1999
2000 #define IA32_EMIT2(a,b) op_ia32_##a->ops.generic = (op_func)emit_ia32_##b
2001 #define IA32_EMIT(a)    IA32_EMIT2(a,a)
2002 #define EMIT(a)         op_##a->ops.generic = (op_func)emit_##a
2003 #define IGN(a)                  op_##a->ops.generic = (op_func)emit_Nothing
2004 #define BE_EMIT(a)      op_be_##a->ops.generic = (op_func)emit_be_##a
2005 #define BE_IGN(a)               op_be_##a->ops.generic = (op_func)emit_Nothing
2006
2007         /* first clear the generic function pointer for all ops */
2008         clear_irp_opcodes_generic_func();
2009
2010         /* register all emitter functions defined in spec */
2011         ia32_register_spec_emitters();
2012
2013         /* other ia32 emitter functions */
2014         IA32_EMIT(Asm);
2015         IA32_EMIT(CMov);
2016         IA32_EMIT(SwitchJmp);
2017         IA32_EMIT(CopyB);
2018         IA32_EMIT(CopyB_i);
2019         IA32_EMIT(Conv_I2FP);
2020         IA32_EMIT(Conv_FP2I);
2021         IA32_EMIT(Conv_FP2FP);
2022         IA32_EMIT(Conv_I2I);
2023         IA32_EMIT(Conv_I2I8Bit);
2024         IA32_EMIT(Const);
2025         IA32_EMIT(LdTls);
2026         IA32_EMIT(Minus64Bit);
2027         IA32_EMIT(Jcc);
2028 #if 0
2029         IA32_EMIT(xCmp);
2030         IA32_EMIT(xCmpJmp);
2031         IA32_EMIT2(fcomJmp, x87CmpJmp);
2032         IA32_EMIT2(fcompJmp, x87CmpJmp);
2033         IA32_EMIT2(fcomppJmp, x87CmpJmp);
2034         IA32_EMIT2(fcomrJmp, x87CmpJmp);
2035         IA32_EMIT2(fcomrpJmp, x87CmpJmp);
2036         IA32_EMIT2(fcomrppJmp, x87CmpJmp);
2037 #endif
2038
2039         /* benode emitter */
2040         BE_EMIT(Call);
2041         BE_EMIT(IncSP);
2042         BE_EMIT(Copy);
2043         BE_EMIT(CopyKeep);
2044         BE_EMIT(Perm);
2045         BE_EMIT(Return);
2046
2047         BE_IGN(RegParams);
2048         BE_IGN(Barrier);
2049         BE_IGN(Keep);
2050
2051         /* firm emitter */
2052         EMIT(Jmp);
2053         IGN(Proj);
2054         IGN(Phi);
2055         IGN(Start);
2056
2057 #undef BE_EMIT
2058 #undef EMIT
2059 #undef IGN
2060 #undef IA32_EMIT2
2061 #undef IA32_EMIT
2062 }
2063
2064 static const char *last_name = NULL;
2065 static unsigned last_line = -1;
2066 static unsigned num = -1;
2067
2068 /**
2069  * Emit the debug support for node node.
2070  */
2071 static
2072 void ia32_emit_dbg(ia32_emit_env_t *env, const ir_node *node) {
2073         dbg_info *db = get_irn_dbg_info(node);
2074         unsigned lineno;
2075         const char *fname = be_retrieve_dbg_info(db, &lineno);
2076
2077         if (! env->cg->birg->main_env->options->stabs_debug_support)
2078                 return;
2079
2080         if (fname) {
2081                 if (last_name != fname) {
2082                         last_line = -1;
2083                         be_dbg_include_begin(env->cg->birg->main_env->db_handle, fname);
2084                         last_name = fname;
2085                 }
2086                 if (last_line != lineno) {
2087                         char name[64];
2088
2089                         snprintf(name, sizeof(name), ".LM%u", ++num);
2090                         last_line = lineno;
2091                         be_dbg_line(env->cg->birg->main_env->db_handle, lineno, name);
2092                         be_emit_string(env, name);
2093                         be_emit_cstring(env, ":\n");
2094                         be_emit_write_line(env);
2095                 }
2096         }
2097 }
2098
2099 typedef void (*emit_func_ptr) (ia32_emit_env_t *, const ir_node *);
2100
2101 /**
2102  * Emits code for a node.
2103  */
2104 static
2105 void ia32_emit_node(ia32_emit_env_t *env, const ir_node *node) {
2106         ir_op *op = get_irn_op(node);
2107
2108         DBG((dbg, LEVEL_1, "emitting code for %+F\n", node));
2109
2110         if (op->ops.generic) {
2111                 emit_func_ptr func = (emit_func_ptr) op->ops.generic;
2112                 ia32_emit_dbg(env, node);
2113                 (*func) (env, node);
2114         } else {
2115                 emit_Nothing(env, node);
2116                 ir_fprintf(stderr, "Error: No emit handler for node %+F (%+G, graph %+F)\n", node, node, current_ir_graph);
2117                 abort();
2118         }
2119 }
2120
2121 /**
2122  * Emits gas alignment directives
2123  */
2124 static
2125 void ia32_emit_alignment(ia32_emit_env_t *env, unsigned align, unsigned skip) {
2126         be_emit_cstring(env, "\t.p2align ");
2127         be_emit_irprintf(env->emit, "%u,,%u\n", align, skip);
2128         be_emit_write_line(env);
2129 }
2130
2131 /**
2132  * Emits gas alignment directives for Functions depended on cpu architecture.
2133  */
2134 static
2135 void ia32_emit_align_func(ia32_emit_env_t *env, cpu_support cpu) {
2136         unsigned align;
2137         unsigned maximum_skip;
2138
2139         switch (cpu) {
2140                 case arch_i386:
2141                         align = 2;
2142                         break;
2143                 case arch_i486:
2144                         align = 4;
2145                         break;
2146                 case arch_k6:
2147                         align = 5;
2148                         break;
2149                 default:
2150                         align = 4;
2151         }
2152         maximum_skip = (1 << align) - 1;
2153         ia32_emit_alignment(env, align, maximum_skip);
2154 }
2155
2156 /**
2157  * Emits gas alignment directives for Labels depended on cpu architecture.
2158  */
2159 static
2160 void ia32_emit_align_label(ia32_emit_env_t *env, cpu_support cpu) {
2161         unsigned align; unsigned maximum_skip;
2162
2163         switch (cpu) {
2164                 case arch_i386:
2165                         align = 2;
2166                         break;
2167                 case arch_i486:
2168                         align = 4;
2169                         break;
2170                 case arch_k6:
2171                         align = 5;
2172                         break;
2173                 default:
2174                         align = 4;
2175         }
2176         maximum_skip = (1 << align) - 1;
2177         ia32_emit_alignment(env, align, maximum_skip);
2178 }
2179
2180 /**
2181  * Test wether a block should be aligned.
2182  * For cpus in the P4/Athlon class it is usefull to align jump labels to
2183  * 16 bytes. However we should only do that if the alignment nops before the
2184  * label aren't executed more often than we have jumps to the label.
2185  */
2186 static
2187 int should_align_block(ia32_emit_env_t *env, ir_node *block, ir_node *prev) {
2188         static const double DELTA = .0001;
2189         ir_exec_freq *exec_freq = env->cg->birg->exec_freq;
2190         double        block_freq;
2191         double        prev_freq = 0;  /**< execfreq of the fallthrough block */
2192         double        jmp_freq  = 0;  /**< execfreq of all non-fallthrough blocks */
2193         cpu_support   cpu       = env->isa->opt_arch;
2194         int           i, n_cfgpreds;
2195
2196         if(exec_freq == NULL)
2197                 return 0;
2198         if(cpu == arch_i386 || cpu == arch_i486)
2199                 return 0;
2200
2201         block_freq = get_block_execfreq(exec_freq, block);
2202         if(block_freq < DELTA)
2203                 return 0;
2204
2205         n_cfgpreds = get_Block_n_cfgpreds(block);
2206         for(i = 0; i < n_cfgpreds; ++i) {
2207                 ir_node *pred      = get_Block_cfgpred_block(block, i);
2208                 double   pred_freq = get_block_execfreq(exec_freq, pred);
2209
2210                 if(pred == prev) {
2211                         prev_freq += pred_freq;
2212                 } else {
2213                         jmp_freq  += pred_freq;
2214                 }
2215         }
2216
2217         if(prev_freq < DELTA && !(jmp_freq < DELTA))
2218                 return 1;
2219
2220         jmp_freq /= prev_freq;
2221
2222         switch (cpu) {
2223                 case arch_athlon:
2224                 case arch_athlon_64:
2225                 case arch_k6:
2226                         return jmp_freq > 3;
2227                 default:
2228                         return jmp_freq > 2;
2229         }
2230 }
2231
2232 static
2233 void ia32_emit_block_header(ia32_emit_env_t *env, ir_node *block, ir_node *prev)
2234 {
2235         int           n_cfgpreds;
2236         int           need_label;
2237         int           i, arity;
2238         ir_exec_freq  *exec_freq = env->cg->birg->exec_freq;
2239
2240         n_cfgpreds = get_Block_n_cfgpreds(block);
2241         need_label = (n_cfgpreds != 0);
2242
2243         if (should_align_block(env, block, prev)) {
2244                 assert(need_label);
2245                 ia32_emit_align_label(env, env->isa->opt_arch);
2246         }
2247
2248         if(need_label) {
2249                 ia32_emit_block_name(env, block);
2250                 be_emit_char(env, ':');
2251
2252                 be_emit_pad_comment(env);
2253                 be_emit_cstring(env, "   /* preds:");
2254
2255                 /* emit list of pred blocks in comment */
2256                 arity = get_irn_arity(block);
2257                 for (i = 0; i < arity; ++i) {
2258                         ir_node *predblock = get_Block_cfgpred_block(block, i);
2259                         be_emit_irprintf(env->emit, " %d", get_irn_node_nr(predblock));
2260                 }
2261         } else {
2262                 be_emit_cstring(env, "\t/* ");
2263                 ia32_emit_block_name(env, block);
2264                 be_emit_cstring(env, ": ");
2265         }
2266         if (exec_freq != NULL) {
2267                 be_emit_irprintf(env->emit, " freq: %f",
2268                                  get_block_execfreq(exec_freq, block));
2269         }
2270         be_emit_cstring(env, " */\n");
2271         be_emit_write_line(env);
2272 }
2273
2274 /**
2275  * Walks over the nodes in a block connected by scheduling edges
2276  * and emits code for each node.
2277  */
2278 static
2279 void ia32_gen_block(ia32_emit_env_t *env, ir_node *block, ir_node *last_block)
2280 {
2281         const ir_node *node;
2282
2283         ia32_emit_block_header(env, block, last_block);
2284
2285         /* emit the contents of the block */
2286         ia32_emit_dbg(env, block);
2287         sched_foreach(block, node) {
2288                 ia32_emit_node(env, node);
2289         }
2290 }
2291
2292 /**
2293  * Emits code for function start.
2294  */
2295 static
2296 void ia32_emit_func_prolog(ia32_emit_env_t *env, ir_graph *irg) {
2297         ir_entity  *irg_ent  = get_irg_entity(irg);
2298         const char *irg_name = get_entity_ld_name(irg_ent);
2299         cpu_support cpu      = env->isa->opt_arch;
2300         const be_irg_t *birg = env->cg->birg;
2301
2302         be_emit_write_line(env);
2303         be_gas_emit_switch_section(env->emit, GAS_SECTION_TEXT);
2304         be_dbg_method_begin(birg->main_env->db_handle, irg_ent, be_abi_get_stack_layout(birg->abi));
2305         ia32_emit_align_func(env, cpu);
2306         if (get_entity_visibility(irg_ent) == visibility_external_visible) {
2307                 be_emit_cstring(env, ".global ");
2308                 be_emit_string(env, irg_name);
2309                 be_emit_char(env, '\n');
2310                 be_emit_write_line(env);
2311         }
2312         ia32_emit_function_object(env, irg_name);
2313         be_emit_string(env, irg_name);
2314         be_emit_cstring(env, ":\n");
2315         be_emit_write_line(env);
2316 }
2317
2318 /**
2319  * Emits code for function end
2320  */
2321 static
2322 void ia32_emit_func_epilog(ia32_emit_env_t *env, ir_graph *irg) {
2323         const char *irg_name = get_entity_ld_name(get_irg_entity(irg));
2324         const be_irg_t *birg = env->cg->birg;
2325
2326         ia32_emit_function_size(env, irg_name);
2327         be_dbg_method_end(birg->main_env->db_handle);
2328         be_emit_char(env, '\n');
2329         be_emit_write_line(env);
2330 }
2331
2332 /**
2333  * Block-walker:
2334  * Sets labels for control flow nodes (jump target)
2335  */
2336 static
2337 void ia32_gen_labels(ir_node *block, void *data)
2338 {
2339         ir_node *pred;
2340         int n = get_Block_n_cfgpreds(block);
2341         (void) data;
2342
2343         for (n--; n >= 0; n--) {
2344                 pred = get_Block_cfgpred(block, n);
2345                 set_irn_link(pred, block);
2346         }
2347 }
2348
2349 /**
2350  * Emit an exception label if the current instruction can fail.
2351  */
2352 void ia32_emit_exc_label(ia32_emit_env_t *env, const ir_node *node) {
2353         if (get_ia32_exc_label(node)) {
2354                 be_emit_irprintf(env->emit, ".EXL%u\n", 0);
2355                 be_emit_write_line(env);
2356         }
2357 }
2358
2359 /**
2360  * Main driver. Emits the code for one routine.
2361  */
2362 void ia32_gen_routine(ia32_code_gen_t *cg, ir_graph *irg) {
2363         ia32_emit_env_t env;
2364         ir_node *block;
2365         ir_node *last_block = NULL;
2366         int i, n;
2367
2368         env.isa      = (ia32_isa_t *)cg->arch_env->isa;
2369         env.emit     = &env.isa->emit;
2370         env.arch_env = cg->arch_env;
2371         env.cg       = cg;
2372
2373         ia32_register_emitters();
2374
2375         ia32_emit_func_prolog(&env, irg);
2376         irg_block_walk_graph(irg, ia32_gen_labels, NULL, &env);
2377
2378         n = ARR_LEN(cg->blk_sched);
2379         for (i = 0; i < n;) {
2380                 ir_node *next_bl;
2381
2382                 block   = cg->blk_sched[i];
2383                 ++i;
2384                 next_bl = i < n ? cg->blk_sched[i] : NULL;
2385
2386                 /* set here the link. the emitter expects to find the next block here */
2387                 set_irn_link(block, next_bl);
2388                 ia32_gen_block(&env, block, last_block);
2389                 last_block = block;
2390         }
2391
2392         ia32_emit_func_epilog(&env, irg);
2393 }
2394
2395 void ia32_init_emitter(void)
2396 {
2397         FIRM_DBG_REGISTER(dbg, "firm.be.ia32.emitter");
2398 }