3a86782281a76bd8abf9d86bbcf1de7eaec0de0d
[libfirm] / ir / be / ia32 / ia32_emitter.c
1 /*
2  * Copyright (C) 1995-2007 University of Karlsruhe.  All right reserved.
3  *
4  * This file is part of libFirm.
5  *
6  * This file may be distributed and/or modified under the terms of the
7  * GNU General Public License version 2 as published by the Free Software
8  * Foundation and appearing in the file LICENSE.GPL included in the
9  * packaging of this file.
10  *
11  * Licensees holding valid libFirm Professional Edition licenses may use
12  * this file in accordance with the libFirm Commercial License.
13  * Agreement provided with the Software.
14  *
15  * This file is provided AS IS with NO WARRANTY OF ANY KIND, INCLUDING THE
16  * WARRANTY OF DESIGN, MERCHANTABILITY AND FITNESS FOR A PARTICULAR
17  * PURPOSE.
18  */
19
20 /**
21  * @file
22  * @brief       This file implements the ia32 node emitter.
23  * @author      Christian Wuerdig, Matthias Braun
24  * @version     $Id$
25  */
26 #ifdef HAVE_CONFIG_H
27 #include "config.h"
28 #endif
29
30 #include <limits.h>
31
32 #include "xmalloc.h"
33 #include "tv.h"
34 #include "iredges.h"
35 #include "debug.h"
36 #include "irgwalk.h"
37 #include "irprintf.h"
38 #include "irop_t.h"
39 #include "irargs_t.h"
40 #include "irprog_t.h"
41 #include "iredges_t.h"
42 #include "execfreq.h"
43 #include "error.h"
44 #include "raw_bitset.h"
45
46 #include "../besched_t.h"
47 #include "../benode_t.h"
48 #include "../beabi.h"
49 #include "../be_dbgout.h"
50 #include "../beemitter.h"
51 #include "../begnuas.h"
52 #include "../beirg_t.h"
53
54 #include "ia32_emitter.h"
55 #include "gen_ia32_emitter.h"
56 #include "gen_ia32_regalloc_if.h"
57 #include "ia32_nodes_attr.h"
58 #include "ia32_new_nodes.h"
59 #include "ia32_map_regs.h"
60 #include "bearch_ia32_t.h"
61
62 DEBUG_ONLY(static firm_dbg_module_t *dbg = NULL;)
63
64 #define BLOCK_PREFIX ".L"
65
66 #define SNPRINTF_BUF_LEN 128
67
68 /**
69  * Returns the register at in position pos.
70  */
71 static
72 const arch_register_t *get_in_reg(ia32_emit_env_t *env, const ir_node *irn,
73                                   int pos)
74 {
75         const arch_env_t       *arch_env = env->arch_env;
76         ir_node                *op;
77         const arch_register_t  *reg = NULL;
78
79         assert(get_irn_arity(irn) > pos && "Invalid IN position");
80
81         /* The out register of the operator at position pos is the
82            in register we need. */
83         op = get_irn_n(irn, pos);
84
85         reg = arch_get_irn_register(arch_env, op);
86
87         assert(reg && "no in register found");
88
89         if(reg == &ia32_gp_regs[REG_GP_NOREG])
90                 panic("trying to emit noreg for %+F input %d", irn, pos);
91
92         /* in case of unknown register: just return a valid register */
93         if (reg == &ia32_gp_regs[REG_GP_UKNWN]) {
94                 const arch_register_req_t *req;
95
96                 /* ask for the requirements */
97                 req = arch_get_register_req(arch_env, irn, pos);
98
99                 if (arch_register_req_is(req, limited)) {
100                         /* in case of limited requirements: get the first allowed register */
101                         unsigned idx = rbitset_next(req->limited, 0, 1);
102                         reg = arch_register_for_index(req->cls, idx);
103                 } else {
104                         /* otherwise get first register in class */
105                         reg = arch_register_for_index(req->cls, 0);
106                 }
107         }
108
109         return reg;
110 }
111
112 /**
113  * Returns the register at out position pos.
114  */
115 static
116 const arch_register_t *get_out_reg(ia32_emit_env_t *env, const ir_node *irn,
117                                    int pos)
118 {
119         const arch_env_t      *arch_env = env->arch_env;
120         ir_node               *proj;
121         const arch_register_t *reg = NULL;
122
123         /* 1st case: irn is not of mode_T, so it has only                 */
124         /*           one OUT register -> good                             */
125         /* 2nd case: irn is of mode_T -> collect all Projs and ask the    */
126         /*           Proj with the corresponding projnum for the register */
127
128         if (get_irn_mode(irn) != mode_T) {
129                 reg = arch_get_irn_register(arch_env, irn);
130         } else if (is_ia32_irn(irn)) {
131                 reg = get_ia32_out_reg(irn, pos);
132         } else {
133                 const ir_edge_t *edge;
134
135                 foreach_out_edge(irn, edge) {
136                         proj = get_edge_src_irn(edge);
137                         assert(is_Proj(proj) && "non-Proj from mode_T node");
138                         if (get_Proj_proj(proj) == pos) {
139                                 reg = arch_get_irn_register(arch_env, proj);
140                                 break;
141                         }
142                 }
143         }
144
145         assert(reg && "no out register found");
146         return reg;
147 }
148
149 /**
150  * Determine the gnu assembler suffix that indicates a mode
151  */
152 static
153 char get_mode_suffix(const ir_mode *mode) {
154         if(mode_is_float(mode)) {
155                 switch(get_mode_size_bits(mode)) {
156                 case 32:
157                         return 's';
158                 case 64:
159                         return 'l';
160                 case 80:
161                 case 96:
162                         return 't';
163                 }
164         } else {
165                 assert(mode_is_int(mode) || mode_is_reference(mode));
166                 switch(get_mode_size_bits(mode)) {
167                 case 64:
168                         return 'q';
169                 case 32:
170                         return 'l';
171                 case 16:
172                         return 'w';
173                 case 8:
174                         return 'b';
175                 }
176         }
177         panic("Can't output mode_suffix for %+F\n", mode);
178 }
179
180 static
181 int produces_result(const ir_node *node) {
182         return
183                 !is_ia32_CmpSet(node)       &&
184                 !is_ia32_CmpSet8Bit(node)   &&
185                 !is_ia32_CmpJmp(node)       &&
186                 !is_ia32_CmpJmp8Bit(node)   &&
187                 !is_ia32_St(node)           &&
188                 !is_ia32_SwitchJmp(node)    &&
189                 !is_ia32_TestJmp(node)      &&
190                 !is_ia32_TestJmp8Bit(node)  &&
191                 !is_ia32_xCmpSet(node)      &&
192                 !is_ia32_xCmpJmp(node)      &&
193                 !is_ia32_CmpCMov(node)      &&
194                 !is_ia32_CmpCMov8Bit(node)  &&
195                 !is_ia32_TestCMov(node)     &&
196                 !is_ia32_TestCMov8Bit(node) &&
197                 !is_ia32_CmpSet(node)       &&
198                 !is_ia32_TestSet(node);
199 }
200
201 static
202 const char *ia32_get_reg_name_for_mode(ia32_emit_env_t *env, ir_mode *mode,
203                                        const arch_register_t *reg) {
204         switch(get_mode_size_bits(mode)) {
205                 case 8:
206                         return ia32_get_mapped_reg_name(env->isa->regs_8bit, reg);
207                 case 16:
208                         return ia32_get_mapped_reg_name(env->isa->regs_16bit, reg);
209                 default:
210                         return (char *)arch_register_get_name(reg);
211         }
212 }
213
214 /**
215  * Add a number to a prefix. This number will not be used a second time.
216  */
217 static
218 char *get_unique_label(char *buf, size_t buflen, const char *prefix) {
219         static unsigned long id = 0;
220         snprintf(buf, buflen, "%s%lu", prefix, ++id);
221         return buf;
222 }
223
224 /*************************************************************
225  *             _       _    __   _          _
226  *            (_)     | |  / _| | |        | |
227  *  _ __  _ __ _ _ __ | |_| |_  | |__   ___| |_ __   ___ _ __
228  * | '_ \| '__| | '_ \| __|  _| | '_ \ / _ \ | '_ \ / _ \ '__|
229  * | |_) | |  | | | | | |_| |   | | | |  __/ | |_) |  __/ |
230  * | .__/|_|  |_|_| |_|\__|_|   |_| |_|\___|_| .__/ \___|_|
231  * | |                                       | |
232  * |_|                                       |_|
233  *************************************************************/
234
235 // we have no C++ and can't define an implicit ia32_emit_env_t* cast to
236 // be_emit_env_t* so we cheat a bit...
237 #define be_emit_char(env,c)             be_emit_char(env->emit,c)
238 #define be_emit_string(env,s)           be_emit_string(env->emit,s)
239 #undef be_emit_cstring
240 #define be_emit_cstring(env,x)          { be_emit_string_len(env->emit, x, sizeof(x)-1); }
241 #define be_emit_ident(env,i)            be_emit_ident(env->emit,i)
242 #define be_emit_tarval(env,tv)          be_emit_tarval(env->emit,tv)
243 #define be_emit_write_line(env)         be_emit_write_line(env->emit)
244 #define be_emit_finish_line_gas(env,n)  be_emit_finish_line_gas(env->emit,n)
245 #define be_emit_pad_comment(env)        be_emit_pad_comment(env->emit)
246
247 void ia32_emit_source_register(ia32_emit_env_t *env, const ir_node *node, int pos)
248 {
249         const arch_register_t *reg = get_in_reg(env, node, pos);
250         const char *reg_name = arch_register_get_name(reg);
251
252         assert(pos < get_irn_arity(node));
253
254         be_emit_char(env, '%');
255         be_emit_string(env, reg_name);
256 }
257
258 void ia32_emit_dest_register(ia32_emit_env_t *env, const ir_node *node, int pos) {
259         const arch_register_t *reg = get_out_reg(env, node, pos);
260         const char *reg_name = arch_register_get_name(reg);
261
262         be_emit_char(env, '%');
263         be_emit_string(env, reg_name);
264 }
265
266 static void ia32_emit_register(ia32_emit_env_t *env, const arch_register_t *reg)
267 {
268         const char *reg_name = arch_register_get_name(reg);
269
270         be_emit_char(env, '%');
271         be_emit_string(env, reg_name);
272 }
273
274 void ia32_emit_x87_name(ia32_emit_env_t *env, const ir_node *node, int pos)
275 {
276         const ia32_x87_attr_t *attr = get_ia32_x87_attr_const(node);
277
278         assert(pos < 3);
279         be_emit_char(env, '%');
280         be_emit_string(env, attr->x87[pos]->name);
281 }
282
283 static
284 void ia32_emit_mode_suffix_mode(ia32_emit_env_t *env, const ir_mode *mode)
285 {
286         be_emit_char(env, get_mode_suffix(mode));
287 }
288
289 void ia32_emit_mode_suffix(ia32_emit_env_t *env, const ir_node *node)
290 {
291         ir_mode *mode = get_ia32_ls_mode(node);
292         if(mode == NULL)
293                 mode = mode_Iu;
294
295         ia32_emit_mode_suffix_mode(env, mode);
296 }
297
298 void ia32_emit_x87_mode_suffix(ia32_emit_env_t *env, const ir_node *node)
299 {
300         ir_mode *mode = get_ia32_ls_mode(node);
301         if(mode != NULL)
302                 ia32_emit_mode_suffix_mode(env, mode);
303 }
304
305 static
306 char get_xmm_mode_suffix(ir_mode *mode)
307 {
308         assert(mode_is_float(mode));
309         switch(get_mode_size_bits(mode)) {
310         case 32:
311                 return 's';
312         case 64:
313                 return 'd';
314         default:
315                 assert(0);
316         }
317         return '%';
318 }
319
320 void ia32_emit_xmm_mode_suffix(ia32_emit_env_t *env, const ir_node *node)
321 {
322         ir_mode *mode = get_ia32_ls_mode(node);
323         assert(mode != NULL);
324         be_emit_char(env, 's');
325         be_emit_char(env, get_xmm_mode_suffix(mode));
326 }
327
328 void ia32_emit_xmm_mode_suffix_s(ia32_emit_env_t *env, const ir_node *node)
329 {
330         ir_mode *mode = get_ia32_ls_mode(node);
331         assert(mode != NULL);
332         be_emit_char(env, get_xmm_mode_suffix(mode));
333 }
334
335 void ia32_emit_extend_suffix(ia32_emit_env_t *env, const ir_mode *mode)
336 {
337         if(get_mode_size_bits(mode) == 32)
338                 return;
339         if(mode_is_signed(mode)) {
340                 be_emit_char(env, 's');
341         } else {
342                 be_emit_char(env, 'z');
343         }
344 }
345
346 static
347 void ia32_emit_function_object(ia32_emit_env_t *env, const char *name)
348 {
349         switch (be_gas_flavour) {
350         case GAS_FLAVOUR_NORMAL:
351                 be_emit_cstring(env, "\t.type\t");
352                 be_emit_string(env, name);
353                 be_emit_cstring(env, ", @function\n");
354                 be_emit_write_line(env);
355                 break;
356         case GAS_FLAVOUR_MINGW:
357                 be_emit_cstring(env, "\t.def\t");
358                 be_emit_string(env, name);
359                 be_emit_cstring(env, ";\t.scl\t2;\t.type\t32;\t.endef\n");
360                 be_emit_write_line(env);
361                 break;
362         default:
363                 break;
364         }
365 }
366
367 static
368 void ia32_emit_function_size(ia32_emit_env_t *env, const char *name)
369 {
370         switch (be_gas_flavour) {
371         case GAS_FLAVOUR_NORMAL:
372                 be_emit_cstring(env, "\t.size\t");
373                 be_emit_string(env, name);
374                 be_emit_cstring(env, ", .-");
375                 be_emit_string(env, name);
376                 be_emit_char(env, '\n');
377                 be_emit_write_line(env);
378                 break;
379         default:
380                 break;
381         }
382 }
383
384
385 static
386 void emit_ia32_Immediate(ia32_emit_env_t *env, const ir_node *node);
387
388 void ia32_emit_8bit_source_register(ia32_emit_env_t *env, const ir_node *node,
389                                     int pos)
390 {
391         const arch_register_t *reg;
392         const char            *reg_name;
393         ir_node               *in;
394
395         in = get_irn_n(node, pos);
396         if(is_ia32_Immediate(in)) {
397                 emit_ia32_Immediate(env, in);
398                 return;
399         }
400
401         reg      = get_in_reg(env, node, pos);
402         reg_name = arch_register_get_name(reg);
403
404         be_emit_char(env, '%');
405         be_emit_char(env, reg_name[1]);
406         be_emit_char(env, 'l');
407 }
408
409 void ia32_emit_16bit_source_register(ia32_emit_env_t *env, const ir_node *node,
410                                      int pos)
411 {
412         const arch_register_t *reg;
413         const char            *reg_name;
414         ir_node               *in;
415
416         in = get_irn_n(node, pos);
417         if(is_ia32_Immediate(in)) {
418                 emit_ia32_Immediate(env, in);
419                 return;
420         }
421
422         reg      = get_in_reg(env, node, pos);
423         reg_name = arch_register_get_name(reg);
424
425         be_emit_char(env, '%');
426         be_emit_string(env, &reg_name[1]);
427         be_emit_char(env, 'x');
428 }
429
430 void ia32_emit_source_register_or_immediate(ia32_emit_env_t *env,
431                                             const ir_node *node, int pos)
432 {
433         ir_node *in = get_irn_n(node, pos);
434         if(is_ia32_Immediate(in)) {
435                 emit_ia32_Immediate(env, in);
436         } else {
437                 ia32_emit_source_register(env, node, pos);
438         }
439 }
440
441 /**
442  * Emits registers and/or address mode of a binary operation.
443  */
444 void ia32_emit_binop(ia32_emit_env_t *env, const ir_node *node) {
445         const ir_node *right_op = get_irn_n(node, n_ia32_binary_right);
446
447         switch(get_ia32_op_type(node)) {
448         case ia32_Normal:
449                 if(is_ia32_Immediate(right_op)) {
450                         emit_ia32_Immediate(env, right_op);
451                         be_emit_cstring(env, ", ");
452                         ia32_emit_source_register(env, node, n_ia32_binary_left);
453                         break;
454                 } else {
455                         const arch_register_t *in1 = get_in_reg(env, node, n_ia32_binary_left);
456                         const arch_register_t *in2 = get_in_reg(env, node, n_ia32_binary_right);
457                         const arch_register_t *out = produces_result(node) ? get_out_reg(env, node, 0) : NULL;
458                         const arch_register_t *in;
459                         const char            *in_name;
460
461                         in      = out ? ((out == in2) ? in1 : in2) : in2;
462                         out     = out ? out : in1;
463                         in_name = arch_register_get_name(in);
464
465                         be_emit_char(env, '%');
466                         be_emit_string(env, in_name);
467                         be_emit_cstring(env, ", %");
468                         be_emit_string(env, arch_register_get_name(out));
469                 }
470                 break;
471         case ia32_AddrModeS:
472                 if(is_ia32_Immediate(right_op)) {
473                         assert(!produces_result(node) &&
474                                         "Source AM with Const must not produce result");
475
476                         emit_ia32_Immediate(env, right_op);
477                         be_emit_cstring(env, ", ");
478                         ia32_emit_am(env, node);
479                 } else if (produces_result(node)) {
480                         ia32_emit_am(env, node);
481                         be_emit_cstring(env, ", ");
482                         ia32_emit_dest_register(env, node, 0);
483                 } else {
484                         ia32_emit_am(env, node);
485                         be_emit_cstring(env, ", ");
486                         ia32_emit_source_register(env, node, n_ia32_binary_left);
487                 }
488                 break;
489         case ia32_AddrModeD:
490                 panic("DestMode can't be output by %%binop anymore");
491                 break;
492         default:
493                 assert(0 && "unsupported op type");
494         }
495 }
496
497 /**
498  * Emits registers and/or address mode of a binary operation.
499  */
500 void ia32_emit_x87_binop(ia32_emit_env_t *env, const ir_node *node) {
501         switch(get_ia32_op_type(node)) {
502                 case ia32_Normal:
503                         {
504                                 const ia32_x87_attr_t *x87_attr = get_ia32_x87_attr_const(node);
505                                 const arch_register_t *in1      = x87_attr->x87[0];
506                                 const arch_register_t *in2      = x87_attr->x87[1];
507                                 const arch_register_t *out      = x87_attr->x87[2];
508                                 const arch_register_t *in;
509
510                                 in  = out ? ((out == in2) ? in1 : in2) : in2;
511                                 out = out ? out : in1;
512
513                                 be_emit_char(env, '%');
514                                 be_emit_string(env, arch_register_get_name(in));
515                                 be_emit_cstring(env, ", %");
516                                 be_emit_string(env, arch_register_get_name(out));
517                         }
518                         break;
519                 case ia32_AddrModeS:
520                 case ia32_AddrModeD:
521                         ia32_emit_am(env, node);
522                         break;
523                 default:
524                         assert(0 && "unsupported op type");
525         }
526 }
527
528 void ia32_emit_am_or_dest_register(ia32_emit_env_t *env, const ir_node *node,
529                                    int pos) {
530         if(get_ia32_op_type(node) == ia32_Normal) {
531                 ia32_emit_dest_register(env, node, pos);
532         } else {
533                 assert(get_ia32_op_type(node) == ia32_AddrModeD);
534                 ia32_emit_am(env, node);
535         }
536 }
537
538 /**
539  * Emits registers and/or address mode of a unary operation.
540  */
541 void ia32_emit_unop(ia32_emit_env_t *env, const ir_node *node, int pos) {
542         const ir_node *op;
543
544         switch(get_ia32_op_type(node)) {
545         case ia32_Normal:
546                 op = get_irn_n(node, pos);
547                 if (is_ia32_Immediate(op)) {
548                         emit_ia32_Immediate(env, op);
549                 } else {
550                         ia32_emit_source_register(env, node, pos);
551                 }
552                 break;
553         case ia32_AddrModeS:
554         case ia32_AddrModeD:
555                 ia32_emit_am(env, node);
556                 break;
557         default:
558                 assert(0 && "unsupported op type");
559         }
560 }
561
562 /**
563  * Emits address mode.
564  */
565 void ia32_emit_am(ia32_emit_env_t *env, const ir_node *node) {
566         ir_entity *ent       = get_ia32_am_sc(node);
567         int        offs      = get_ia32_am_offs_int(node);
568         ir_node   *base      = get_irn_n(node, 0);
569         int        has_base  = !is_ia32_NoReg_GP(base);
570         ir_node   *index     = get_irn_n(node, 1);
571         int        has_index = !is_ia32_NoReg_GP(index);
572
573         /* just to be sure... */
574         assert(!is_ia32_use_frame(node) || get_ia32_frame_ent(node) != NULL);
575
576         /* emit offset */
577         if (ent != NULL) {
578                 ident *id;
579
580                 set_entity_backend_marked(ent, 1);
581                 id = get_entity_ld_ident(ent);
582                 if (is_ia32_am_sc_sign(node))
583                         be_emit_char(env, '-');
584                 be_emit_ident(env, id);
585
586                 if(get_entity_owner(ent) == get_tls_type()) {
587                         if (get_entity_visibility(ent) == visibility_external_allocated) {
588                                 be_emit_cstring(env, "@INDNTPOFF");
589                         } else {
590                                 be_emit_cstring(env, "@NTPOFF");
591                         }
592                 }
593         }
594
595         if(offs != 0) {
596                 if(ent != NULL) {
597                         be_emit_irprintf(env->emit, "%+d", offs);
598                 } else {
599                         be_emit_irprintf(env->emit, "%d", offs);
600                 }
601         }
602
603         if (has_base || has_index) {
604                 be_emit_char(env, '(');
605
606                 /* emit base */
607                 if (has_base) {
608                         ia32_emit_source_register(env, node, n_ia32_base);
609                 }
610
611                 /* emit index + scale */
612                 if (has_index) {
613                         int scale;
614                         be_emit_char(env, ',');
615                         ia32_emit_source_register(env, node, n_ia32_index);
616
617                         scale = get_ia32_am_scale(node);
618                         if (scale > 0) {
619                                 be_emit_irprintf(env->emit, ",%d", 1 << get_ia32_am_scale(node));
620                         }
621                 }
622                 be_emit_char(env, ')');
623         }
624
625         /* special case if nothing is set */
626         if(ent == NULL && offs == 0 && !has_base && !has_index) {
627                 be_emit_char(env, '0');
628         }
629 }
630
631 /*************************************************
632  *                 _ _                         _
633  *                (_) |                       | |
634  *   ___ _ __ ___  _| |_    ___ ___  _ __   __| |
635  *  / _ \ '_ ` _ \| | __|  / __/ _ \| '_ \ / _` |
636  * |  __/ | | | | | | |_  | (_| (_) | | | | (_| |
637  *  \___|_| |_| |_|_|\__|  \___\___/|_| |_|\__,_|
638  *
639  *************************************************/
640
641 #undef IA32_DO_EMIT
642 #define IA32_DO_EMIT(irn) ia32_fprintf_format(F, irn, cmd_buf, cmnt_buf)
643
644 /*
645  * coding of conditions
646  */
647 struct cmp2conditon_t {
648         const char *name;
649         pn_Cmp      num;
650 };
651
652 /*
653  * positive conditions for signed compares
654  */
655 static
656 const struct cmp2conditon_t cmp2condition_s[] = {
657         { NULL,              pn_Cmp_False },  /* always false */
658         { "e",               pn_Cmp_Eq },     /* == */
659         { "l",               pn_Cmp_Lt },     /* < */
660         { "le",              pn_Cmp_Le },     /* <= */
661         { "g",               pn_Cmp_Gt },     /* > */
662         { "ge",              pn_Cmp_Ge },     /* >= */
663         { "ne",              pn_Cmp_Lg },     /* != */
664         { NULL,              pn_Cmp_Leg},     /* Floating point: ordered */
665 };
666
667 /*
668  * positive conditions for unsigned compares
669  */
670 static
671 const struct cmp2conditon_t cmp2condition_u[] = {
672         { NULL,              pn_Cmp_False },  /* always false */
673         { "e",               pn_Cmp_Eq },     /* == */
674         { "b",               pn_Cmp_Lt },     /* < */
675         { "be",              pn_Cmp_Le },     /* <= */
676         { "a",               pn_Cmp_Gt },     /* > */
677         { "ae",              pn_Cmp_Ge },     /* >= */
678         { "ne",              pn_Cmp_Lg },     /* != */
679         { NULL,              pn_Cmp_True },   /* always true */
680 };
681
682 /*
683  * returns the condition code
684  */
685 static
686 const char *get_cmp_suffix(pn_Cmp cmp_code)
687 {
688         assert( (cmp2condition_s[cmp_code & 7].num) == (cmp_code & 7));
689         assert( (cmp2condition_u[cmp_code & 7].num) == (cmp_code & 7));
690
691         if((cmp_code & ia32_pn_Cmp_Unsigned)) {
692                 return cmp2condition_u[cmp_code & 7].name;
693         } else {
694                 return cmp2condition_s[cmp_code & 7].name;
695         }
696 }
697
698 void ia32_emit_cmp_suffix(ia32_emit_env_t *env, long pnc)
699 {
700         be_emit_string(env, get_cmp_suffix(pnc));
701 }
702
703
704 /**
705  * Returns the target block for a control flow node.
706  */
707 static
708 ir_node *get_cfop_target_block(const ir_node *irn) {
709         return get_irn_link(irn);
710 }
711
712 /**
713  * Emits a block label for the given block.
714  */
715 static
716 void ia32_emit_block_name(ia32_emit_env_t *env, const ir_node *block)
717 {
718         if (has_Block_label(block)) {
719                 be_emit_string(env, be_gas_label_prefix());
720                 be_emit_irprintf(env->emit, "%u", (unsigned)get_Block_label(block));
721         } else {
722                 be_emit_cstring(env, BLOCK_PREFIX);
723                 be_emit_irprintf(env->emit, "%d", get_irn_node_nr(block));
724         }
725 }
726
727 /**
728  * Emits the target label for a control flow node.
729  */
730 static
731 void ia32_emit_cfop_target(ia32_emit_env_t * env, const ir_node *node) {
732         ir_node *block = get_cfop_target_block(node);
733
734         ia32_emit_block_name(env, block);
735 }
736
737 /** Return the next block in Block schedule */
738 static ir_node *next_blk_sched(const ir_node *block) {
739         return get_irn_link(block);
740 }
741
742 /**
743  * Returns the Proj with projection number proj and NOT mode_M
744  */
745 static
746 ir_node *get_proj(const ir_node *node, long proj) {
747         const ir_edge_t *edge;
748         ir_node         *src;
749
750         assert(get_irn_mode(node) == mode_T && "expected mode_T node");
751
752         foreach_out_edge(node, edge) {
753                 src = get_edge_src_irn(edge);
754
755                 assert(is_Proj(src) && "Proj expected");
756                 if (get_irn_mode(src) == mode_M)
757                         continue;
758
759                 if (get_Proj_proj(src) == proj)
760                         return src;
761         }
762         return NULL;
763 }
764
765 /**
766  * Emits the jump sequence for a conditional jump (cmp + jmp_true + jmp_false)
767  */
768 static
769 void finish_CondJmp(ia32_emit_env_t *env, const ir_node *node, ir_mode *mode,
770                     long pnc) {
771         const ir_node *proj_true;
772         const ir_node *proj_false;
773         const ir_node *block;
774         const ir_node *next_block;
775         int flipped = 0;
776
777         /* get both Proj's */
778         proj_true = get_proj(node, pn_Cond_true);
779         assert(proj_true && "CondJmp without true Proj");
780
781         proj_false = get_proj(node, pn_Cond_false);
782         assert(proj_false && "CondJmp without false Proj");
783
784         /* for now, the code works for scheduled and non-schedules blocks */
785         block = get_nodes_block(node);
786
787         /* we have a block schedule */
788         next_block = next_blk_sched(block);
789
790         if (get_cfop_target_block(proj_true) == next_block) {
791                 /* exchange both proj's so the second one can be omitted */
792                 const ir_node *t = proj_true;
793
794                 proj_true  = proj_false;
795                 proj_false = t;
796                 flipped    = 1;
797                 pnc        = get_negated_pnc(pnc, mode);
798         }
799
800         if (mode_is_float(mode)) {
801                 /* Some floating point comparisons require a test of the parity flag, which
802                  * indicates that the result is unordered */
803                 switch (pnc & ~ia32_pn_Cmp_Unsigned) {
804                         case pn_Cmp_Uo:
805                                 be_emit_cstring(env, "\tjp ");
806                                 ia32_emit_cfop_target(env, proj_true);
807                                 be_emit_finish_line_gas(env, proj_true);
808                                 break;
809
810                         case pn_Cmp_Leg:
811                                 be_emit_cstring(env, "\tjnp ");
812                                 ia32_emit_cfop_target(env, proj_true);
813                                 be_emit_finish_line_gas(env, proj_true);
814                                 break;
815
816                         case pn_Cmp_Eq:
817                         case pn_Cmp_Lt:
818                         case pn_Cmp_Le:
819                                 be_emit_cstring(env, "\tjp ");
820                                 ia32_emit_cfop_target(env, proj_false);
821                                 be_emit_finish_line_gas(env, proj_false);
822                                 goto float_jcc;
823
824                         case pn_Cmp_Ug:
825                         case pn_Cmp_Uge:
826                         case pn_Cmp_Ne:
827                                 be_emit_cstring(env, "\tjp ");
828                                 ia32_emit_cfop_target(env, proj_true);
829                                 be_emit_finish_line_gas(env, proj_true);
830                                 goto float_jcc;
831
832                         default:
833                         float_jcc:
834                                 /* The bits set by floating point compares correspond to unsigned
835                                  * comparisons */
836                                 pnc |= ia32_pn_Cmp_Unsigned;
837                                 goto emit_jcc;
838                 }
839         } else {
840 emit_jcc:
841                 be_emit_cstring(env, "\tj");
842                 ia32_emit_cmp_suffix(env, pnc);
843                 be_emit_char(env, ' ');
844                 ia32_emit_cfop_target(env, proj_true);
845                 be_emit_finish_line_gas(env, proj_true);
846         }
847
848         /* the second Proj might be a fallthrough */
849         if (get_cfop_target_block(proj_false) != next_block) {
850                 be_emit_cstring(env, "\tjmp ");
851                 ia32_emit_cfop_target(env, proj_false);
852                 be_emit_finish_line_gas(env, proj_false);
853         } else {
854                 be_emit_cstring(env, "\t/* fallthrough to ");
855                 ia32_emit_cfop_target(env, proj_false);
856                 be_emit_cstring(env, " */");
857                 be_emit_finish_line_gas(env, proj_false);
858         }
859 }
860
861 /**
862  * Emits code for conditional jump.
863  */
864 static
865 void CondJmp_emitter(ia32_emit_env_t *env, const ir_node *node) {
866         be_emit_cstring(env, "\tcmp");
867         ia32_emit_mode_suffix(env, node);
868         be_emit_char(env, ' ');
869         ia32_emit_binop(env, node);
870         be_emit_finish_line_gas(env, node);
871
872         finish_CondJmp(env, node, mode_Iu, get_ia32_pncode(node));
873 }
874
875 /**
876  * Emits code for conditional jump with two variables.
877  */
878 static
879 void emit_ia32_CmpJmp(ia32_emit_env_t *env, const ir_node *node) {
880         CondJmp_emitter(env, node);
881 }
882
883 /**
884  * Emits code for conditional test and jump.
885  */
886 static
887 void TestJmp_emitter(ia32_emit_env_t *env, const ir_node *node) {
888         be_emit_cstring(env, "\ttest");
889         ia32_emit_mode_suffix(env, node);
890         be_emit_char(env, ' ');
891
892         ia32_emit_binop(env, node);
893         be_emit_finish_line_gas(env, node);
894
895         finish_CondJmp(env, node, mode_Iu, get_ia32_pncode(node));
896 }
897
898 /**
899  * Emits code for conditional test and jump with two variables.
900  */
901 static
902 void emit_ia32_TestJmp(ia32_emit_env_t *env, const ir_node *node) {
903         TestJmp_emitter(env, node);
904 }
905
906 /**
907  * Emits code for conditional SSE floating point jump with two variables.
908  */
909 static
910 void emit_ia32_xCmpJmp(ia32_emit_env_t *env, const ir_node *node) {
911         be_emit_cstring(env, "\tucomi");
912         ia32_emit_xmm_mode_suffix(env, node);
913         be_emit_char(env, ' ');
914         ia32_emit_binop(env, node);
915         be_emit_finish_line_gas(env, node);
916
917         finish_CondJmp(env, node, mode_F, get_ia32_pncode(node));
918 }
919
920 /**
921  * Emits code for conditional x87 floating point jump with two variables.
922  */
923 static
924 void emit_ia32_x87CmpJmp(ia32_emit_env_t *env, const ir_node *node) {
925         const ia32_x87_attr_t *x87_attr = get_ia32_x87_attr_const(node);
926         const char            *reg      = x87_attr->x87[1]->name;
927         long                   pnc      = get_ia32_pncode(node);
928
929         switch (get_ia32_irn_opcode(node)) {
930         case iro_ia32_fcomrJmp:
931                 pnc = get_inversed_pnc(pnc);
932                 reg = x87_attr->x87[0]->name;
933         case iro_ia32_fcomJmp:
934         default:
935                 be_emit_cstring(env, "\tfucom ");
936                 break;
937         case iro_ia32_fcomrpJmp:
938                 pnc = get_inversed_pnc(pnc);
939                 reg = x87_attr->x87[0]->name;
940         case iro_ia32_fcompJmp:
941                 be_emit_cstring(env, "\tfucomp ");
942                 break;
943         case iro_ia32_fcomrppJmp:
944                 pnc = get_inversed_pnc(pnc);
945         case iro_ia32_fcomppJmp:
946                 be_emit_cstring(env, "\tfucompp ");
947                 reg = "";
948                 break;
949         }
950
951         if(reg[0] != '\0') {
952                 be_emit_char(env, '%');
953                 be_emit_string(env, reg);
954         }
955         be_emit_finish_line_gas(env, node);
956
957         be_emit_cstring(env, "\tfnstsw %ax");
958         be_emit_finish_line_gas(env, node);
959         be_emit_cstring(env, "\tsahf");
960         be_emit_finish_line_gas(env, node);
961
962         finish_CondJmp(env, node, mode_E, pnc);
963 }
964
965 static
966 void CMov_emitter(ia32_emit_env_t *env, const ir_node *node)
967 {
968         const arch_register_t *in1, *in2, *out;
969         long  pnc = get_ia32_pncode(node);
970
971         out = arch_get_irn_register(env->arch_env, node);
972
973         /* we have to emit the cmp first, because the destination register */
974         /* could be one of the compare registers                           */
975         if (is_ia32_xCmpCMov(node)) {
976                 be_emit_cstring(env, "\tucomis");
977                 ia32_emit_mode_suffix_mode(env, get_irn_mode(node));
978                 be_emit_char(env, ' ');
979                 ia32_emit_source_register(env, node, 1);
980                 be_emit_cstring(env, ", ");
981                 ia32_emit_source_register(env, node, 0);
982
983                 in1 = arch_get_irn_register(env->arch_env, get_irn_n(node, 2));
984                 in2 = arch_get_irn_register(env->arch_env, get_irn_n(node, 3));
985         } else {
986                 if (is_ia32_CmpCMov(node) || is_ia32_CmpCMov8Bit(node)) {
987                         be_emit_cstring(env, "\tcmp ");
988                 } else {
989                         assert(is_ia32_TestCMov(node) || is_ia32_TestCMov8Bit(node));
990                         be_emit_cstring(env, "\ttest ");
991                 }
992                 ia32_emit_binop(env, node);
993
994                 in1 = arch_get_irn_register(env->arch_env, get_irn_n(node, 5));
995                 in2 = arch_get_irn_register(env->arch_env, get_irn_n(node, 6));
996         }
997         be_emit_finish_line_gas(env, node);
998
999         if (out == in2) {
1000                 /* best case: default in == out -> do nothing */
1001         } else if(in2 == &ia32_gp_regs[REG_GP_UKNWN]) {
1002                 /* also nothign to do for unknown regs */
1003         } else if (out == in1) {
1004                 const arch_register_t *t;
1005                 /* true in == out -> need complement compare and exchange true and
1006                  * default in */
1007                 t   = in1;
1008                 in1 = in2;
1009                 in2 = t;
1010                 pnc = get_negated_pnc(pnc, get_irn_mode(node));
1011         } else {
1012                 /* out is different from both ins: need copy default -> out */
1013                 be_emit_cstring(env, "\tmovl ");
1014                 ia32_emit_register(env, in2);
1015                 be_emit_cstring(env, ", ");
1016                 ia32_emit_register(env, out);
1017                 be_emit_finish_line_gas(env, node);
1018         }
1019
1020         be_emit_cstring(env, "\tcmov");
1021         ia32_emit_cmp_suffix(env, pnc );
1022         be_emit_cstring(env, "l ");
1023         ia32_emit_register(env, in1);
1024         be_emit_cstring(env, ", ");
1025         ia32_emit_register(env, out);
1026
1027         be_emit_finish_line_gas(env, node);
1028 }
1029
1030 static
1031 void emit_ia32_CmpCMov(ia32_emit_env_t *env, const ir_node *node)
1032 {
1033         CMov_emitter(env, node);
1034 }
1035
1036 static
1037 void emit_ia32_TestCMov(ia32_emit_env_t *env, const ir_node *node)
1038 {
1039         CMov_emitter(env, node);
1040 }
1041
1042 static
1043 void emit_ia32_xCmpCMov(ia32_emit_env_t *env, const ir_node *node)
1044 {
1045         CMov_emitter(env, node);
1046 }
1047
1048 static
1049 void Set_emitter(ia32_emit_env_t *env, const ir_node *node)
1050 {
1051         long pnc = get_ia32_pncode(node);
1052         const char *reg8bit;
1053         const arch_register_t *out;
1054
1055         out     = arch_get_irn_register(env->arch_env, node);
1056         reg8bit = ia32_get_mapped_reg_name(env->isa->regs_8bit, out);
1057
1058         if(is_ia32_xCmpSet(node)) {
1059                 be_emit_cstring(env, "\tucomis");
1060                 ia32_emit_mode_suffix_mode(env, get_irn_mode(get_irn_n(node, n_ia32_binary_left)));
1061                 be_emit_char(env, ' ');
1062                 ia32_emit_binop(env, node);
1063         } else {
1064                 if (is_ia32_CmpSet(node) || is_ia32_CmpSet8Bit(node)) {
1065                         be_emit_cstring(env, "\tcmp");
1066                 } else {
1067                         assert(is_ia32_TestSet(node) || is_ia32_TestSet8Bit(node));
1068                         be_emit_cstring(env, "\ttest");
1069                 }
1070                 ia32_emit_mode_suffix(env, node);
1071                 be_emit_char(env, ' ');
1072                 ia32_emit_binop(env, node);
1073         }
1074         be_emit_finish_line_gas(env, node);
1075
1076         be_emit_cstring(env, "\tset");
1077         ia32_emit_cmp_suffix(env, pnc);
1078         be_emit_cstring(env, " %");
1079         be_emit_string(env, reg8bit);
1080         be_emit_finish_line_gas(env, node);
1081 }
1082
1083 static
1084 void emit_ia32_CmpSet(ia32_emit_env_t *env, const ir_node *node) {
1085         Set_emitter(env, node);
1086 }
1087
1088 static
1089 void emit_ia32_TestSet(ia32_emit_env_t *env, const ir_node *node) {
1090         Set_emitter(env, node);
1091 }
1092
1093 static
1094 void emit_ia32_xCmpSet(ia32_emit_env_t *env, const ir_node *node) {
1095         Set_emitter(env, node);
1096 }
1097
1098 static
1099 void emit_ia32_xCmp(ia32_emit_env_t *env, const ir_node *node) {
1100         int  sse_pnc  = -1;
1101         long pnc      = get_ia32_pncode(node);
1102         long unord    = pnc & pn_Cmp_Uo;
1103
1104         assert( (pnc & ia32_pn_Cmp_Unsigned) == 0);
1105
1106         switch (pnc) {
1107                 case pn_Cmp_Leg: /* odered */
1108                         sse_pnc = 7;
1109                         break;
1110                 case pn_Cmp_Uo:  /* unordered */
1111                         sse_pnc = 3;
1112                         break;
1113                 case pn_Cmp_Ue:
1114                 case pn_Cmp_Eq:  /* == */
1115                         sse_pnc = 0;
1116                         break;
1117                 case pn_Cmp_Ul:
1118                 case pn_Cmp_Lt:  /* < */
1119                         sse_pnc = 1;
1120                         break;
1121                 case pn_Cmp_Ule:
1122                 case pn_Cmp_Le: /* <= */
1123                         sse_pnc = 2;
1124                         break;
1125                 case pn_Cmp_Ug:
1126                 case pn_Cmp_Gt:  /* > */
1127                         sse_pnc = 6;
1128                         break;
1129                 case pn_Cmp_Uge:
1130                 case pn_Cmp_Ge: /* >= */
1131                         sse_pnc = 5;
1132                         break;
1133                 case pn_Cmp_Ne:
1134                 case pn_Cmp_Lg:  /* != */
1135                         sse_pnc = 4;
1136                         break;
1137         }
1138
1139         assert(sse_pnc >= 0 && "unsupported compare");
1140
1141         if (unord && sse_pnc != 3) {
1142                 /*
1143                         We need a separate compare against unordered.
1144                         Quick and Dirty solution:
1145                         - get some memory on stack
1146                         - compare
1147                         - store result
1148                         - compare
1149                         - and result and stored result
1150                     - cleanup stack
1151                 */
1152                 be_emit_cstring(env, "\tsubl $8, %esp");
1153                 be_emit_finish_line_gas(env, node);
1154
1155                 be_emit_cstring(env, "\tcmpsd $3, ");
1156                 ia32_emit_binop(env, node);
1157                 be_emit_finish_line_gas(env, node);
1158
1159                 be_emit_cstring(env, "\tmovsd ");
1160                 ia32_emit_dest_register(env, node, 0);
1161                 be_emit_cstring(env, ", (%esp)");
1162                 be_emit_finish_line_gas(env, node);
1163         }
1164
1165         be_emit_cstring(env, "\tcmpsd ");
1166         be_emit_irprintf(env->emit, "%d, ", sse_pnc);
1167         ia32_emit_binop(env, node);
1168         be_emit_finish_line_gas(env, node);
1169
1170         if (unord && sse_pnc != 3) {
1171                 be_emit_cstring(env, "\tandpd (%esp), ");
1172                 ia32_emit_dest_register(env, node, 0);
1173                 be_emit_finish_line_gas(env, node);
1174
1175                 be_emit_cstring(env, "\taddl $8, %esp");
1176                 be_emit_finish_line_gas(env, node);
1177         }
1178 }
1179
1180 /*********************************************************
1181  *                 _ _       _
1182  *                (_) |     (_)
1183  *   ___ _ __ ___  _| |_     _ _   _ _ __ ___  _ __  ___
1184  *  / _ \ '_ ` _ \| | __|   | | | | | '_ ` _ \| '_ \/ __|
1185  * |  __/ | | | | | | |_    | | |_| | | | | | | |_) \__ \
1186  *  \___|_| |_| |_|_|\__|   | |\__,_|_| |_| |_| .__/|___/
1187  *                         _/ |               | |
1188  *                        |__/                |_|
1189  *********************************************************/
1190
1191 /* jump table entry (target and corresponding number) */
1192 typedef struct _branch_t {
1193         ir_node *target;
1194         int      value;
1195 } branch_t;
1196
1197 /* jump table for switch generation */
1198 typedef struct _jmp_tbl_t {
1199         ir_node  *defProj;         /**< default target */
1200         long      min_value;       /**< smallest switch case */
1201         long      max_value;       /**< largest switch case */
1202         long      num_branches;    /**< number of jumps */
1203         char     *label;           /**< label of the jump table */
1204         branch_t *branches;        /**< jump array */
1205 } jmp_tbl_t;
1206
1207 /**
1208  * Compare two variables of type branch_t. Used to sort all switch cases
1209  */
1210 static
1211 int ia32_cmp_branch_t(const void *a, const void *b) {
1212         branch_t *b1 = (branch_t *)a;
1213         branch_t *b2 = (branch_t *)b;
1214
1215         if (b1->value <= b2->value)
1216                 return -1;
1217         else
1218                 return 1;
1219 }
1220
1221 /**
1222  * Emits code for a SwitchJmp (creates a jump table if
1223  * possible otherwise a cmp-jmp cascade). Port from
1224  * cggg ia32 backend
1225  */
1226 static
1227 void emit_ia32_SwitchJmp(ia32_emit_env_t *env, const ir_node *node) {
1228         unsigned long       interval;
1229         int                 last_value, i;
1230         long                pnc;
1231         jmp_tbl_t           tbl;
1232         ir_node            *proj;
1233         const ir_edge_t    *edge;
1234
1235         /* fill the table structure */
1236         tbl.label        = xmalloc(SNPRINTF_BUF_LEN);
1237         tbl.label        = get_unique_label(tbl.label, SNPRINTF_BUF_LEN, ".TBL_");
1238         tbl.defProj      = NULL;
1239         tbl.num_branches = get_irn_n_edges(node);
1240         tbl.branches     = xcalloc(tbl.num_branches, sizeof(tbl.branches[0]));
1241         tbl.min_value    = INT_MAX;
1242         tbl.max_value    = INT_MIN;
1243
1244         i = 0;
1245         /* go over all proj's and collect them */
1246         foreach_out_edge(node, edge) {
1247                 proj = get_edge_src_irn(edge);
1248                 assert(is_Proj(proj) && "Only proj allowed at SwitchJmp");
1249
1250                 pnc = get_Proj_proj(proj);
1251
1252                 /* create branch entry */
1253                 tbl.branches[i].target = proj;
1254                 tbl.branches[i].value  = pnc;
1255
1256                 tbl.min_value = pnc < tbl.min_value ? pnc : tbl.min_value;
1257                 tbl.max_value = pnc > tbl.max_value ? pnc : tbl.max_value;
1258
1259                 /* check for default proj */
1260                 if (pnc == get_ia32_pncode(node)) {
1261                         assert(tbl.defProj == NULL && "found two defProjs at SwitchJmp");
1262                         tbl.defProj = proj;
1263                 }
1264
1265                 i++;
1266         }
1267
1268         /* sort the branches by their number */
1269         qsort(tbl.branches, tbl.num_branches, sizeof(tbl.branches[0]), ia32_cmp_branch_t);
1270
1271         /* two-complement's magic make this work without overflow */
1272         interval = tbl.max_value - tbl.min_value;
1273
1274         /* emit the table */
1275         be_emit_cstring(env, "\tcmpl $");
1276         be_emit_irprintf(env->emit, "%u, ", interval);
1277         ia32_emit_source_register(env, node, 0);
1278         be_emit_finish_line_gas(env, node);
1279
1280         be_emit_cstring(env, "\tja ");
1281         ia32_emit_cfop_target(env, tbl.defProj);
1282         be_emit_finish_line_gas(env, node);
1283
1284         if (tbl.num_branches > 1) {
1285                 /* create table */
1286                 be_emit_cstring(env, "\tjmp *");
1287                 be_emit_string(env, tbl.label);
1288                 be_emit_cstring(env, "(,");
1289                 ia32_emit_source_register(env, node, 0);
1290                 be_emit_cstring(env, ",4)");
1291                 be_emit_finish_line_gas(env, node);
1292
1293                 be_gas_emit_switch_section(env->emit, GAS_SECTION_RODATA);
1294                 be_emit_cstring(env, "\t.align 4\n");
1295                 be_emit_write_line(env);
1296
1297                 be_emit_string(env, tbl.label);
1298                 be_emit_cstring(env, ":\n");
1299                 be_emit_write_line(env);
1300
1301                 be_emit_cstring(env, ".long ");
1302                 ia32_emit_cfop_target(env, tbl.branches[0].target);
1303                 be_emit_finish_line_gas(env, NULL);
1304
1305                 last_value = tbl.branches[0].value;
1306                 for (i = 1; i < tbl.num_branches; ++i) {
1307                         while (++last_value < tbl.branches[i].value) {
1308                                 be_emit_cstring(env, ".long ");
1309                                 ia32_emit_cfop_target(env, tbl.defProj);
1310                                 be_emit_finish_line_gas(env, NULL);
1311                         }
1312                         be_emit_cstring(env, ".long ");
1313                         ia32_emit_cfop_target(env, tbl.branches[i].target);
1314                         be_emit_finish_line_gas(env, NULL);
1315                 }
1316                 be_gas_emit_switch_section(env->emit, GAS_SECTION_TEXT);
1317         } else {
1318                 /* one jump is enough */
1319                 be_emit_cstring(env, "\tjmp ");
1320                 ia32_emit_cfop_target(env, tbl.branches[0].target);
1321                 be_emit_finish_line_gas(env, node);
1322         }
1323
1324         if (tbl.label)
1325                 free(tbl.label);
1326         if (tbl.branches)
1327                 free(tbl.branches);
1328 }
1329
1330 /**
1331  * Emits code for a unconditional jump.
1332  */
1333 static
1334 void emit_Jmp(ia32_emit_env_t *env, const ir_node *node) {
1335         ir_node *block, *next_block;
1336
1337         /* for now, the code works for scheduled and non-schedules blocks */
1338         block = get_nodes_block(node);
1339
1340         /* we have a block schedule */
1341         next_block = next_blk_sched(block);
1342         if (get_cfop_target_block(node) != next_block) {
1343                 be_emit_cstring(env, "\tjmp ");
1344                 ia32_emit_cfop_target(env, node);
1345         } else {
1346                 be_emit_cstring(env, "\t/* fallthrough to ");
1347                 ia32_emit_cfop_target(env, node);
1348                 be_emit_cstring(env, " */");
1349         }
1350         be_emit_finish_line_gas(env, node);
1351 }
1352
1353 static
1354 void emit_ia32_Immediate(ia32_emit_env_t *env, const ir_node *node)
1355 {
1356         const ia32_immediate_attr_t *attr = get_ia32_immediate_attr_const(node);
1357
1358         be_emit_char(env, '$');
1359         if(attr->symconst != NULL) {
1360                 ident *id = get_entity_ld_ident(attr->symconst);
1361
1362                 if(attr->attr.data.am_sc_sign)
1363                         be_emit_char(env, '-');
1364                 be_emit_ident(env, id);
1365         }
1366         if(attr->symconst == NULL || attr->offset != 0) {
1367                 if(attr->symconst != NULL)
1368                         be_emit_char(env, '+');
1369                 be_emit_irprintf(env->emit, "0x%X", attr->offset);
1370         }
1371 }
1372
1373 static
1374 const char* emit_asm_operand(ia32_emit_env_t *env, const ir_node *node,
1375                              const char *s)
1376 {
1377         const arch_register_t *reg;
1378         const char            *reg_name;
1379         char                   c;
1380         char                   modifier = 0;
1381         int                    num      = -1;
1382         const ia32_attr_t     *attr;
1383         int                    n_outs;
1384         int                    p;
1385
1386         assert(*s == '%');
1387         c = *(++s);
1388
1389         /* parse modifiers */
1390         switch(c) {
1391         case 0:
1392                 ir_fprintf(stderr, "Warning: asm text (%+F) ends with %\n", node);
1393                 be_emit_char(env, '%');
1394                 return s + 1;
1395         case '%':
1396                 be_emit_char(env, '%');
1397                 return s + 1;
1398         case 'w':
1399         case 'b':
1400         case 'h':
1401                 modifier = c;
1402                 ++s;
1403                 break;
1404         case '0':
1405         case '1':
1406         case '2':
1407         case '3':
1408         case '4':
1409         case '5':
1410         case '6':
1411         case '7':
1412         case '8':
1413         case '9':
1414                 break;
1415         default:
1416                 ir_fprintf(stderr, "Warning: asm text (%+F) contains unknown modifier "
1417                            "'%c' for asm op\n", node, c);
1418                 ++s;
1419                 break;
1420         }
1421
1422         /* parse number */
1423         sscanf(s, "%d%n", &num, &p);
1424         if(num < 0) {
1425                 ir_fprintf(stderr, "Warning: Couldn't parse assembler operand (%+F)\n",
1426                            node);
1427                 return s;
1428         } else {
1429                 s += p;
1430         }
1431
1432         /* get register */
1433         attr   = get_ia32_attr_const(node);
1434         n_outs = ARR_LEN(attr->slots);
1435         if(num < n_outs) {
1436                 reg = get_out_reg(env, node, num);
1437         } else {
1438                 ir_node *pred;
1439                 int      in = num - n_outs;
1440                 if(in >= get_irn_arity(node)) {
1441                         ir_fprintf(stderr, "Warning: Invalid input %d specified in asm "
1442                                    "op (%+F)\n", num, node);
1443                         return s;
1444                 }
1445                 pred = get_irn_n(node, in);
1446                 /* might be an immediate value */
1447                 if(is_ia32_Immediate(pred)) {
1448                         emit_ia32_Immediate(env, pred);
1449                         return s;
1450                 }
1451                 reg = get_in_reg(env, node, in);
1452         }
1453         if(reg == NULL) {
1454                 ir_fprintf(stderr, "Warning: no register assigned for %d asm op "
1455                            "(%+F)\n", num, node);
1456                 return s;
1457         }
1458
1459         /* emit it */
1460         be_emit_char(env, '%');
1461         switch(modifier) {
1462         case 0:
1463                 reg_name = arch_register_get_name(reg);
1464                 break;
1465         case 'b':
1466                 reg_name = ia32_get_mapped_reg_name(env->isa->regs_8bit, reg);
1467                 break;
1468         case 'h':
1469                 reg_name = ia32_get_mapped_reg_name(env->isa->regs_8bit_high, reg);
1470                 break;
1471         case 'w':
1472                 reg_name = ia32_get_mapped_reg_name(env->isa->regs_16bit, reg);
1473                 break;
1474         default:
1475                 panic("Invalid asm op modifier");
1476         }
1477         be_emit_string(env, reg_name);
1478
1479         return s;
1480 }
1481
1482 /**
1483  * Emits code for an ASM pseudo op.
1484  */
1485 static
1486 void emit_ia32_Asm(ia32_emit_env_t *env, const ir_node *node)
1487 {
1488         const void            *gen_attr = get_irn_generic_attr_const(node);
1489         const ia32_asm_attr_t *attr
1490                 = CONST_CAST_IA32_ATTR(ia32_asm_attr_t, gen_attr);
1491         ident                 *asm_text = attr->asm_text;
1492         const char            *s        = get_id_str(asm_text);
1493
1494         be_emit_cstring(env, "# Begin ASM \t");
1495         be_emit_finish_line_gas(env, node);
1496
1497         if (s[0] != '\t')
1498                 be_emit_char(env, '\t');
1499
1500         while(*s != 0) {
1501                 if(*s == '%') {
1502                         s = emit_asm_operand(env, node, s);
1503                         continue;
1504                 } else {
1505                         be_emit_char(env, *s);
1506                 }
1507                 ++s;
1508         }
1509
1510         be_emit_char(env, '\n');
1511         be_emit_write_line(env);
1512
1513         be_emit_cstring(env, "# End ASM\n");
1514         be_emit_write_line(env);
1515 }
1516
1517 /**********************************
1518  *   _____                  ____
1519  *  / ____|                |  _ \
1520  * | |     ___  _ __  _   _| |_) |
1521  * | |    / _ \| '_ \| | | |  _ <
1522  * | |___| (_) | |_) | |_| | |_) |
1523  *  \_____\___/| .__/ \__, |____/
1524  *             | |     __/ |
1525  *             |_|    |___/
1526  **********************************/
1527
1528 /**
1529  * Emit movsb/w instructions to make mov count divideable by 4
1530  */
1531 static
1532 void emit_CopyB_prolog(ia32_emit_env_t *env, int rem) {
1533         be_emit_cstring(env, "\tcld");
1534         be_emit_finish_line_gas(env, NULL);
1535
1536         switch(rem) {
1537         case 1:
1538                 be_emit_cstring(env, "\tmovsb");
1539                 be_emit_finish_line_gas(env, NULL);
1540                 break;
1541         case 2:
1542                 be_emit_cstring(env, "\tmovsw");
1543                 be_emit_finish_line_gas(env, NULL);
1544                 break;
1545         case 3:
1546                 be_emit_cstring(env, "\tmovsb");
1547                 be_emit_finish_line_gas(env, NULL);
1548                 be_emit_cstring(env, "\tmovsw");
1549                 be_emit_finish_line_gas(env, NULL);
1550                 break;
1551         }
1552 }
1553
1554 /**
1555  * Emit rep movsd instruction for memcopy.
1556  */
1557 static
1558 void emit_ia32_CopyB(ia32_emit_env_t *env, const ir_node *node) {
1559         int rem = get_ia32_pncode(node);
1560
1561         emit_CopyB_prolog(env, rem);
1562
1563         be_emit_cstring(env, "\trep movsd");
1564         be_emit_finish_line_gas(env, node);
1565 }
1566
1567 /**
1568  * Emits unrolled memcopy.
1569  */
1570 static
1571 void emit_ia32_CopyB_i(ia32_emit_env_t *env, const ir_node *node) {
1572         int size = get_ia32_pncode(node);
1573
1574         emit_CopyB_prolog(env, size & 0x3);
1575
1576         size >>= 2;
1577         while (size--) {
1578                 be_emit_cstring(env, "\tmovsd");
1579                 be_emit_finish_line_gas(env, NULL);
1580         }
1581 }
1582
1583
1584
1585 /***************************
1586  *   _____
1587  *  / ____|
1588  * | |     ___  _ ____   __
1589  * | |    / _ \| '_ \ \ / /
1590  * | |___| (_) | | | \ V /
1591  *  \_____\___/|_| |_|\_/
1592  *
1593  ***************************/
1594
1595 /**
1596  * Emit code for conversions (I, FP), (FP, I) and (FP, FP).
1597  */
1598 static
1599 void emit_ia32_Conv_with_FP(ia32_emit_env_t *env, const ir_node *node) {
1600         ir_mode            *ls_mode = get_ia32_ls_mode(node);
1601         int                 ls_bits = get_mode_size_bits(ls_mode);
1602
1603         be_emit_cstring(env, "\tcvt");
1604
1605         if(is_ia32_Conv_I2FP(node)) {
1606                 if(ls_bits == 32) {
1607                         be_emit_cstring(env, "si2ss");
1608                 } else {
1609                         be_emit_cstring(env, "si2sd");
1610                 }
1611         } else if(is_ia32_Conv_FP2I(node)) {
1612                 if(ls_bits == 32) {
1613                         be_emit_cstring(env, "ss2si");
1614                 } else {
1615                         be_emit_cstring(env, "sd2si");
1616                 }
1617         } else {
1618                 assert(is_ia32_Conv_FP2FP(node));
1619                 if(ls_bits == 32) {
1620                         be_emit_cstring(env, "sd2ss");
1621                 } else {
1622                         be_emit_cstring(env, "ss2sd");
1623                 }
1624         }
1625         be_emit_char(env, ' ');
1626
1627         switch(get_ia32_op_type(node)) {
1628                 case ia32_Normal:
1629                         ia32_emit_source_register(env, node, n_ia32_unary_op);
1630                         be_emit_cstring(env, ", ");
1631                         ia32_emit_dest_register(env, node, 0);
1632                         break;
1633                 case ia32_AddrModeS:
1634                         ia32_emit_dest_register(env, node, 0);
1635                         be_emit_cstring(env, ", ");
1636                         ia32_emit_am(env, node);
1637                         break;
1638                 default:
1639                         assert(0 && "unsupported op type for Conv");
1640         }
1641         be_emit_finish_line_gas(env, node);
1642 }
1643
1644 static
1645 void emit_ia32_Conv_I2FP(ia32_emit_env_t *env, const ir_node *node) {
1646         emit_ia32_Conv_with_FP(env, node);
1647 }
1648
1649 static
1650 void emit_ia32_Conv_FP2I(ia32_emit_env_t *env, const ir_node *node) {
1651         emit_ia32_Conv_with_FP(env, node);
1652 }
1653
1654 static
1655 void emit_ia32_Conv_FP2FP(ia32_emit_env_t *env, const ir_node *node) {
1656         emit_ia32_Conv_with_FP(env, node);
1657 }
1658
1659 /**
1660  * Emits code for an Int conversion.
1661  */
1662 static
1663 void emit_ia32_Conv_I2I(ia32_emit_env_t *env, const ir_node *node) {
1664         const char *sign_suffix;
1665         ir_mode *smaller_mode = get_ia32_ls_mode(node);
1666         int smaller_bits = get_mode_size_bits(smaller_mode);
1667         int signed_mode;
1668         const arch_register_t *in_reg, *out_reg;
1669
1670         assert(!mode_is_float(smaller_mode));
1671         assert(smaller_bits == 8 || smaller_bits == 16 || smaller_bits == 32);
1672
1673         signed_mode = mode_is_signed(smaller_mode);
1674         if(smaller_bits == 32) {
1675                 // this should not happen as it's no convert
1676                 assert(0);
1677                 sign_suffix = "";
1678         } else {
1679                 sign_suffix = signed_mode ? "s" : "z";
1680         }
1681
1682         switch(get_ia32_op_type(node)) {
1683                 case ia32_Normal:
1684                         in_reg  = get_in_reg(env, node, n_ia32_unary_op);
1685                         out_reg = get_out_reg(env, node, 0);
1686
1687                         if (in_reg  == &ia32_gp_regs[REG_EAX] &&
1688                                 out_reg == &ia32_gp_regs[REG_EAX] &&
1689                                 signed_mode &&
1690                                 smaller_bits == 16)
1691                         {
1692                                 /* argument and result are both in EAX and */
1693                                 /* signedness is ok: -> use the smaller cwtl opcode */
1694                                 be_emit_cstring(env, "\tcwtl");
1695                         } else {
1696                                 const char *sreg = ia32_get_reg_name_for_mode(env, smaller_mode, in_reg);
1697
1698                                 be_emit_cstring(env, "\tmov");
1699                                 be_emit_string(env, sign_suffix);
1700                                 ia32_emit_mode_suffix_mode(env, smaller_mode);
1701                                 be_emit_cstring(env, "l %");
1702                                 be_emit_string(env, sreg);
1703                                 be_emit_cstring(env, ", ");
1704                                 ia32_emit_dest_register(env, node, 0);
1705                         }
1706                         break;
1707                 case ia32_AddrModeS: {
1708                         be_emit_cstring(env, "\tmov");
1709                         be_emit_string(env, sign_suffix);
1710                         ia32_emit_mode_suffix_mode(env, smaller_mode);
1711                         be_emit_cstring(env, "l ");
1712                         ia32_emit_am(env, node);
1713                         be_emit_cstring(env, ", ");
1714                         ia32_emit_dest_register(env, node, 0);
1715                         break;
1716                 }
1717                 default:
1718                         assert(0 && "unsupported op type for Conv");
1719         }
1720         be_emit_finish_line_gas(env, node);
1721 }
1722
1723 /**
1724  * Emits code for an 8Bit Int conversion.
1725  */
1726 void emit_ia32_Conv_I2I8Bit(ia32_emit_env_t *env, const ir_node *node) {
1727         emit_ia32_Conv_I2I(env, node);
1728 }
1729
1730
1731 /*******************************************
1732  *  _                          _
1733  * | |                        | |
1734  * | |__   ___ _ __   ___   __| | ___  ___
1735  * | '_ \ / _ \ '_ \ / _ \ / _` |/ _ \/ __|
1736  * | |_) |  __/ | | | (_) | (_| |  __/\__ \
1737  * |_.__/ \___|_| |_|\___/ \__,_|\___||___/
1738  *
1739  *******************************************/
1740
1741 /**
1742  * Emits a backend call
1743  */
1744 static
1745 void emit_be_Call(ia32_emit_env_t *env, const ir_node *node) {
1746         ir_entity *ent = be_Call_get_entity(node);
1747
1748         be_emit_cstring(env, "\tcall ");
1749         if (ent) {
1750                 set_entity_backend_marked(ent, 1);
1751                 be_emit_string(env, get_entity_ld_name(ent));
1752         } else {
1753                 be_emit_char(env, '*');
1754                 ia32_emit_dest_register(env, get_irn_n(node, be_pos_Call_ptr), 0);
1755         }
1756         be_emit_finish_line_gas(env, node);
1757 }
1758
1759 /**
1760  * Emits code to increase stack pointer.
1761  */
1762 static
1763 void emit_be_IncSP(ia32_emit_env_t *env, const ir_node *node) {
1764         int offs = be_get_IncSP_offset(node);
1765
1766         if (offs == 0)
1767                 return;
1768
1769         if (offs > 0) {
1770                 be_emit_cstring(env, "\tsubl $");
1771                 be_emit_irprintf(env->emit, "%u, ", offs);
1772                 ia32_emit_source_register(env, node, 0);
1773         } else {
1774                 be_emit_cstring(env, "\taddl $");
1775                 be_emit_irprintf(env->emit, "%u, ", -offs);
1776                 ia32_emit_source_register(env, node, 0);
1777         }
1778         be_emit_finish_line_gas(env, node);
1779 }
1780
1781 /**
1782  * Emits code to set stack pointer.
1783  */
1784 static
1785 void emit_be_SetSP(ia32_emit_env_t *env, const ir_node *node) {
1786         be_emit_cstring(env, "\tmovl ");
1787         ia32_emit_source_register(env, node, 2);
1788         be_emit_cstring(env, ", ");
1789         ia32_emit_dest_register(env, node, 0);
1790         be_emit_finish_line_gas(env, node);
1791 }
1792
1793 /**
1794  * Emits code for Copy/CopyKeep.
1795  */
1796 static
1797 void Copy_emitter(ia32_emit_env_t *env, const ir_node *node, const ir_node *op)
1798 {
1799         const arch_env_t      *arch_env = env->arch_env;
1800         const arch_register_t *in       = arch_get_irn_register(arch_env, op);
1801         const arch_register_t *out      = arch_get_irn_register(arch_env, node);
1802         ir_mode *mode;
1803
1804         if(in == out) {
1805                 return;
1806         }
1807         if(is_unknown_reg(in))
1808                 return;
1809         /* copies of vf nodes aren't real... */
1810         if(arch_register_get_class(in) == &ia32_reg_classes[CLASS_ia32_vfp])
1811                 return;
1812
1813         mode = get_irn_mode(node);
1814         if (mode == mode_E) {
1815                 be_emit_cstring(env, "\tmovsd ");
1816                 ia32_emit_register(env, in);
1817                 be_emit_cstring(env, ", ");
1818                 ia32_emit_register(env, out);
1819         } else {
1820                 be_emit_cstring(env, "\tmovl ");
1821                 ia32_emit_register(env, in);
1822                 be_emit_cstring(env, ", ");
1823                 ia32_emit_register(env, out);
1824         }
1825         be_emit_finish_line_gas(env, node);
1826 }
1827
1828 static
1829 void emit_be_Copy(ia32_emit_env_t *env, const ir_node *node) {
1830         Copy_emitter(env, node, be_get_Copy_op(node));
1831 }
1832
1833 static
1834 void emit_be_CopyKeep(ia32_emit_env_t *env, const ir_node *node) {
1835         Copy_emitter(env, node, be_get_CopyKeep_op(node));
1836 }
1837
1838 /**
1839  * Emits code for exchange.
1840  */
1841 static
1842 void emit_be_Perm(ia32_emit_env_t *env, const ir_node *node) {
1843         const arch_register_t *in1, *in2;
1844         const arch_register_class_t *cls1, *cls2;
1845
1846         in1 = arch_get_irn_register(env->arch_env, get_irn_n(node, 0));
1847         in2 = arch_get_irn_register(env->arch_env, get_irn_n(node, 1));
1848
1849         cls1 = arch_register_get_class(in1);
1850         cls2 = arch_register_get_class(in2);
1851
1852         assert(cls1 == cls2 && "Register class mismatch at Perm");
1853
1854         if (cls1 == &ia32_reg_classes[CLASS_ia32_gp]) {
1855                 be_emit_cstring(env, "\txchg ");
1856                 ia32_emit_source_register(env, node, 1);
1857                 be_emit_cstring(env, ", ");
1858                 ia32_emit_source_register(env, node, 0);
1859                 be_emit_finish_line_gas(env, node);
1860         } else if (cls1 == &ia32_reg_classes[CLASS_ia32_xmm]) {
1861                 be_emit_cstring(env, "\txorpd ");
1862                 ia32_emit_source_register(env, node, 1);
1863                 be_emit_cstring(env, ", ");
1864                 ia32_emit_source_register(env, node, 0);
1865                 be_emit_finish_line_gas(env, NULL);
1866
1867                 be_emit_cstring(env, "\txorpd ");
1868                 ia32_emit_source_register(env, node, 0);
1869                 be_emit_cstring(env, ", ");
1870                 ia32_emit_source_register(env, node, 1);
1871                 be_emit_finish_line_gas(env, NULL);
1872
1873                 be_emit_cstring(env, "\txorpd ");
1874                 ia32_emit_source_register(env, node, 1);
1875                 be_emit_cstring(env, ", ");
1876                 ia32_emit_source_register(env, node, 0);
1877                 be_emit_finish_line_gas(env, node);
1878         } else if (cls1 == &ia32_reg_classes[CLASS_ia32_vfp]) {
1879                 /* is a NOP */
1880         } else if (cls1 == &ia32_reg_classes[CLASS_ia32_st]) {
1881                 /* is a NOP */
1882         }
1883 }
1884
1885 /**
1886  * Emits code for Constant loading.
1887  */
1888 static
1889 void emit_ia32_Const(ia32_emit_env_t *env, const ir_node *node) {
1890         const ia32_immediate_attr_t *attr = get_ia32_immediate_attr_const(node);
1891
1892         /* a zero? */
1893         if(attr->symconst == NULL && attr->offset == 0) {
1894                 if (env->isa->opt_arch == arch_pentium_4) {
1895                         /* P4 prefers sub r, r, others xor r, r */
1896                         be_emit_cstring(env, "\tsubl ");
1897                 } else {
1898                         be_emit_cstring(env, "\txorl ");
1899                 }
1900                 ia32_emit_dest_register(env, node, 0);
1901                 be_emit_cstring(env, ", ");
1902                 ia32_emit_dest_register(env, node, 0);
1903         } else {
1904                 be_emit_cstring(env, "\tmovl ");
1905                 emit_ia32_Immediate(env, node);
1906                 be_emit_cstring(env, ", ");
1907                 ia32_emit_dest_register(env, node, 0);
1908         }
1909
1910         be_emit_finish_line_gas(env, node);
1911 }
1912
1913 /**
1914  * Emits code to load the TLS base
1915  */
1916 static
1917 void emit_ia32_LdTls(ia32_emit_env_t *env, const ir_node *node) {
1918         be_emit_cstring(env, "\tmovl %gs:0, ");
1919         ia32_emit_dest_register(env, node, 0);
1920         be_emit_finish_line_gas(env, node);
1921 }
1922
1923 /* helper function for emit_ia32_Minus64Bit */
1924 static void emit_mov(ia32_emit_env_t *env, const ir_node* node, const arch_register_t *src, const arch_register_t *dst)
1925 {
1926         be_emit_cstring(env, "\tmovl ");
1927         ia32_emit_register(env, src);
1928         be_emit_cstring(env, ", ");
1929         ia32_emit_register(env, dst);
1930         be_emit_finish_line_gas(env, node);
1931 }
1932
1933 /* helper function for emit_ia32_Minus64Bit */
1934 static void emit_neg(ia32_emit_env_t *env, const ir_node* node, const arch_register_t *reg)
1935 {
1936         be_emit_cstring(env, "\tnegl ");
1937         ia32_emit_register(env, reg);
1938         be_emit_finish_line_gas(env, node);
1939 }
1940
1941 /* helper function for emit_ia32_Minus64Bit */
1942 static void emit_sbb0(ia32_emit_env_t *env, const ir_node* node, const arch_register_t *reg)
1943 {
1944         be_emit_cstring(env, "\tsbbl $0, ");
1945         ia32_emit_register(env, reg);
1946         be_emit_finish_line_gas(env, node);
1947 }
1948
1949 /* helper function for emit_ia32_Minus64Bit */
1950 static void emit_sbb(ia32_emit_env_t *env, const ir_node* node, const arch_register_t *src, const arch_register_t *dst)
1951 {
1952         be_emit_cstring(env, "\tsbbl ");
1953         ia32_emit_register(env, src);
1954         be_emit_cstring(env, ", ");
1955         ia32_emit_register(env, dst);
1956         be_emit_finish_line_gas(env, node);
1957 }
1958
1959 /* helper function for emit_ia32_Minus64Bit */
1960 static void emit_xchg(ia32_emit_env_t *env, const ir_node* node, const arch_register_t *src, const arch_register_t *dst)
1961 {
1962         be_emit_cstring(env, "\txchgl ");
1963         ia32_emit_register(env, src);
1964         be_emit_cstring(env, ", ");
1965         ia32_emit_register(env, dst);
1966         be_emit_finish_line_gas(env, node);
1967 }
1968
1969 /* helper function for emit_ia32_Minus64Bit */
1970 static void emit_zero(ia32_emit_env_t *env, const ir_node* node, const arch_register_t *reg)
1971 {
1972         if (env->isa->opt_arch == arch_pentium_4) {
1973                 /* P4 prefers sub r, r, others xor r, r */
1974                 be_emit_cstring(env, "\tsubl ");
1975         } else {
1976                 be_emit_cstring(env, "\txorl ");
1977         }
1978         ia32_emit_register(env, reg);
1979         be_emit_cstring(env, ", ");
1980         ia32_emit_register(env, reg);
1981         be_emit_finish_line_gas(env, node);
1982 }
1983
1984 static void emit_ia32_Minus64Bit(ia32_emit_env_t *env, const ir_node *node)
1985 {
1986         const arch_register_t *in_lo  = get_in_reg( env, node, 0);
1987         const arch_register_t *in_hi  = get_in_reg( env, node, 1);
1988         const arch_register_t *out_lo = get_out_reg(env, node, 0);
1989         const arch_register_t *out_hi = get_out_reg(env, node, 1);
1990
1991         if (out_lo == in_lo) {
1992                 if (out_hi != in_hi) {
1993                         /* a -> a, b -> d */
1994                         goto zero_neg;
1995                 } else {
1996                         /* a -> a, b -> b */
1997                         goto normal_neg;
1998                 }
1999         } else if (out_lo == in_hi) {
2000                 if (out_hi == in_lo) {
2001                         /* a -> b, b -> a */
2002                         emit_xchg(env, node, in_lo, in_hi);
2003                         goto normal_neg;
2004                 } else {
2005                         /* a -> b, b -> d */
2006                         emit_mov(env, node, in_hi, out_hi);
2007                         emit_mov(env, node, in_lo, out_lo);
2008                         goto normal_neg;
2009                 }
2010         } else {
2011                 if (out_hi == in_lo) {
2012                         /* a -> c, b -> a */
2013                         emit_mov(env, node, in_lo, out_lo);
2014                         goto zero_neg;
2015                 } else if (out_hi == in_hi) {
2016                         /* a -> c, b -> b */
2017                         emit_mov(env, node, in_lo, out_lo);
2018                         goto normal_neg;
2019                 } else {
2020                         /* a -> c, b -> d */
2021                         emit_mov(env, node, in_lo, out_lo);
2022                         goto zero_neg;
2023                 }
2024         }
2025
2026 normal_neg:
2027         emit_neg( env, node, out_hi);
2028         emit_neg( env, node, out_lo);
2029         emit_sbb0(env, node, out_hi);
2030         return;
2031
2032 zero_neg:
2033         emit_zero(env, node, out_hi);
2034         emit_neg( env, node, out_lo);
2035         emit_sbb( env, node, in_hi, out_hi);
2036 }
2037
2038 static
2039 void emit_be_Return(ia32_emit_env_t *env, const ir_node *node)
2040 {
2041         be_emit_cstring(env, "\tret");
2042         be_emit_finish_line_gas(env, node);
2043 }
2044
2045 static
2046 void emit_Nothing(ia32_emit_env_t *env, const ir_node *node)
2047 {
2048         (void) env;
2049         (void) node;
2050 }
2051
2052
2053 /***********************************************************************************
2054  *                  _          __                                             _
2055  *                 (_)        / _|                                           | |
2056  *  _ __ ___   __ _ _ _ __   | |_ _ __ __ _ _ __ ___   _____      _____  _ __| | __
2057  * | '_ ` _ \ / _` | | '_ \  |  _| '__/ _` | '_ ` _ \ / _ \ \ /\ / / _ \| '__| |/ /
2058  * | | | | | | (_| | | | | | | | | | | (_| | | | | | |  __/\ V  V / (_) | |  |   <
2059  * |_| |_| |_|\__,_|_|_| |_| |_| |_|  \__,_|_| |_| |_|\___| \_/\_/ \___/|_|  |_|\_\
2060  *
2061  ***********************************************************************************/
2062
2063 /**
2064  * Enters the emitter functions for handled nodes into the generic
2065  * pointer of an opcode.
2066  */
2067 static
2068 void ia32_register_emitters(void) {
2069
2070 #define IA32_EMIT2(a,b) op_ia32_##a->ops.generic = (op_func)emit_ia32_##b
2071 #define IA32_EMIT(a)    IA32_EMIT2(a,a)
2072 #define EMIT(a)         op_##a->ops.generic = (op_func)emit_##a
2073 #define IGN(a)                  op_##a->ops.generic = (op_func)emit_Nothing
2074 #define BE_EMIT(a)      op_be_##a->ops.generic = (op_func)emit_be_##a
2075 #define BE_IGN(a)               op_be_##a->ops.generic = (op_func)emit_Nothing
2076
2077         /* first clear the generic function pointer for all ops */
2078         clear_irp_opcodes_generic_func();
2079
2080         /* register all emitter functions defined in spec */
2081         ia32_register_spec_emitters();
2082
2083         /* other ia32 emitter functions */
2084         IA32_EMIT(Asm);
2085         IA32_EMIT(CmpJmp);
2086         IA32_EMIT2(CmpJmp8Bit, CmpJmp);
2087         IA32_EMIT(TestJmp);
2088         IA32_EMIT2(TestJmp8Bit, TestJmp);
2089         IA32_EMIT(CmpCMov);
2090         IA32_EMIT2(CmpCMov8Bit, CmpCMov);
2091         IA32_EMIT(TestCMov);
2092         IA32_EMIT2(TestCMov8Bit, TestCMov);
2093         IA32_EMIT(CmpSet);
2094         IA32_EMIT2(CmpSet8Bit, CmpSet);
2095         IA32_EMIT(TestSet);
2096         IA32_EMIT2(TestSet8Bit, TestSet);
2097         IA32_EMIT(SwitchJmp);
2098         IA32_EMIT(CopyB);
2099         IA32_EMIT(CopyB_i);
2100         IA32_EMIT(Conv_I2FP);
2101         IA32_EMIT(Conv_FP2I);
2102         IA32_EMIT(Conv_FP2FP);
2103         IA32_EMIT(Conv_I2I);
2104         IA32_EMIT(Conv_I2I8Bit);
2105         IA32_EMIT(Const);
2106         IA32_EMIT(LdTls);
2107         IA32_EMIT(Minus64Bit);
2108         IA32_EMIT(xCmp);
2109         IA32_EMIT(xCmpSet);
2110         IA32_EMIT(xCmpCMov);
2111         IA32_EMIT(xCmpJmp);
2112         IA32_EMIT2(fcomJmp, x87CmpJmp);
2113         IA32_EMIT2(fcompJmp, x87CmpJmp);
2114         IA32_EMIT2(fcomppJmp, x87CmpJmp);
2115         IA32_EMIT2(fcomrJmp, x87CmpJmp);
2116         IA32_EMIT2(fcomrpJmp, x87CmpJmp);
2117         IA32_EMIT2(fcomrppJmp, x87CmpJmp);
2118
2119         /* benode emitter */
2120         BE_EMIT(Call);
2121         BE_EMIT(IncSP);
2122         BE_EMIT(SetSP);
2123         BE_EMIT(Copy);
2124         BE_EMIT(CopyKeep);
2125         BE_EMIT(Perm);
2126         BE_EMIT(Return);
2127
2128         BE_IGN(RegParams);
2129         BE_IGN(Barrier);
2130         BE_IGN(Keep);
2131
2132         /* firm emitter */
2133         EMIT(Jmp);
2134         IGN(Proj);
2135         IGN(Phi);
2136         IGN(Start);
2137
2138 #undef BE_EMIT
2139 #undef EMIT
2140 #undef IGN
2141 #undef IA32_EMIT2
2142 #undef IA32_EMIT
2143 }
2144
2145 static const char *last_name = NULL;
2146 static unsigned last_line = -1;
2147 static unsigned num = -1;
2148
2149 /**
2150  * Emit the debug support for node node.
2151  */
2152 static
2153 void ia32_emit_dbg(ia32_emit_env_t *env, const ir_node *node) {
2154         dbg_info *db = get_irn_dbg_info(node);
2155         unsigned lineno;
2156         const char *fname = be_retrieve_dbg_info(db, &lineno);
2157
2158         if (! env->cg->birg->main_env->options->stabs_debug_support)
2159                 return;
2160
2161         if (fname) {
2162                 if (last_name != fname) {
2163                         last_line = -1;
2164                         be_dbg_include_begin(env->cg->birg->main_env->db_handle, fname);
2165                         last_name = fname;
2166                 }
2167                 if (last_line != lineno) {
2168                         char name[64];
2169
2170                         snprintf(name, sizeof(name), ".LM%u", ++num);
2171                         last_line = lineno;
2172                         be_dbg_line(env->cg->birg->main_env->db_handle, lineno, name);
2173                         be_emit_string(env, name);
2174                         be_emit_cstring(env, ":\n");
2175                         be_emit_write_line(env);
2176                 }
2177         }
2178 }
2179
2180 typedef void (*emit_func_ptr) (ia32_emit_env_t *, const ir_node *);
2181
2182 /**
2183  * Emits code for a node.
2184  */
2185 static
2186 void ia32_emit_node(ia32_emit_env_t *env, const ir_node *node) {
2187         ir_op *op = get_irn_op(node);
2188
2189         DBG((dbg, LEVEL_1, "emitting code for %+F\n", node));
2190
2191         if (op->ops.generic) {
2192                 emit_func_ptr func = (emit_func_ptr) op->ops.generic;
2193                 ia32_emit_dbg(env, node);
2194                 (*func) (env, node);
2195         } else {
2196                 emit_Nothing(env, node);
2197                 ir_fprintf(stderr, "Error: No emit handler for node %+F (%+G, graph %+F)\n", node, node, current_ir_graph);
2198                 abort();
2199         }
2200 }
2201
2202 /**
2203  * Emits gas alignment directives
2204  */
2205 static
2206 void ia32_emit_alignment(ia32_emit_env_t *env, unsigned align, unsigned skip) {
2207         be_emit_cstring(env, "\t.p2align ");
2208         be_emit_irprintf(env->emit, "%u,,%u\n", align, skip);
2209         be_emit_write_line(env);
2210 }
2211
2212 /**
2213  * Emits gas alignment directives for Functions depended on cpu architecture.
2214  */
2215 static
2216 void ia32_emit_align_func(ia32_emit_env_t *env, cpu_support cpu) {
2217         unsigned align;
2218         unsigned maximum_skip;
2219
2220         switch (cpu) {
2221                 case arch_i386:
2222                         align = 2;
2223                         break;
2224                 case arch_i486:
2225                         align = 4;
2226                         break;
2227                 case arch_k6:
2228                         align = 5;
2229                         break;
2230                 default:
2231                         align = 4;
2232         }
2233         maximum_skip = (1 << align) - 1;
2234         ia32_emit_alignment(env, align, maximum_skip);
2235 }
2236
2237 /**
2238  * Emits gas alignment directives for Labels depended on cpu architecture.
2239  */
2240 static
2241 void ia32_emit_align_label(ia32_emit_env_t *env, cpu_support cpu) {
2242         unsigned align; unsigned maximum_skip;
2243
2244         switch (cpu) {
2245                 case arch_i386:
2246                         align = 2;
2247                         break;
2248                 case arch_i486:
2249                         align = 4;
2250                         break;
2251                 case arch_k6:
2252                         align = 5;
2253                         break;
2254                 default:
2255                         align = 4;
2256         }
2257         maximum_skip = (1 << align) - 1;
2258         ia32_emit_alignment(env, align, maximum_skip);
2259 }
2260
2261 /**
2262  * Test wether a block should be aligned.
2263  * For cpus in the P4/Athlon class it is usefull to align jump labels to
2264  * 16 bytes. However we should only do that if the alignment nops before the
2265  * label aren't executed more often than we have jumps to the label.
2266  */
2267 static
2268 int should_align_block(ia32_emit_env_t *env, ir_node *block, ir_node *prev) {
2269         static const double DELTA = .0001;
2270         ir_exec_freq *exec_freq = env->cg->birg->exec_freq;
2271         double        block_freq;
2272         double        prev_freq = 0;  /**< execfreq of the fallthrough block */
2273         double        jmp_freq  = 0;  /**< execfreq of all non-fallthrough blocks */
2274         cpu_support   cpu       = env->isa->opt_arch;
2275         int           i, n_cfgpreds;
2276
2277         if(exec_freq == NULL)
2278                 return 0;
2279         if(cpu == arch_i386 || cpu == arch_i486)
2280                 return 0;
2281
2282         block_freq = get_block_execfreq(exec_freq, block);
2283         if(block_freq < DELTA)
2284                 return 0;
2285
2286         n_cfgpreds = get_Block_n_cfgpreds(block);
2287         for(i = 0; i < n_cfgpreds; ++i) {
2288                 ir_node *pred      = get_Block_cfgpred_block(block, i);
2289                 double   pred_freq = get_block_execfreq(exec_freq, pred);
2290
2291                 if(pred == prev) {
2292                         prev_freq += pred_freq;
2293                 } else {
2294                         jmp_freq  += pred_freq;
2295                 }
2296         }
2297
2298         if(prev_freq < DELTA && !(jmp_freq < DELTA))
2299                 return 1;
2300
2301         jmp_freq /= prev_freq;
2302
2303         switch (cpu) {
2304                 case arch_athlon:
2305                 case arch_athlon_64:
2306                 case arch_k6:
2307                         return jmp_freq > 3;
2308                 default:
2309                         return jmp_freq > 2;
2310         }
2311 }
2312
2313 static
2314 void ia32_emit_block_header(ia32_emit_env_t *env, ir_node *block, ir_node *prev)
2315 {
2316         int           n_cfgpreds;
2317         int           need_label;
2318         int           i, arity;
2319         ir_exec_freq  *exec_freq = env->cg->birg->exec_freq;
2320
2321         n_cfgpreds = get_Block_n_cfgpreds(block);
2322         need_label = (n_cfgpreds != 0);
2323
2324         if (should_align_block(env, block, prev)) {
2325                 assert(need_label);
2326                 ia32_emit_align_label(env, env->isa->opt_arch);
2327         }
2328
2329         if(need_label) {
2330                 ia32_emit_block_name(env, block);
2331                 be_emit_char(env, ':');
2332
2333                 be_emit_pad_comment(env);
2334                 be_emit_cstring(env, "   /* preds:");
2335
2336                 /* emit list of pred blocks in comment */
2337                 arity = get_irn_arity(block);
2338                 for (i = 0; i < arity; ++i) {
2339                         ir_node *predblock = get_Block_cfgpred_block(block, i);
2340                         be_emit_irprintf(env->emit, " %d", get_irn_node_nr(predblock));
2341                 }
2342         } else {
2343                 be_emit_cstring(env, "\t/* ");
2344                 ia32_emit_block_name(env, block);
2345                 be_emit_cstring(env, ": ");
2346         }
2347         if (exec_freq != NULL) {
2348                 be_emit_irprintf(env->emit, " freq: %f",
2349                                  get_block_execfreq(exec_freq, block));
2350         }
2351         be_emit_cstring(env, " */\n");
2352         be_emit_write_line(env);
2353 }
2354
2355 /**
2356  * Walks over the nodes in a block connected by scheduling edges
2357  * and emits code for each node.
2358  */
2359 static
2360 void ia32_gen_block(ia32_emit_env_t *env, ir_node *block, ir_node *last_block)
2361 {
2362         const ir_node *node;
2363
2364         ia32_emit_block_header(env, block, last_block);
2365
2366         /* emit the contents of the block */
2367         ia32_emit_dbg(env, block);
2368         sched_foreach(block, node) {
2369                 ia32_emit_node(env, node);
2370         }
2371 }
2372
2373 /**
2374  * Emits code for function start.
2375  */
2376 static
2377 void ia32_emit_func_prolog(ia32_emit_env_t *env, ir_graph *irg) {
2378         ir_entity  *irg_ent  = get_irg_entity(irg);
2379         const char *irg_name = get_entity_ld_name(irg_ent);
2380         cpu_support cpu      = env->isa->opt_arch;
2381         const be_irg_t *birg = env->cg->birg;
2382
2383         be_emit_write_line(env);
2384         be_gas_emit_switch_section(env->emit, GAS_SECTION_TEXT);
2385         be_dbg_method_begin(birg->main_env->db_handle, irg_ent, be_abi_get_stack_layout(birg->abi));
2386         ia32_emit_align_func(env, cpu);
2387         if (get_entity_visibility(irg_ent) == visibility_external_visible) {
2388                 be_emit_cstring(env, ".global ");
2389                 be_emit_string(env, irg_name);
2390                 be_emit_char(env, '\n');
2391                 be_emit_write_line(env);
2392         }
2393         ia32_emit_function_object(env, irg_name);
2394         be_emit_string(env, irg_name);
2395         be_emit_cstring(env, ":\n");
2396         be_emit_write_line(env);
2397 }
2398
2399 /**
2400  * Emits code for function end
2401  */
2402 static
2403 void ia32_emit_func_epilog(ia32_emit_env_t *env, ir_graph *irg) {
2404         const char *irg_name = get_entity_ld_name(get_irg_entity(irg));
2405         const be_irg_t *birg = env->cg->birg;
2406
2407         ia32_emit_function_size(env, irg_name);
2408         be_dbg_method_end(birg->main_env->db_handle);
2409         be_emit_char(env, '\n');
2410         be_emit_write_line(env);
2411 }
2412
2413 /**
2414  * Block-walker:
2415  * Sets labels for control flow nodes (jump target)
2416  */
2417 static
2418 void ia32_gen_labels(ir_node *block, void *data)
2419 {
2420         ir_node *pred;
2421         int n = get_Block_n_cfgpreds(block);
2422         (void) data;
2423
2424         for (n--; n >= 0; n--) {
2425                 pred = get_Block_cfgpred(block, n);
2426                 set_irn_link(pred, block);
2427         }
2428 }
2429
2430 /**
2431  * Emit an exception label if the current instruction can fail.
2432  */
2433 void ia32_emit_exc_label(ia32_emit_env_t *env, const ir_node *node) {
2434         if (get_ia32_exc_label(node)) {
2435                 be_emit_irprintf(env->emit, ".EXL%u\n", 0);
2436                 be_emit_write_line(env);
2437         }
2438 }
2439
2440 /**
2441  * Main driver. Emits the code for one routine.
2442  */
2443 void ia32_gen_routine(ia32_code_gen_t *cg, ir_graph *irg) {
2444         ia32_emit_env_t env;
2445         ir_node *block;
2446         ir_node *last_block = NULL;
2447         int i, n;
2448
2449         env.isa      = (ia32_isa_t *)cg->arch_env->isa;
2450         env.emit     = &env.isa->emit;
2451         env.arch_env = cg->arch_env;
2452         env.cg       = cg;
2453
2454         ia32_register_emitters();
2455
2456         ia32_emit_func_prolog(&env, irg);
2457         irg_block_walk_graph(irg, ia32_gen_labels, NULL, &env);
2458
2459         n = ARR_LEN(cg->blk_sched);
2460         for (i = 0; i < n;) {
2461                 ir_node *next_bl;
2462
2463                 block   = cg->blk_sched[i];
2464                 ++i;
2465                 next_bl = i < n ? cg->blk_sched[i] : NULL;
2466
2467                 /* set here the link. the emitter expects to find the next block here */
2468                 set_irn_link(block, next_bl);
2469                 ia32_gen_block(&env, block, last_block);
2470                 last_block = block;
2471         }
2472
2473         ia32_emit_func_epilog(&env, irg);
2474 }
2475
2476 void ia32_init_emitter(void)
2477 {
2478         FIRM_DBG_REGISTER(dbg, "firm.be.ia32.emitter");
2479 }