fix sse/x87 fixup code added at wrong places
[libfirm] / ir / be / ia32 / ia32_emitter.c
1 /*
2  * Copyright (C) 1995-2007 University of Karlsruhe.  All right reserved.
3  *
4  * This file is part of libFirm.
5  *
6  * This file may be distributed and/or modified under the terms of the
7  * GNU General Public License version 2 as published by the Free Software
8  * Foundation and appearing in the file LICENSE.GPL included in the
9  * packaging of this file.
10  *
11  * Licensees holding valid libFirm Professional Edition licenses may use
12  * this file in accordance with the libFirm Commercial License.
13  * Agreement provided with the Software.
14  *
15  * This file is provided AS IS with NO WARRANTY OF ANY KIND, INCLUDING THE
16  * WARRANTY OF DESIGN, MERCHANTABILITY AND FITNESS FOR A PARTICULAR
17  * PURPOSE.
18  */
19
20 /**
21  * @file
22  * @brief       This file implements the ia32 node emitter.
23  * @author      Christian Wuerdig, Matthias Braun
24  * @version     $Id$
25  */
26 #ifdef HAVE_CONFIG_H
27 #include "config.h"
28 #endif
29
30 #include <limits.h>
31
32 #include "xmalloc.h"
33 #include "tv.h"
34 #include "iredges.h"
35 #include "debug.h"
36 #include "irgwalk.h"
37 #include "irprintf.h"
38 #include "irop_t.h"
39 #include "irargs_t.h"
40 #include "irprog_t.h"
41 #include "iredges_t.h"
42 #include "execfreq.h"
43 #include "error.h"
44 #include "raw_bitset.h"
45
46 #include "../besched_t.h"
47 #include "../benode_t.h"
48 #include "../beabi.h"
49 #include "../be_dbgout.h"
50 #include "../beemitter.h"
51 #include "../begnuas.h"
52 #include "../beirg_t.h"
53
54 #include "ia32_emitter.h"
55 #include "gen_ia32_emitter.h"
56 #include "gen_ia32_regalloc_if.h"
57 #include "ia32_nodes_attr.h"
58 #include "ia32_new_nodes.h"
59 #include "ia32_map_regs.h"
60 #include "bearch_ia32_t.h"
61
62 DEBUG_ONLY(static firm_dbg_module_t *dbg = NULL;)
63
64 #define BLOCK_PREFIX ".L"
65
66 #define SNPRINTF_BUF_LEN 128
67
68 /**
69  * Returns the register at in position pos.
70  */
71 static
72 const arch_register_t *get_in_reg(ia32_emit_env_t *env, const ir_node *irn,
73                                   int pos)
74 {
75         const arch_env_t       *arch_env = env->arch_env;
76         ir_node                *op;
77         const arch_register_t  *reg = NULL;
78
79         assert(get_irn_arity(irn) > pos && "Invalid IN position");
80
81         /* The out register of the operator at position pos is the
82            in register we need. */
83         op = get_irn_n(irn, pos);
84
85         reg = arch_get_irn_register(arch_env, op);
86
87         assert(reg && "no in register found");
88
89         if(reg == &ia32_gp_regs[REG_GP_NOREG])
90                 panic("trying to emit noreg");
91
92         /* in case of unknown register: just return a valid register */
93         if (reg == &ia32_gp_regs[REG_GP_UKNWN]) {
94                 const arch_register_req_t *req;
95
96                 /* ask for the requirements */
97                 req = arch_get_register_req(arch_env, irn, pos);
98
99                 if (arch_register_req_is(req, limited)) {
100                         /* in case of limited requirements: get the first allowed register */
101                         unsigned idx = rbitset_next(req->limited, 0, 1);
102                         reg = arch_register_for_index(req->cls, idx);
103                 } else {
104                         /* otherwise get first register in class */
105                         reg = arch_register_for_index(req->cls, 0);
106                 }
107         }
108
109         return reg;
110 }
111
112 /**
113  * Returns the register at out position pos.
114  */
115 static
116 const arch_register_t *get_out_reg(ia32_emit_env_t *env, const ir_node *irn,
117                                    int pos)
118 {
119         const arch_env_t      *arch_env = env->arch_env;
120         ir_node               *proj;
121         const arch_register_t *reg = NULL;
122
123         /* 1st case: irn is not of mode_T, so it has only                 */
124         /*           one OUT register -> good                             */
125         /* 2nd case: irn is of mode_T -> collect all Projs and ask the    */
126         /*           Proj with the corresponding projnum for the register */
127
128         if (get_irn_mode(irn) != mode_T) {
129                 reg = arch_get_irn_register(arch_env, irn);
130         } else if (is_ia32_irn(irn)) {
131                 reg = get_ia32_out_reg(irn, pos);
132         } else {
133                 const ir_edge_t *edge;
134
135                 foreach_out_edge(irn, edge) {
136                         proj = get_edge_src_irn(edge);
137                         assert(is_Proj(proj) && "non-Proj from mode_T node");
138                         if (get_Proj_proj(proj) == pos) {
139                                 reg = arch_get_irn_register(arch_env, proj);
140                                 break;
141                         }
142                 }
143         }
144
145         assert(reg && "no out register found");
146         return reg;
147 }
148
149 /**
150  * Determine the gnu assembler suffix that indicates a mode
151  */
152 static
153 char get_mode_suffix(const ir_mode *mode) {
154         if(mode_is_float(mode)) {
155                 switch(get_mode_size_bits(mode)) {
156                 case 32:
157                         return 's';
158                 case 64:
159                         return 'l';
160                 case 80:
161                 case 96:
162                         return 't';
163                 }
164         } else {
165                 assert(mode_is_int(mode) || mode_is_reference(mode));
166                 switch(get_mode_size_bits(mode)) {
167                 case 64:
168                         return 'q';
169                 case 32:
170                         return 'l';
171                 case 16:
172                         return 'w';
173                 case 8:
174                         return 'b';
175                 }
176         }
177         panic("Can't output mode_suffix for %+F\n", mode);
178 }
179
180 static
181 int produces_result(const ir_node *node) {
182         return
183                 !is_ia32_CmpSet(node)    &&
184                 !is_ia32_CondJmp(node)   &&
185                 !is_ia32_St(node)        &&
186                 !is_ia32_SwitchJmp(node) &&
187                 !is_ia32_TestJmp(node)   &&
188                 !is_ia32_xCmpSet(node)   &&
189                 !is_ia32_xCondJmp(node)  &&
190                 !is_ia32_CmpCMov(node)   &&
191                 !is_ia32_TestCMov(node)  &&
192                 !is_ia32_CmpSet(node)    && /* this is correct, the Cmp has no result */
193                 !is_ia32_TestSet(node);
194 }
195
196 static
197 const char *ia32_get_reg_name_for_mode(ia32_emit_env_t *env, ir_mode *mode,
198                                        const arch_register_t *reg) {
199         switch(get_mode_size_bits(mode)) {
200                 case 8:
201                         return ia32_get_mapped_reg_name(env->isa->regs_8bit, reg);
202                 case 16:
203                         return ia32_get_mapped_reg_name(env->isa->regs_16bit, reg);
204                 default:
205                         return (char *)arch_register_get_name(reg);
206         }
207 }
208
209 /**
210  * Add a number to a prefix. This number will not be used a second time.
211  */
212 static
213 char *get_unique_label(char *buf, size_t buflen, const char *prefix) {
214         static unsigned long id = 0;
215         snprintf(buf, buflen, "%s%lu", prefix, ++id);
216         return buf;
217 }
218
219 /*************************************************************
220  *             _       _    __   _          _
221  *            (_)     | |  / _| | |        | |
222  *  _ __  _ __ _ _ __ | |_| |_  | |__   ___| |_ __   ___ _ __
223  * | '_ \| '__| | '_ \| __|  _| | '_ \ / _ \ | '_ \ / _ \ '__|
224  * | |_) | |  | | | | | |_| |   | | | |  __/ | |_) |  __/ |
225  * | .__/|_|  |_|_| |_|\__|_|   |_| |_|\___|_| .__/ \___|_|
226  * | |                                       | |
227  * |_|                                       |_|
228  *************************************************************/
229
230 // we have no C++ and can't define an implicit ia32_emit_env_t* cast to
231 // be_emit_env_t* so we cheat a bit...
232 #define be_emit_char(env,c)             be_emit_char(env->emit,c)
233 #define be_emit_string(env,s)           be_emit_string(env->emit,s)
234 #undef be_emit_cstring
235 #define be_emit_cstring(env,x)          { be_emit_string_len(env->emit, x, sizeof(x)-1); }
236 #define be_emit_ident(env,i)            be_emit_ident(env->emit,i)
237 #define be_emit_tarval(env,tv)          be_emit_tarval(env->emit,tv)
238 #define be_emit_write_line(env)         be_emit_write_line(env->emit)
239 #define be_emit_finish_line_gas(env,n)  be_emit_finish_line_gas(env->emit,n)
240 #define be_emit_pad_comment(env)        be_emit_pad_comment(env->emit)
241
242 void ia32_emit_source_register(ia32_emit_env_t *env, const ir_node *node, int pos)
243 {
244         const arch_register_t *reg = get_in_reg(env, node, pos);
245         const char *reg_name = arch_register_get_name(reg);
246
247         assert(pos < get_irn_arity(node));
248
249         be_emit_char(env, '%');
250         be_emit_string(env, reg_name);
251 }
252
253 void ia32_emit_8bit_source_register(ia32_emit_env_t *env, const ir_node *node, int pos)
254 {
255         const arch_register_t *reg = get_in_reg(env, node, pos);
256         const char *reg_name = arch_register_get_name(reg);
257
258         assert(pos < get_irn_arity(node));
259
260         be_emit_char(env, '%');
261         be_emit_char(env, reg_name[1]);
262         be_emit_char(env, 'l');
263 }
264
265 void ia32_emit_16bit_source_register(ia32_emit_env_t *env, const ir_node *node, int pos)
266 {
267         const arch_register_t *reg = get_in_reg(env, node, pos);
268         const char *reg_name = arch_register_get_name(reg);
269
270         assert(pos < get_irn_arity(node));
271
272         be_emit_char(env, '%');
273         be_emit_string(env, &reg_name[1]);
274 }
275
276 void ia32_emit_dest_register(ia32_emit_env_t *env, const ir_node *node, int pos) {
277         const arch_register_t *reg = get_out_reg(env, node, pos);
278         const char *reg_name = arch_register_get_name(reg);
279
280         be_emit_char(env, '%');
281         be_emit_string(env, reg_name);
282 }
283
284 static void ia32_emit_register(ia32_emit_env_t *env, const arch_register_t *reg)
285 {
286         const char *reg_name = arch_register_get_name(reg);
287
288         be_emit_char(env, '%');
289         be_emit_string(env, reg_name);
290 }
291
292 void ia32_emit_x87_name(ia32_emit_env_t *env, const ir_node *node, int pos)
293 {
294         const ia32_x87_attr_t *attr = get_ia32_x87_attr_const(node);
295
296         assert(pos < 3);
297         be_emit_char(env, '%');
298         be_emit_string(env, attr->x87[pos]->name);
299 }
300
301 void ia32_emit_immediate(ia32_emit_env_t *env, const ir_node *node)
302 {
303         tarval *tv;
304         ir_entity *ent;
305         ident *id;
306
307         be_emit_char(env, '$');
308
309         switch(get_ia32_immop_type(node)) {
310         case ia32_ImmConst:
311                 tv = get_ia32_Immop_tarval(node);
312                 be_emit_tarval(env, tv);
313                 return;
314         case ia32_ImmSymConst:
315                 ent = get_ia32_Immop_symconst(node);
316                 set_entity_backend_marked(ent, 1);
317                 id = get_entity_ld_ident(ent);
318                 be_emit_ident(env, id);
319                 return;
320         case ia32_ImmNone:
321                 break;
322         }
323
324         assert(0);
325         be_emit_string(env, "BAD");
326         return;
327 }
328
329 static
330 void ia32_emit_mode_suffix_mode(ia32_emit_env_t *env, const ir_mode *mode)
331 {
332         be_emit_char(env, get_mode_suffix(mode));
333 }
334
335 void ia32_emit_mode_suffix(ia32_emit_env_t *env, const ir_node *node)
336 {
337         ir_mode *mode = get_ia32_ls_mode(node);
338         if(mode == NULL)
339                 mode = mode_Iu;
340
341         ia32_emit_mode_suffix_mode(env, mode);
342 }
343
344 void ia32_emit_x87_mode_suffix(ia32_emit_env_t *env, const ir_node *node)
345 {
346         ir_mode *mode = get_ia32_ls_mode(node);
347         if(mode != NULL)
348                 ia32_emit_mode_suffix_mode(env, mode);
349 }
350
351 static
352 char get_xmm_mode_suffix(ir_mode *mode)
353 {
354         assert(mode_is_float(mode));
355         switch(get_mode_size_bits(mode)) {
356         case 32:
357                 return 's';
358         case 64:
359                 return 'd';
360         default:
361                 assert(0);
362         }
363         return '%';
364 }
365
366 void ia32_emit_xmm_mode_suffix(ia32_emit_env_t *env, const ir_node *node)
367 {
368         ir_mode *mode = get_ia32_ls_mode(node);
369         assert(mode != NULL);
370         be_emit_char(env, 's');
371         be_emit_char(env, get_xmm_mode_suffix(mode));
372 }
373
374 void ia32_emit_xmm_mode_suffix_s(ia32_emit_env_t *env, const ir_node *node)
375 {
376         ir_mode *mode = get_ia32_ls_mode(node);
377         assert(mode != NULL);
378         be_emit_char(env, get_xmm_mode_suffix(mode));
379 }
380
381 void ia32_emit_extend_suffix(ia32_emit_env_t *env, const ir_mode *mode)
382 {
383         if(get_mode_size_bits(mode) == 32)
384                 return;
385         if(mode_is_signed(mode)) {
386                 be_emit_char(env, 's');
387         } else {
388                 be_emit_char(env, 'z');
389         }
390 }
391
392 static
393 void ia32_emit_function_object(ia32_emit_env_t *env, const char *name)
394 {
395         switch (be_gas_flavour) {
396         case GAS_FLAVOUR_NORMAL:
397                 be_emit_cstring(env, "\t.type\t");
398                 be_emit_string(env, name);
399                 be_emit_cstring(env, ", @function\n");
400                 be_emit_write_line(env);
401                 break;
402         case GAS_FLAVOUR_MINGW:
403                 be_emit_cstring(env, "\t.def\t");
404                 be_emit_string(env, name);
405                 be_emit_cstring(env, ";\t.scl\t2;\t.type\t32;\t.endef\n");
406                 be_emit_write_line(env);
407                 break;
408         default:
409                 break;
410         }
411 }
412
413 static
414 void ia32_emit_function_size(ia32_emit_env_t *env, const char *name)
415 {
416         switch (be_gas_flavour) {
417         case GAS_FLAVOUR_NORMAL:
418                 be_emit_cstring(env, "\t.size\t");
419                 be_emit_string(env, name);
420                 be_emit_cstring(env, ", .-");
421                 be_emit_string(env, name);
422                 be_emit_char(env, '\n');
423                 be_emit_write_line(env);
424                 break;
425         default:
426                 break;
427         }
428 }
429
430
431 static
432 void emit_ia32_Immediate(ia32_emit_env_t *env, const ir_node *node);
433
434 /**
435  * Emits registers and/or address mode of a binary operation.
436  */
437 void ia32_emit_binop(ia32_emit_env_t *env, const ir_node *node) {
438         int            right_pos;
439         const ir_node *right_op = get_irn_n(node, 3);
440
441         switch(get_ia32_op_type(node)) {
442         case ia32_Normal:
443                 if(is_ia32_Immediate(right_op)) {
444                         emit_ia32_Immediate(env, right_op);
445                         be_emit_cstring(env, ", ");
446                         ia32_emit_source_register(env, node, 2);
447                         break;
448                 } else if (is_ia32_ImmConst(node) || is_ia32_ImmSymConst(node)) {
449                         ia32_emit_immediate(env, node);
450                         be_emit_cstring(env, ", ");
451                         ia32_emit_source_register(env, node, 2);
452                 } else {
453                         const arch_register_t *in1 = get_in_reg(env, node, 2);
454                         const arch_register_t *in2 = get_in_reg(env, node, 3);
455                         const arch_register_t *out = produces_result(node) ? get_out_reg(env, node, 0) : NULL;
456                         const arch_register_t *in;
457                         const char            *in_name;
458
459                         in      = out ? ((out == in2) ? in1 : in2) : in2;
460                         out     = out ? out : in1;
461                         in_name = arch_register_get_name(in);
462
463                         if (is_ia32_emit_cl(node)) {
464                                 assert(in == &ia32_gp_regs[REG_ECX]);
465                                 in_name = "cl";
466                         }
467
468                         be_emit_char(env, '%');
469                         be_emit_string(env, in_name);
470                         be_emit_cstring(env, ", %");
471                         be_emit_string(env, arch_register_get_name(out));
472                 }
473                 break;
474         case ia32_AddrModeS:
475                 if (is_ia32_ImmConst(node) || is_ia32_ImmSymConst(node)) {
476                         assert(!produces_result(node) &&
477                                         "Source AM with Const must not produce result");
478                         ia32_emit_immediate(env, node);
479                         be_emit_cstring(env, ", ");
480                         ia32_emit_am(env, node);
481                 } else if(is_ia32_Immediate(right_op)) {
482                         assert(!produces_result(node) &&
483                                         "Source AM with Const must not produce result");
484
485                         emit_ia32_Immediate(env, right_op);
486                         be_emit_cstring(env, ", ");
487                         ia32_emit_am(env, node);
488                 } else if (produces_result(node)) {
489                         ia32_emit_am(env, node);
490                         be_emit_cstring(env, ", ");
491                         ia32_emit_dest_register(env, node, 0);
492                 } else {
493                         ia32_emit_am(env, node);
494                         be_emit_cstring(env, ", ");
495                         ia32_emit_source_register(env, node, 2);
496                 }
497                 break;
498         case ia32_AddrModeD:
499                 right_pos = get_irn_arity(node) >= 5 ? 3 : 2;
500                 right_op  = get_irn_n(node, right_pos);
501                 if(is_ia32_Immediate(right_op)) {
502                         emit_ia32_Immediate(env, right_op);
503                         be_emit_cstring(env, ", ");
504                         ia32_emit_am(env, node);
505                         break;
506                 } else if (is_ia32_ImmConst(node) || is_ia32_ImmSymConst(node)) {
507                         ia32_emit_immediate(env, node);
508                         be_emit_cstring(env, ", ");
509                         ia32_emit_am(env, node);
510                 } else {
511                         const arch_register_t *in1 = get_in_reg(env, node, right_pos);
512                         ir_mode               *mode = get_ia32_ls_mode(node);
513                         const char            *in_name;
514
515                         in_name = ia32_get_reg_name_for_mode(env, mode, in1);
516
517                         if (is_ia32_emit_cl(node)) {
518                                 assert(in1 == &ia32_gp_regs[REG_ECX]);
519                                 in_name = "cl";
520                         }
521
522                         be_emit_char(env, '%');
523                         be_emit_string(env, in_name);
524                         be_emit_cstring(env, ", ");
525                         ia32_emit_am(env, node);
526                 }
527                 break;
528         default:
529                 assert(0 && "unsupported op type");
530         }
531 }
532
533 /**
534  * Emits registers and/or address mode of a binary operation.
535  */
536 void ia32_emit_x87_binop(ia32_emit_env_t *env, const ir_node *node) {
537         switch(get_ia32_op_type(node)) {
538                 case ia32_Normal:
539                         if (is_ia32_ImmConst(node) || is_ia32_ImmSymConst(node)) {
540                                 // should not happen...
541                                 assert(0);
542                         } else {
543                                 const ia32_x87_attr_t *x87_attr = get_ia32_x87_attr_const(node);
544                                 const arch_register_t *in1      = x87_attr->x87[0];
545                                 const arch_register_t *in2      = x87_attr->x87[1];
546                                 const arch_register_t *out      = x87_attr->x87[2];
547                                 const arch_register_t *in;
548
549                                 in  = out ? ((out == in2) ? in1 : in2) : in2;
550                                 out = out ? out : in1;
551
552                                 be_emit_char(env, '%');
553                                 be_emit_string(env, arch_register_get_name(in));
554                                 be_emit_cstring(env, ", %");
555                                 be_emit_string(env, arch_register_get_name(out));
556                         }
557                         break;
558                 case ia32_AddrModeS:
559                 case ia32_AddrModeD:
560                         ia32_emit_am(env, node);
561                         break;
562                 default:
563                         assert(0 && "unsupported op type");
564         }
565 }
566
567 void ia32_emit_am_or_dest_register(ia32_emit_env_t *env, const ir_node *node,
568                                    int pos) {
569         if(get_ia32_op_type(node) == ia32_Normal) {
570                 ia32_emit_dest_register(env, node, pos);
571         } else {
572                 assert(get_ia32_op_type(node) == ia32_AddrModeD);
573                 ia32_emit_am(env, node);
574         }
575 }
576
577 /**
578  * Emits registers and/or address mode of a unary operation.
579  */
580 void ia32_emit_unop(ia32_emit_env_t *env, const ir_node *node, int pos) {
581         const ir_node *op;
582
583         switch(get_ia32_op_type(node)) {
584         case ia32_Normal:
585                 op = get_irn_n(node, pos);
586                 if (is_ia32_Immediate(op)) {
587                         emit_ia32_Immediate(env, op);
588                 } else if (is_ia32_ImmConst(node) || is_ia32_ImmSymConst(node)) {
589                         ia32_emit_immediate(env, node);
590                 } else {
591                         ia32_emit_source_register(env, node, pos);
592                 }
593                 break;
594         case ia32_AddrModeS:
595         case ia32_AddrModeD:
596                 ia32_emit_am(env, node);
597                 break;
598         default:
599                 assert(0 && "unsupported op type");
600         }
601 }
602
603 /**
604  * Emits address mode.
605  */
606 void ia32_emit_am(ia32_emit_env_t *env, const ir_node *node) {
607         ir_entity *ent       = get_ia32_am_sc(node);
608         int        offs      = get_ia32_am_offs_int(node);
609         ir_node   *base      = get_irn_n(node, 0);
610         int        has_base  = !is_ia32_NoReg_GP(base);
611         ir_node   *index     = get_irn_n(node, 1);
612         int        has_index = !is_ia32_NoReg_GP(index);
613
614         /* just to be sure... */
615         assert(!is_ia32_use_frame(node) || get_ia32_frame_ent(node) != NULL);
616
617         /* emit offset */
618         if (ent != NULL) {
619                 ident *id;
620
621                 set_entity_backend_marked(ent, 1);
622                 id = get_entity_ld_ident(ent);
623                 if (is_ia32_am_sc_sign(node))
624                         be_emit_char(env, '-');
625                 be_emit_ident(env, id);
626
627                 if(get_entity_owner(ent) == get_tls_type()) {
628                         if (get_entity_visibility(ent) == visibility_external_allocated) {
629                                 be_emit_cstring(env, "@INDNTPOFF");
630                         } else {
631                                 be_emit_cstring(env, "@NTPOFF");
632                         }
633                 }
634         }
635
636         if(offs != 0) {
637                 if(ent != NULL) {
638                         be_emit_irprintf(env->emit, "%+d", offs);
639                 } else {
640                         be_emit_irprintf(env->emit, "%d", offs);
641                 }
642         }
643
644         if (has_base || has_index) {
645                 be_emit_char(env, '(');
646
647                 /* emit base */
648                 if (has_base) {
649                         ia32_emit_source_register(env, node, 0);
650                 }
651
652                 /* emit index + scale */
653                 if (has_index) {
654                         int scale;
655                         be_emit_char(env, ',');
656                         ia32_emit_source_register(env, node, 1);
657
658                         scale = get_ia32_am_scale(node);
659                         if (scale > 0) {
660                                 be_emit_irprintf(env->emit, ",%d", 1 << get_ia32_am_scale(node));
661                         }
662                 }
663                 be_emit_char(env, ')');
664         }
665
666         /* special case if nothing is set */
667         if(ent == NULL && offs == 0 && !has_base && !has_index) {
668                 be_emit_char(env, '0');
669         }
670 }
671
672 /*************************************************
673  *                 _ _                         _
674  *                (_) |                       | |
675  *   ___ _ __ ___  _| |_    ___ ___  _ __   __| |
676  *  / _ \ '_ ` _ \| | __|  / __/ _ \| '_ \ / _` |
677  * |  __/ | | | | | | |_  | (_| (_) | | | | (_| |
678  *  \___|_| |_| |_|_|\__|  \___\___/|_| |_|\__,_|
679  *
680  *************************************************/
681
682 #undef IA32_DO_EMIT
683 #define IA32_DO_EMIT(irn) ia32_fprintf_format(F, irn, cmd_buf, cmnt_buf)
684
685 /*
686  * coding of conditions
687  */
688 struct cmp2conditon_t {
689         const char *name;
690         pn_Cmp      num;
691 };
692
693 /*
694  * positive conditions for signed compares
695  */
696 static
697 const struct cmp2conditon_t cmp2condition_s[] = {
698         { NULL,              pn_Cmp_False },  /* always false */
699         { "e",               pn_Cmp_Eq },     /* == */
700         { "l",               pn_Cmp_Lt },     /* < */
701         { "le",              pn_Cmp_Le },     /* <= */
702         { "g",               pn_Cmp_Gt },     /* > */
703         { "ge",              pn_Cmp_Ge },     /* >= */
704         { "ne",              pn_Cmp_Lg },     /* != */
705         { NULL,              pn_Cmp_Leg},     /* Floating point: ordered */
706 };
707
708 /*
709  * positive conditions for unsigned compares
710  */
711 static
712 const struct cmp2conditon_t cmp2condition_u[] = {
713         { NULL,              pn_Cmp_False },  /* always false */
714         { "e",               pn_Cmp_Eq },     /* == */
715         { "b",               pn_Cmp_Lt },     /* < */
716         { "be",              pn_Cmp_Le },     /* <= */
717         { "a",               pn_Cmp_Gt },     /* > */
718         { "ae",              pn_Cmp_Ge },     /* >= */
719         { "ne",              pn_Cmp_Lg },     /* != */
720         { NULL,              pn_Cmp_True },   /* always true */
721 };
722
723 /*
724  * returns the condition code
725  */
726 static
727 const char *get_cmp_suffix(pn_Cmp cmp_code)
728 {
729         assert( (cmp2condition_s[cmp_code & 7].num) == (cmp_code & 7));
730         assert( (cmp2condition_u[cmp_code & 7].num) == (cmp_code & 7));
731
732         if((cmp_code & ia32_pn_Cmp_Unsigned)) {
733                 return cmp2condition_u[cmp_code & 7].name;
734         } else {
735                 return cmp2condition_s[cmp_code & 7].name;
736         }
737 }
738
739 void ia32_emit_cmp_suffix(ia32_emit_env_t *env, long pnc)
740 {
741         be_emit_string(env, get_cmp_suffix(pnc));
742 }
743
744
745 /**
746  * Returns the target block for a control flow node.
747  */
748 static
749 ir_node *get_cfop_target_block(const ir_node *irn) {
750         return get_irn_link(irn);
751 }
752
753 /**
754  * Emits a block label for the given block.
755  */
756 static
757 void ia32_emit_block_name(ia32_emit_env_t *env, const ir_node *block)
758 {
759         if (has_Block_label(block)) {
760                 be_emit_string(env, be_gas_label_prefix());
761                 be_emit_irprintf(env->emit, "%u", (unsigned)get_Block_label(block));
762         } else {
763                 be_emit_cstring(env, BLOCK_PREFIX);
764                 be_emit_irprintf(env->emit, "%d", get_irn_node_nr(block));
765         }
766 }
767
768 /**
769  * Emits the target label for a control flow node.
770  */
771 static
772 void ia32_emit_cfop_target(ia32_emit_env_t * env, const ir_node *node) {
773         ir_node *block = get_cfop_target_block(node);
774
775         ia32_emit_block_name(env, block);
776 }
777
778 /** Return the next block in Block schedule */
779 static ir_node *next_blk_sched(const ir_node *block) {
780         return get_irn_link(block);
781 }
782
783 /**
784  * Returns the Proj with projection number proj and NOT mode_M
785  */
786 static
787 ir_node *get_proj(const ir_node *node, long proj) {
788         const ir_edge_t *edge;
789         ir_node         *src;
790
791         assert(get_irn_mode(node) == mode_T && "expected mode_T node");
792
793         foreach_out_edge(node, edge) {
794                 src = get_edge_src_irn(edge);
795
796                 assert(is_Proj(src) && "Proj expected");
797                 if (get_irn_mode(src) == mode_M)
798                         continue;
799
800                 if (get_Proj_proj(src) == proj)
801                         return src;
802         }
803         return NULL;
804 }
805
806 /**
807  * Emits the jump sequence for a conditional jump (cmp + jmp_true + jmp_false)
808  */
809 static
810 void finish_CondJmp(ia32_emit_env_t *env, const ir_node *node, ir_mode *mode,
811                     long pnc) {
812         const ir_node *proj_true;
813         const ir_node *proj_false;
814         const ir_node *block;
815         const ir_node *next_block;
816         int flipped = 0;
817
818         /* get both Proj's */
819         proj_true = get_proj(node, pn_Cond_true);
820         assert(proj_true && "CondJmp without true Proj");
821
822         proj_false = get_proj(node, pn_Cond_false);
823         assert(proj_false && "CondJmp without false Proj");
824
825         /* for now, the code works for scheduled and non-schedules blocks */
826         block = get_nodes_block(node);
827
828         /* we have a block schedule */
829         next_block = next_blk_sched(block);
830
831         if (get_cfop_target_block(proj_true) == next_block) {
832                 /* exchange both proj's so the second one can be omitted */
833                 const ir_node *t = proj_true;
834
835                 proj_true  = proj_false;
836                 proj_false = t;
837                 flipped    = 1;
838                 pnc        = get_negated_pnc(pnc, mode);
839         }
840
841         if (mode_is_float(mode)) {
842                 /* Some floating point comparisons require a test of the parity flag, which
843                  * indicates that the result is unordered */
844                 switch (pnc) {
845                         case pn_Cmp_Uo:
846                                 be_emit_cstring(env, "\tjp ");
847                                 ia32_emit_cfop_target(env, proj_true);
848                                 be_emit_finish_line_gas(env, proj_true);
849                                 break;
850
851                         case pn_Cmp_Leg:
852                                 be_emit_cstring(env, "\tjnp ");
853                                 ia32_emit_cfop_target(env, proj_true);
854                                 be_emit_finish_line_gas(env, proj_true);
855                                 break;
856
857                         case pn_Cmp_Eq:
858                         case pn_Cmp_Lt:
859                         case pn_Cmp_Le:
860                                 be_emit_cstring(env, "\tjp ");
861                                 ia32_emit_cfop_target(env, proj_false);
862                                 be_emit_finish_line_gas(env, proj_false);
863                                 goto float_jcc;
864
865                         case pn_Cmp_Ug:
866                         case pn_Cmp_Uge:
867                         case pn_Cmp_Ne:
868                                 be_emit_cstring(env, "\tjp ");
869                                 ia32_emit_cfop_target(env, proj_true);
870                                 be_emit_finish_line_gas(env, proj_true);
871                                 goto float_jcc;
872
873                         default:
874                         float_jcc:
875                                 /* The bits set by floating point compares correspond to unsigned
876                                  * comparisons */
877                                 pnc |= ia32_pn_Cmp_Unsigned;
878                                 goto emit_jcc;
879                 }
880         } else {
881 emit_jcc:
882                 be_emit_cstring(env, "\tj");
883                 ia32_emit_cmp_suffix(env, pnc);
884                 be_emit_char(env, ' ');
885                 ia32_emit_cfop_target(env, proj_true);
886                 be_emit_finish_line_gas(env, proj_true);
887         }
888
889         /* the second Proj might be a fallthrough */
890         if (get_cfop_target_block(proj_false) != next_block) {
891                 be_emit_cstring(env, "\tjmp ");
892                 ia32_emit_cfop_target(env, proj_false);
893                 be_emit_finish_line_gas(env, proj_false);
894         } else {
895                 be_emit_cstring(env, "\t/* fallthrough to ");
896                 ia32_emit_cfop_target(env, proj_false);
897                 be_emit_cstring(env, " */");
898                 be_emit_finish_line_gas(env, proj_false);
899         }
900 }
901
902 /**
903  * Emits code for conditional jump.
904  */
905 static
906 void CondJmp_emitter(ia32_emit_env_t *env, const ir_node *node) {
907         be_emit_cstring(env, "\tcmp");
908         ia32_emit_mode_suffix(env, node);
909         be_emit_char(env, ' ');
910         ia32_emit_binop(env, node);
911         be_emit_finish_line_gas(env, node);
912
913         finish_CondJmp(env, node, mode_Iu, get_ia32_pncode(node));
914 }
915
916 /**
917  * Emits code for conditional jump with two variables.
918  */
919 static
920 void emit_ia32_CondJmp(ia32_emit_env_t *env, const ir_node *node) {
921         CondJmp_emitter(env, node);
922 }
923
924 /**
925  * Emits code for conditional test and jump.
926  */
927 static
928 void TestJmp_emitter(ia32_emit_env_t *env, const ir_node *node) {
929         be_emit_cstring(env, "\ttest");
930         ia32_emit_mode_suffix(env, node);
931         be_emit_char(env, ' ');
932
933         ia32_emit_binop(env, node);
934         be_emit_finish_line_gas(env, node);
935
936         finish_CondJmp(env, node, mode_Iu, get_ia32_pncode(node));
937 }
938
939 /**
940  * Emits code for conditional test and jump with two variables.
941  */
942 static
943 void emit_ia32_TestJmp(ia32_emit_env_t *env, const ir_node *node) {
944         TestJmp_emitter(env, node);
945 }
946
947 /**
948  * Emits code for conditional SSE floating point jump with two variables.
949  */
950 static
951 void emit_ia32_xCondJmp(ia32_emit_env_t *env, const ir_node *node) {
952         be_emit_cstring(env, "\tucomi");
953         ia32_emit_xmm_mode_suffix(env, node);
954         be_emit_char(env, ' ');
955         ia32_emit_binop(env, node);
956         be_emit_finish_line_gas(env, node);
957
958         finish_CondJmp(env, node, mode_F, get_ia32_pncode(node));
959 }
960
961 /**
962  * Emits code for conditional x87 floating point jump with two variables.
963  */
964 static
965 void emit_ia32_x87CondJmp(ia32_emit_env_t *env, const ir_node *node) {
966         const ia32_x87_attr_t *x87_attr = get_ia32_x87_attr_const(node);
967         const char            *reg      = x87_attr->x87[1]->name;
968         long                   pnc      = get_ia32_pncode(node);
969
970         switch (get_ia32_irn_opcode(node)) {
971         case iro_ia32_fcomrJmp:
972                 pnc = get_inversed_pnc(pnc);
973                 reg = x87_attr->x87[0]->name;
974         case iro_ia32_fcomJmp:
975         default:
976                 be_emit_cstring(env, "\tfucom ");
977                 break;
978         case iro_ia32_fcomrpJmp:
979                 pnc = get_inversed_pnc(pnc);
980                 reg = x87_attr->x87[0]->name;
981         case iro_ia32_fcompJmp:
982                 be_emit_cstring(env, "\tfucomp ");
983                 break;
984         case iro_ia32_fcomrppJmp:
985                 pnc = get_inversed_pnc(pnc);
986         case iro_ia32_fcomppJmp:
987                 be_emit_cstring(env, "\tfucompp ");
988                 reg = "";
989                 break;
990         }
991
992         if(reg[0] != '\0') {
993                 be_emit_char(env, '%');
994                 be_emit_string(env, reg);
995         }
996         be_emit_finish_line_gas(env, node);
997
998         be_emit_cstring(env, "\tfnstsw %ax");
999         be_emit_finish_line_gas(env, node);
1000         be_emit_cstring(env, "\tsahf");
1001         be_emit_finish_line_gas(env, node);
1002
1003         finish_CondJmp(env, node, mode_E, pnc);
1004 }
1005
1006 static
1007 void CMov_emitter(ia32_emit_env_t *env, const ir_node *node)
1008 {
1009         const arch_register_t *in1, *in2, *out;
1010         long  pnc = get_ia32_pncode(node);
1011
1012         out = arch_get_irn_register(env->arch_env, node);
1013
1014         /* we have to emit the cmp first, because the destination register */
1015         /* could be one of the compare registers                           */
1016         if (is_ia32_xCmpCMov(node)) {
1017                 be_emit_cstring(env, "\tucomis");
1018                 ia32_emit_mode_suffix_mode(env, get_irn_mode(node));
1019                 be_emit_char(env, ' ');
1020                 ia32_emit_source_register(env, node, 1);
1021                 be_emit_cstring(env, ", ");
1022                 ia32_emit_source_register(env, node, 0);
1023
1024                 in1 = arch_get_irn_register(env->arch_env, get_irn_n(node, 2));
1025                 in2 = arch_get_irn_register(env->arch_env, get_irn_n(node, 3));
1026         } else {
1027                 if (is_ia32_CmpCMov(node)) {
1028                         be_emit_cstring(env, "\tcmp ");
1029                 } else {
1030                         assert(is_ia32_TestCMov(node));
1031                         be_emit_cstring(env, "\ttest ");
1032                 }
1033                 ia32_emit_binop(env, node);
1034
1035                 in1 = arch_get_irn_register(env->arch_env, get_irn_n(node, 5));
1036                 in2 = arch_get_irn_register(env->arch_env, get_irn_n(node, 6));
1037         }
1038         be_emit_finish_line_gas(env, node);
1039
1040         if (out == in2) {
1041                 /* best case: default in == out -> do nothing */
1042         } else if(in2 == &ia32_gp_regs[REG_GP_UKNWN]) {
1043                 /* also nothign to do for unknown regs */
1044         } else if (out == in1) {
1045                 const arch_register_t *t;
1046                 /* true in == out -> need complement compare and exchange true and
1047                  * default in */
1048                 t   = in1;
1049                 in1 = in2;
1050                 in2 = t;
1051                 pnc = get_negated_pnc(pnc, get_irn_mode(node));
1052         } else {
1053                 /* out is different from both ins: need copy default -> out */
1054                 be_emit_cstring(env, "\tmovl ");
1055                 ia32_emit_register(env, in2);
1056                 be_emit_cstring(env, ", ");
1057                 ia32_emit_register(env, out);
1058                 be_emit_finish_line_gas(env, node);
1059         }
1060
1061         be_emit_cstring(env, "\tcmov");
1062         ia32_emit_cmp_suffix(env, pnc );
1063         be_emit_cstring(env, "l ");
1064         ia32_emit_register(env, in1);
1065         be_emit_cstring(env, ", ");
1066         ia32_emit_register(env, out);
1067
1068         be_emit_finish_line_gas(env, node);
1069 }
1070
1071 static
1072 void emit_ia32_CmpCMov(ia32_emit_env_t *env, const ir_node *node)
1073 {
1074         CMov_emitter(env, node);
1075 }
1076
1077 static
1078 void emit_ia32_TestCMov(ia32_emit_env_t *env, const ir_node *node)
1079 {
1080         CMov_emitter(env, node);
1081 }
1082
1083 static
1084 void emit_ia32_xCmpCMov(ia32_emit_env_t *env, const ir_node *node)
1085 {
1086         CMov_emitter(env, node);
1087 }
1088
1089 static
1090 void Set_emitter(ia32_emit_env_t *env, const ir_node *node)
1091 {
1092         long pnc = get_ia32_pncode(node);
1093         const char *reg8bit;
1094         const arch_register_t *out;
1095
1096         out     = arch_get_irn_register(env->arch_env, node);
1097         reg8bit = ia32_get_mapped_reg_name(env->isa->regs_8bit, out);
1098
1099         if(is_ia32_xCmpSet(node)) {
1100                 be_emit_cstring(env, "\tucomis");
1101                 ia32_emit_mode_suffix_mode(env, get_irn_mode(get_irn_n(node, 2)));
1102                 be_emit_char(env, ' ');
1103                 ia32_emit_binop(env, node);
1104         } else {
1105                 if (is_ia32_CmpSet(node)) {
1106                         be_emit_cstring(env, "\tcmp ");
1107                 } else {
1108                         assert(is_ia32_TestSet(node));
1109                         be_emit_cstring(env, "\ttest ");
1110                 }
1111                 ia32_emit_binop(env, node);
1112         }
1113         be_emit_finish_line_gas(env, node);
1114
1115         /* use mov to clear target because it doesn't affect the eflags */
1116         be_emit_cstring(env, "\tmovl $0, %");
1117         be_emit_string(env, arch_register_get_name(out));
1118         be_emit_finish_line_gas(env, node);
1119
1120         be_emit_cstring(env, "\tset");
1121         ia32_emit_cmp_suffix(env, pnc);
1122         be_emit_cstring(env, " %");
1123         be_emit_string(env, reg8bit);
1124         be_emit_finish_line_gas(env, node);
1125 }
1126
1127 static
1128 void emit_ia32_CmpSet(ia32_emit_env_t *env, const ir_node *node) {
1129         Set_emitter(env, node);
1130 }
1131
1132 static
1133 void emit_ia32_TestSet(ia32_emit_env_t *env, const ir_node *node) {
1134         Set_emitter(env, node);
1135 }
1136
1137 static
1138 void emit_ia32_xCmpSet(ia32_emit_env_t *env, const ir_node *node) {
1139         Set_emitter(env, node);
1140 }
1141
1142 static
1143 void emit_ia32_xCmp(ia32_emit_env_t *env, const ir_node *node) {
1144         int  sse_pnc  = -1;
1145         long pnc      = get_ia32_pncode(node);
1146         long unord    = pnc & pn_Cmp_Uo;
1147
1148         assert( (pnc & ia32_pn_Cmp_Unsigned) == 0);
1149
1150         switch (pnc) {
1151                 case pn_Cmp_Leg: /* odered */
1152                         sse_pnc = 7;
1153                         break;
1154                 case pn_Cmp_Uo:  /* unordered */
1155                         sse_pnc = 3;
1156                         break;
1157                 case pn_Cmp_Ue:
1158                 case pn_Cmp_Eq:  /* == */
1159                         sse_pnc = 0;
1160                         break;
1161                 case pn_Cmp_Ul:
1162                 case pn_Cmp_Lt:  /* < */
1163                         sse_pnc = 1;
1164                         break;
1165                 case pn_Cmp_Ule:
1166                 case pn_Cmp_Le: /* <= */
1167                         sse_pnc = 2;
1168                         break;
1169                 case pn_Cmp_Ug:
1170                 case pn_Cmp_Gt:  /* > */
1171                         sse_pnc = 6;
1172                         break;
1173                 case pn_Cmp_Uge:
1174                 case pn_Cmp_Ge: /* >= */
1175                         sse_pnc = 5;
1176                         break;
1177                 case pn_Cmp_Ne:
1178                 case pn_Cmp_Lg:  /* != */
1179                         sse_pnc = 4;
1180                         break;
1181         }
1182
1183         assert(sse_pnc >= 0 && "unsupported compare");
1184
1185         if (unord && sse_pnc != 3) {
1186                 /*
1187                         We need a separate compare against unordered.
1188                         Quick and Dirty solution:
1189                         - get some memory on stack
1190                         - compare
1191                         - store result
1192                         - compare
1193                         - and result and stored result
1194                     - cleanup stack
1195                 */
1196                 be_emit_cstring(env, "\tsubl $8, %esp");
1197                 be_emit_finish_line_gas(env, node);
1198
1199                 be_emit_cstring(env, "\tcmpsd $3, ");
1200                 ia32_emit_binop(env, node);
1201                 be_emit_finish_line_gas(env, node);
1202
1203                 be_emit_cstring(env, "\tmovsd ");
1204                 ia32_emit_dest_register(env, node, 0);
1205                 be_emit_cstring(env, ", (%esp)");
1206                 be_emit_finish_line_gas(env, node);
1207         }
1208
1209         be_emit_cstring(env, "\tcmpsd ");
1210         be_emit_irprintf(env->emit, "%d, ", sse_pnc);
1211         ia32_emit_binop(env, node);
1212         be_emit_finish_line_gas(env, node);
1213
1214         if (unord && sse_pnc != 3) {
1215                 be_emit_cstring(env, "\tandpd (%esp), ");
1216                 ia32_emit_dest_register(env, node, 0);
1217                 be_emit_finish_line_gas(env, node);
1218
1219                 be_emit_cstring(env, "\taddl $8, %esp");
1220                 be_emit_finish_line_gas(env, node);
1221         }
1222 }
1223
1224 /*********************************************************
1225  *                 _ _       _
1226  *                (_) |     (_)
1227  *   ___ _ __ ___  _| |_     _ _   _ _ __ ___  _ __  ___
1228  *  / _ \ '_ ` _ \| | __|   | | | | | '_ ` _ \| '_ \/ __|
1229  * |  __/ | | | | | | |_    | | |_| | | | | | | |_) \__ \
1230  *  \___|_| |_| |_|_|\__|   | |\__,_|_| |_| |_| .__/|___/
1231  *                         _/ |               | |
1232  *                        |__/                |_|
1233  *********************************************************/
1234
1235 /* jump table entry (target and corresponding number) */
1236 typedef struct _branch_t {
1237         ir_node *target;
1238         int      value;
1239 } branch_t;
1240
1241 /* jump table for switch generation */
1242 typedef struct _jmp_tbl_t {
1243         ir_node  *defProj;         /**< default target */
1244         long      min_value;       /**< smallest switch case */
1245         long      max_value;       /**< largest switch case */
1246         long      num_branches;    /**< number of jumps */
1247         char     *label;           /**< label of the jump table */
1248         branch_t *branches;        /**< jump array */
1249 } jmp_tbl_t;
1250
1251 /**
1252  * Compare two variables of type branch_t. Used to sort all switch cases
1253  */
1254 static
1255 int ia32_cmp_branch_t(const void *a, const void *b) {
1256         branch_t *b1 = (branch_t *)a;
1257         branch_t *b2 = (branch_t *)b;
1258
1259         if (b1->value <= b2->value)
1260                 return -1;
1261         else
1262                 return 1;
1263 }
1264
1265 /**
1266  * Emits code for a SwitchJmp (creates a jump table if
1267  * possible otherwise a cmp-jmp cascade). Port from
1268  * cggg ia32 backend
1269  */
1270 static
1271 void emit_ia32_SwitchJmp(ia32_emit_env_t *env, const ir_node *node) {
1272         unsigned long       interval;
1273         int                 last_value, i;
1274         long                pnc;
1275         jmp_tbl_t           tbl;
1276         ir_node            *proj;
1277         const ir_edge_t    *edge;
1278
1279         /* fill the table structure */
1280         tbl.label        = xmalloc(SNPRINTF_BUF_LEN);
1281         tbl.label        = get_unique_label(tbl.label, SNPRINTF_BUF_LEN, ".TBL_");
1282         tbl.defProj      = NULL;
1283         tbl.num_branches = get_irn_n_edges(node);
1284         tbl.branches     = xcalloc(tbl.num_branches, sizeof(tbl.branches[0]));
1285         tbl.min_value    = INT_MAX;
1286         tbl.max_value    = INT_MIN;
1287
1288         i = 0;
1289         /* go over all proj's and collect them */
1290         foreach_out_edge(node, edge) {
1291                 proj = get_edge_src_irn(edge);
1292                 assert(is_Proj(proj) && "Only proj allowed at SwitchJmp");
1293
1294                 pnc = get_Proj_proj(proj);
1295
1296                 /* create branch entry */
1297                 tbl.branches[i].target = proj;
1298                 tbl.branches[i].value  = pnc;
1299
1300                 tbl.min_value = pnc < tbl.min_value ? pnc : tbl.min_value;
1301                 tbl.max_value = pnc > tbl.max_value ? pnc : tbl.max_value;
1302
1303                 /* check for default proj */
1304                 if (pnc == get_ia32_pncode(node)) {
1305                         assert(tbl.defProj == NULL && "found two defProjs at SwitchJmp");
1306                         tbl.defProj = proj;
1307                 }
1308
1309                 i++;
1310         }
1311
1312         /* sort the branches by their number */
1313         qsort(tbl.branches, tbl.num_branches, sizeof(tbl.branches[0]), ia32_cmp_branch_t);
1314
1315         /* two-complement's magic make this work without overflow */
1316         interval = tbl.max_value - tbl.min_value;
1317
1318         /* emit the table */
1319         be_emit_cstring(env, "\tcmpl $");
1320         be_emit_irprintf(env->emit, "%u, ", interval);
1321         ia32_emit_source_register(env, node, 0);
1322         be_emit_finish_line_gas(env, node);
1323
1324         be_emit_cstring(env, "\tja ");
1325         ia32_emit_cfop_target(env, tbl.defProj);
1326         be_emit_finish_line_gas(env, node);
1327
1328         if (tbl.num_branches > 1) {
1329                 /* create table */
1330                 be_emit_cstring(env, "\tjmp *");
1331                 be_emit_string(env, tbl.label);
1332                 be_emit_cstring(env, "(,");
1333                 ia32_emit_source_register(env, node, 0);
1334                 be_emit_cstring(env, ",4)");
1335                 be_emit_finish_line_gas(env, node);
1336
1337                 be_gas_emit_switch_section(env->emit, GAS_SECTION_RODATA);
1338                 be_emit_cstring(env, "\t.align 4\n");
1339                 be_emit_write_line(env);
1340
1341                 be_emit_string(env, tbl.label);
1342                 be_emit_cstring(env, ":\n");
1343                 be_emit_write_line(env);
1344
1345                 be_emit_cstring(env, ".long ");
1346                 ia32_emit_cfop_target(env, tbl.branches[0].target);
1347                 be_emit_finish_line_gas(env, NULL);
1348
1349                 last_value = tbl.branches[0].value;
1350                 for (i = 1; i < tbl.num_branches; ++i) {
1351                         while (++last_value < tbl.branches[i].value) {
1352                                 be_emit_cstring(env, ".long ");
1353                                 ia32_emit_cfop_target(env, tbl.defProj);
1354                                 be_emit_finish_line_gas(env, NULL);
1355                         }
1356                         be_emit_cstring(env, ".long ");
1357                         ia32_emit_cfop_target(env, tbl.branches[i].target);
1358                         be_emit_finish_line_gas(env, NULL);
1359                 }
1360                 be_gas_emit_switch_section(env->emit, GAS_SECTION_TEXT);
1361         } else {
1362                 /* one jump is enough */
1363                 be_emit_cstring(env, "\tjmp ");
1364                 ia32_emit_cfop_target(env, tbl.branches[0].target);
1365                 be_emit_finish_line_gas(env, node);
1366         }
1367
1368         if (tbl.label)
1369                 free(tbl.label);
1370         if (tbl.branches)
1371                 free(tbl.branches);
1372 }
1373
1374 /**
1375  * Emits code for a unconditional jump.
1376  */
1377 static
1378 void emit_Jmp(ia32_emit_env_t *env, const ir_node *node) {
1379         ir_node *block, *next_block;
1380
1381         /* for now, the code works for scheduled and non-schedules blocks */
1382         block = get_nodes_block(node);
1383
1384         /* we have a block schedule */
1385         next_block = next_blk_sched(block);
1386         if (get_cfop_target_block(node) != next_block) {
1387                 be_emit_cstring(env, "\tjmp ");
1388                 ia32_emit_cfop_target(env, node);
1389         } else {
1390                 be_emit_cstring(env, "\t/* fallthrough to ");
1391                 ia32_emit_cfop_target(env, node);
1392                 be_emit_cstring(env, " */");
1393         }
1394         be_emit_finish_line_gas(env, node);
1395 }
1396
1397 static
1398 void emit_ia32_Immediate(ia32_emit_env_t *env, const ir_node *node)
1399 {
1400         const ia32_immediate_attr_t *attr = get_ia32_immediate_attr_const(node);
1401
1402         be_emit_char(env, '$');
1403         if(attr->symconst != NULL) {
1404                 ident *id = get_entity_ld_ident(attr->symconst);
1405
1406                 if(attr->attr.data.am_sc_sign)
1407                         be_emit_char(env, '-');
1408                 be_emit_ident(env, id);
1409         }
1410         if(attr->symconst == NULL || attr->offset != 0) {
1411                 if(attr->symconst != NULL)
1412                         be_emit_char(env, '+');
1413                 be_emit_irprintf(env->emit, "0x%X", attr->offset);
1414         }
1415 }
1416
1417 static
1418 const char* emit_asm_operand(ia32_emit_env_t *env, const ir_node *node,
1419                              const char *s)
1420 {
1421         const arch_register_t *reg;
1422         const char            *reg_name;
1423         char                   c;
1424         char                   modifier = 0;
1425         int                    num      = -1;
1426         const ia32_attr_t     *attr;
1427         int                    n_outs;
1428         int                    p;
1429
1430         assert(*s == '%');
1431         c = *(++s);
1432
1433         /* parse modifiers */
1434         switch(c) {
1435         case 0:
1436                 ir_fprintf(stderr, "Warning: asm text (%+F) ends with %\n", node);
1437                 be_emit_char(env, '%');
1438                 return s + 1;
1439         case '%':
1440                 be_emit_char(env, '%');
1441                 return s + 1;
1442         case 'w':
1443         case 'b':
1444         case 'h':
1445                 modifier = c;
1446                 ++s;
1447                 break;
1448         case '0':
1449         case '1':
1450         case '2':
1451         case '3':
1452         case '4':
1453         case '5':
1454         case '6':
1455         case '7':
1456         case '8':
1457         case '9':
1458                 break;
1459         default:
1460                 ir_fprintf(stderr, "Warning: asm text (%+F) contains unknown modifier "
1461                            "'%c' for asm op\n", node, c);
1462                 ++s;
1463                 break;
1464         }
1465
1466         /* parse number */
1467         sscanf(s, "%d%n", &num, &p);
1468         if(num < 0) {
1469                 ir_fprintf(stderr, "Warning: Couldn't parse assembler operand (%+F)\n",
1470                            node);
1471                 return s;
1472         } else {
1473                 s += p;
1474         }
1475
1476         /* get register */
1477         attr   = get_ia32_attr_const(node);
1478         n_outs = ARR_LEN(attr->slots);
1479         if(num < n_outs) {
1480                 reg = get_out_reg(env, node, num);
1481         } else {
1482                 ir_node *pred;
1483                 int      in = num - n_outs;
1484                 if(in >= get_irn_arity(node)) {
1485                         ir_fprintf(stderr, "Warning: Invalid input %d specified in asm "
1486                                    "op (%+F)\n", num, node);
1487                         return s;
1488                 }
1489                 pred = get_irn_n(node, in);
1490                 /* might be an immediate value */
1491                 if(is_ia32_Immediate(pred)) {
1492                         emit_ia32_Immediate(env, pred);
1493                         return s;
1494                 }
1495                 reg = get_in_reg(env, node, in);
1496         }
1497         if(reg == NULL) {
1498                 ir_fprintf(stderr, "Warning: no register assigned for %d asm op "
1499                            "(%+F)\n", num, node);
1500                 return s;
1501         }
1502
1503         /* emit it */
1504         be_emit_char(env, '%');
1505         switch(modifier) {
1506         case 0:
1507                 reg_name = arch_register_get_name(reg);
1508                 break;
1509         case 'b':
1510                 reg_name = ia32_get_mapped_reg_name(env->isa->regs_8bit, reg);
1511                 break;
1512         case 'h':
1513                 reg_name = ia32_get_mapped_reg_name(env->isa->regs_8bit_high, reg);
1514                 break;
1515         case 'w':
1516                 reg_name = ia32_get_mapped_reg_name(env->isa->regs_16bit, reg);
1517                 break;
1518         default:
1519                 panic("Invalid asm op modifier");
1520         }
1521         be_emit_string(env, reg_name);
1522
1523         return s;
1524 }
1525
1526 /**
1527  * Emits code for an ASM pseudo op.
1528  */
1529 static
1530 void emit_ia32_Asm(ia32_emit_env_t *env, const ir_node *node)
1531 {
1532         const void            *gen_attr = get_irn_generic_attr_const(node);
1533         const ia32_asm_attr_t *attr
1534                 = CONST_CAST_IA32_ATTR(ia32_asm_attr_t, gen_attr);
1535         ident                 *asm_text = attr->asm_text;
1536         const char            *s        = get_id_str(asm_text);
1537
1538         be_emit_cstring(env, "# Begin ASM \t");
1539         be_emit_finish_line_gas(env, node);
1540
1541         if (s[0] != '\t')
1542                 be_emit_char(env, '\t');
1543
1544         while(*s != 0) {
1545                 if(*s == '%') {
1546                         s = emit_asm_operand(env, node, s);
1547                         continue;
1548                 } else {
1549                         be_emit_char(env, *s);
1550                 }
1551                 ++s;
1552         }
1553
1554         be_emit_char(env, '\n');
1555         be_emit_write_line(env);
1556
1557         be_emit_cstring(env, "# End ASM\n");
1558         be_emit_write_line(env);
1559 }
1560
1561 /**********************************
1562  *   _____                  ____
1563  *  / ____|                |  _ \
1564  * | |     ___  _ __  _   _| |_) |
1565  * | |    / _ \| '_ \| | | |  _ <
1566  * | |___| (_) | |_) | |_| | |_) |
1567  *  \_____\___/| .__/ \__, |____/
1568  *             | |     __/ |
1569  *             |_|    |___/
1570  **********************************/
1571
1572 /**
1573  * Emit movsb/w instructions to make mov count divideable by 4
1574  */
1575 static
1576 void emit_CopyB_prolog(ia32_emit_env_t *env, int rem) {
1577         be_emit_cstring(env, "\tcld");
1578         be_emit_finish_line_gas(env, NULL);
1579
1580         switch(rem) {
1581         case 1:
1582                 be_emit_cstring(env, "\tmovsb");
1583                 be_emit_finish_line_gas(env, NULL);
1584                 break;
1585         case 2:
1586                 be_emit_cstring(env, "\tmovsw");
1587                 be_emit_finish_line_gas(env, NULL);
1588                 break;
1589         case 3:
1590                 be_emit_cstring(env, "\tmovsb");
1591                 be_emit_finish_line_gas(env, NULL);
1592                 be_emit_cstring(env, "\tmovsw");
1593                 be_emit_finish_line_gas(env, NULL);
1594                 break;
1595         }
1596 }
1597
1598 /**
1599  * Emit rep movsd instruction for memcopy.
1600  */
1601 static
1602 void emit_ia32_CopyB(ia32_emit_env_t *env, const ir_node *node) {
1603         tarval *tv = get_ia32_Immop_tarval(node);
1604         int    rem = get_tarval_long(tv);
1605
1606         emit_CopyB_prolog(env, rem);
1607
1608         be_emit_cstring(env, "\trep movsd");
1609         be_emit_finish_line_gas(env, node);
1610 }
1611
1612 /**
1613  * Emits unrolled memcopy.
1614  */
1615 static
1616 void emit_ia32_CopyB_i(ia32_emit_env_t *env, const ir_node *node) {
1617         tarval *tv   = get_ia32_Immop_tarval(node);
1618         int     size = get_tarval_long(tv);
1619
1620         emit_CopyB_prolog(env, size & 0x3);
1621
1622         size >>= 2;
1623         while (size--) {
1624                 be_emit_cstring(env, "\tmovsd");
1625                 be_emit_finish_line_gas(env, NULL);
1626         }
1627 }
1628
1629
1630
1631 /***************************
1632  *   _____
1633  *  / ____|
1634  * | |     ___  _ ____   __
1635  * | |    / _ \| '_ \ \ / /
1636  * | |___| (_) | | | \ V /
1637  *  \_____\___/|_| |_|\_/
1638  *
1639  ***************************/
1640
1641 /**
1642  * Emit code for conversions (I, FP), (FP, I) and (FP, FP).
1643  */
1644 static
1645 void emit_ia32_Conv_with_FP(ia32_emit_env_t *env, const ir_node *node) {
1646         ir_mode            *ls_mode = get_ia32_ls_mode(node);
1647         int                 ls_bits = get_mode_size_bits(ls_mode);
1648
1649         be_emit_cstring(env, "\tcvt");
1650
1651         if(is_ia32_Conv_I2FP(node)) {
1652                 if(ls_bits == 32) {
1653                         be_emit_cstring(env, "si2ss");
1654                 } else {
1655                         be_emit_cstring(env, "si2sd");
1656                 }
1657         } else if(is_ia32_Conv_FP2I(node)) {
1658                 if(ls_bits == 32) {
1659                         be_emit_cstring(env, "ss2si");
1660                 } else {
1661                         be_emit_cstring(env, "sd2si");
1662                 }
1663         } else {
1664                 assert(is_ia32_Conv_FP2FP(node));
1665                 if(ls_bits == 32) {
1666                         be_emit_cstring(env, "sd2ss");
1667                 } else {
1668                         be_emit_cstring(env, "ss2sd");
1669                 }
1670         }
1671         be_emit_char(env, ' ');
1672
1673         switch(get_ia32_op_type(node)) {
1674                 case ia32_Normal:
1675                         ia32_emit_source_register(env, node, 2);
1676                         be_emit_cstring(env, ", ");
1677                         ia32_emit_dest_register(env, node, 0);
1678                         break;
1679                 case ia32_AddrModeS:
1680                         ia32_emit_dest_register(env, node, 0);
1681                         be_emit_cstring(env, ", ");
1682                         ia32_emit_am(env, node);
1683                         break;
1684                 default:
1685                         assert(0 && "unsupported op type for Conv");
1686         }
1687         be_emit_finish_line_gas(env, node);
1688 }
1689
1690 static
1691 void emit_ia32_Conv_I2FP(ia32_emit_env_t *env, const ir_node *node) {
1692         emit_ia32_Conv_with_FP(env, node);
1693 }
1694
1695 static
1696 void emit_ia32_Conv_FP2I(ia32_emit_env_t *env, const ir_node *node) {
1697         emit_ia32_Conv_with_FP(env, node);
1698 }
1699
1700 static
1701 void emit_ia32_Conv_FP2FP(ia32_emit_env_t *env, const ir_node *node) {
1702         emit_ia32_Conv_with_FP(env, node);
1703 }
1704
1705 /**
1706  * Emits code for an Int conversion.
1707  */
1708 static
1709 void emit_ia32_Conv_I2I(ia32_emit_env_t *env, const ir_node *node) {
1710         const char *sign_suffix;
1711         ir_mode *smaller_mode = get_ia32_ls_mode(node);
1712         int smaller_bits = get_mode_size_bits(smaller_mode);
1713         int signed_mode;
1714         const arch_register_t *in_reg, *out_reg;
1715
1716         assert(!mode_is_float(smaller_mode));
1717         assert(smaller_bits == 8 || smaller_bits == 16 || smaller_bits == 32);
1718
1719         signed_mode = mode_is_signed(smaller_mode);
1720         if(smaller_bits == 32) {
1721                 // this should not happen as it's no convert
1722                 assert(0);
1723                 sign_suffix = "";
1724         } else {
1725                 sign_suffix = signed_mode ? "s" : "z";
1726         }
1727
1728         switch(get_ia32_op_type(node)) {
1729                 case ia32_Normal:
1730                         in_reg  = get_in_reg(env, node, 2);
1731                         out_reg = get_out_reg(env, node, 0);
1732
1733                         if (in_reg  == &ia32_gp_regs[REG_EAX] &&
1734                                 out_reg == &ia32_gp_regs[REG_EAX] &&
1735                                 signed_mode &&
1736                                 smaller_bits == 16)
1737                         {
1738                                 /* argument and result are both in EAX and */
1739                                 /* signedness is ok: -> use the smaller cwtl opcode */
1740                                 be_emit_cstring(env, "\tcwtl");
1741                         } else {
1742                                 const char *sreg = ia32_get_reg_name_for_mode(env, smaller_mode, in_reg);
1743
1744                                 be_emit_cstring(env, "\tmov");
1745                                 be_emit_string(env, sign_suffix);
1746                                 ia32_emit_mode_suffix_mode(env, smaller_mode);
1747                                 be_emit_cstring(env, "l %");
1748                                 be_emit_string(env, sreg);
1749                                 be_emit_cstring(env, ", ");
1750                                 ia32_emit_dest_register(env, node, 0);
1751                         }
1752                         break;
1753                 case ia32_AddrModeS: {
1754                         be_emit_cstring(env, "\tmov");
1755                         be_emit_string(env, sign_suffix);
1756                         ia32_emit_mode_suffix_mode(env, smaller_mode);
1757                         be_emit_cstring(env, "l ");
1758                         ia32_emit_am(env, node);
1759                         be_emit_cstring(env, ", ");
1760                         ia32_emit_dest_register(env, node, 0);
1761                         break;
1762                 }
1763                 default:
1764                         assert(0 && "unsupported op type for Conv");
1765         }
1766         be_emit_finish_line_gas(env, node);
1767 }
1768
1769 /**
1770  * Emits code for an 8Bit Int conversion.
1771  */
1772 void emit_ia32_Conv_I2I8Bit(ia32_emit_env_t *env, const ir_node *node) {
1773         emit_ia32_Conv_I2I(env, node);
1774 }
1775
1776
1777 /*******************************************
1778  *  _                          _
1779  * | |                        | |
1780  * | |__   ___ _ __   ___   __| | ___  ___
1781  * | '_ \ / _ \ '_ \ / _ \ / _` |/ _ \/ __|
1782  * | |_) |  __/ | | | (_) | (_| |  __/\__ \
1783  * |_.__/ \___|_| |_|\___/ \__,_|\___||___/
1784  *
1785  *******************************************/
1786
1787 /**
1788  * Emits a backend call
1789  */
1790 static
1791 void emit_be_Call(ia32_emit_env_t *env, const ir_node *node) {
1792         ir_entity *ent = be_Call_get_entity(node);
1793
1794         be_emit_cstring(env, "\tcall ");
1795         if (ent) {
1796                 set_entity_backend_marked(ent, 1);
1797                 be_emit_string(env, get_entity_ld_name(ent));
1798         } else {
1799                 be_emit_char(env, '*');
1800                 ia32_emit_dest_register(env, get_irn_n(node, be_pos_Call_ptr), 0);
1801         }
1802         be_emit_finish_line_gas(env, node);
1803 }
1804
1805 /**
1806  * Emits code to increase stack pointer.
1807  */
1808 static
1809 void emit_be_IncSP(ia32_emit_env_t *env, const ir_node *node) {
1810         int offs = be_get_IncSP_offset(node);
1811
1812         if (offs == 0)
1813                 return;
1814
1815         if (offs > 0) {
1816                 be_emit_cstring(env, "\tsubl $");
1817                 be_emit_irprintf(env->emit, "%u, ", offs);
1818                 ia32_emit_source_register(env, node, 0);
1819         } else {
1820                 be_emit_cstring(env, "\taddl $");
1821                 be_emit_irprintf(env->emit, "%u, ", -offs);
1822                 ia32_emit_source_register(env, node, 0);
1823         }
1824         be_emit_finish_line_gas(env, node);
1825 }
1826
1827 /**
1828  * Emits code to set stack pointer.
1829  */
1830 static
1831 void emit_be_SetSP(ia32_emit_env_t *env, const ir_node *node) {
1832         be_emit_cstring(env, "\tmovl ");
1833         ia32_emit_source_register(env, node, 2);
1834         be_emit_cstring(env, ", ");
1835         ia32_emit_dest_register(env, node, 0);
1836         be_emit_finish_line_gas(env, node);
1837 }
1838
1839 /**
1840  * Emits code for Copy/CopyKeep.
1841  */
1842 static
1843 void Copy_emitter(ia32_emit_env_t *env, const ir_node *node, const ir_node *op)
1844 {
1845         const arch_env_t      *arch_env = env->arch_env;
1846         const arch_register_t *in       = arch_get_irn_register(arch_env, op);
1847         const arch_register_t *out      = arch_get_irn_register(arch_env, node);
1848         ir_mode *mode;
1849
1850         if(in == out) {
1851                 return;
1852         }
1853         if(is_unknown_reg(in))
1854                 return;
1855         /* copies of vf nodes aren't real... */
1856         if(arch_register_get_class(in) == &ia32_reg_classes[CLASS_ia32_vfp])
1857                 return;
1858
1859         mode = get_irn_mode(node);
1860         if (mode == mode_E) {
1861                 be_emit_cstring(env, "\tmovsd ");
1862                 ia32_emit_register(env, in);
1863                 be_emit_cstring(env, ", ");
1864                 ia32_emit_register(env, out);
1865         } else {
1866                 be_emit_cstring(env, "\tmovl ");
1867                 ia32_emit_register(env, in);
1868                 be_emit_cstring(env, ", ");
1869                 ia32_emit_register(env, out);
1870         }
1871         be_emit_finish_line_gas(env, node);
1872 }
1873
1874 static
1875 void emit_be_Copy(ia32_emit_env_t *env, const ir_node *node) {
1876         Copy_emitter(env, node, be_get_Copy_op(node));
1877 }
1878
1879 static
1880 void emit_be_CopyKeep(ia32_emit_env_t *env, const ir_node *node) {
1881         Copy_emitter(env, node, be_get_CopyKeep_op(node));
1882 }
1883
1884 /**
1885  * Emits code for exchange.
1886  */
1887 static
1888 void emit_be_Perm(ia32_emit_env_t *env, const ir_node *node) {
1889         const arch_register_t *in1, *in2;
1890         const arch_register_class_t *cls1, *cls2;
1891
1892         in1 = arch_get_irn_register(env->arch_env, get_irn_n(node, 0));
1893         in2 = arch_get_irn_register(env->arch_env, get_irn_n(node, 1));
1894
1895         cls1 = arch_register_get_class(in1);
1896         cls2 = arch_register_get_class(in2);
1897
1898         assert(cls1 == cls2 && "Register class mismatch at Perm");
1899
1900         if (cls1 == &ia32_reg_classes[CLASS_ia32_gp]) {
1901                 be_emit_cstring(env, "\txchg ");
1902                 ia32_emit_source_register(env, node, 1);
1903                 be_emit_cstring(env, ", ");
1904                 ia32_emit_source_register(env, node, 0);
1905                 be_emit_finish_line_gas(env, node);
1906         } else if (cls1 == &ia32_reg_classes[CLASS_ia32_xmm]) {
1907                 be_emit_cstring(env, "\txorpd ");
1908                 ia32_emit_source_register(env, node, 1);
1909                 be_emit_cstring(env, ", ");
1910                 ia32_emit_source_register(env, node, 0);
1911                 be_emit_finish_line_gas(env, NULL);
1912
1913                 be_emit_cstring(env, "\txorpd ");
1914                 ia32_emit_source_register(env, node, 0);
1915                 be_emit_cstring(env, ", ");
1916                 ia32_emit_source_register(env, node, 1);
1917                 be_emit_finish_line_gas(env, NULL);
1918
1919                 be_emit_cstring(env, "\txorpd ");
1920                 ia32_emit_source_register(env, node, 1);
1921                 be_emit_cstring(env, ", ");
1922                 ia32_emit_source_register(env, node, 0);
1923                 be_emit_finish_line_gas(env, node);
1924         } else if (cls1 == &ia32_reg_classes[CLASS_ia32_vfp]) {
1925                 /* is a NOP */
1926         } else if (cls1 == &ia32_reg_classes[CLASS_ia32_st]) {
1927                 /* is a NOP */
1928         }
1929 }
1930
1931 /**
1932  * Emits code for Constant loading.
1933  */
1934 static
1935 void emit_ia32_Const(ia32_emit_env_t *env, const ir_node *node) {
1936         ia32_immop_type_t imm_tp = get_ia32_immop_type(node);
1937
1938         if (imm_tp == ia32_ImmSymConst) {
1939                 be_emit_cstring(env, "\tmovl ");
1940                 ia32_emit_immediate(env, node);
1941                 be_emit_cstring(env, ", ");
1942                 ia32_emit_dest_register(env, node, 0);
1943         } else {
1944                 tarval *tv = get_ia32_Immop_tarval(node);
1945                 assert(get_irn_mode(node) == mode_Iu);
1946                 /* beware: in some rare cases mode is mode_b which has no tarval_null() */
1947                 if (tarval_is_null(tv)) {
1948                         if (env->isa->opt_arch == arch_pentium_4) {
1949                                 /* P4 prefers sub r, r, others xor r, r */
1950                                 be_emit_cstring(env, "\tsubl ");
1951                         } else {
1952                                 be_emit_cstring(env, "\txorl ");
1953                         }
1954                         ia32_emit_dest_register(env, node, 0);
1955                         be_emit_cstring(env, ", ");
1956                         ia32_emit_dest_register(env, node, 0);
1957                 } else {
1958                         be_emit_cstring(env, "\tmovl ");
1959                         ia32_emit_immediate(env, node);
1960                         be_emit_cstring(env, ", ");
1961                         ia32_emit_dest_register(env, node, 0);
1962                 }
1963         }
1964         be_emit_finish_line_gas(env, node);
1965 }
1966
1967 /**
1968  * Emits code to load the TLS base
1969  */
1970 static
1971 void emit_ia32_LdTls(ia32_emit_env_t *env, const ir_node *node) {
1972         be_emit_cstring(env, "\tmovl %gs:0, ");
1973         ia32_emit_dest_register(env, node, 0);
1974         be_emit_finish_line_gas(env, node);
1975 }
1976
1977 static
1978 void emit_be_Return(ia32_emit_env_t *env, const ir_node *node)
1979 {
1980         be_emit_cstring(env, "\tret");
1981         be_emit_finish_line_gas(env, node);
1982 }
1983
1984 static
1985 void emit_Nothing(ia32_emit_env_t *env, const ir_node *node)
1986 {
1987         (void) env;
1988         (void) node;
1989 }
1990
1991
1992 /***********************************************************************************
1993  *                  _          __                                             _
1994  *                 (_)        / _|                                           | |
1995  *  _ __ ___   __ _ _ _ __   | |_ _ __ __ _ _ __ ___   _____      _____  _ __| | __
1996  * | '_ ` _ \ / _` | | '_ \  |  _| '__/ _` | '_ ` _ \ / _ \ \ /\ / / _ \| '__| |/ /
1997  * | | | | | | (_| | | | | | | | | | | (_| | | | | | |  __/\ V  V / (_) | |  |   <
1998  * |_| |_| |_|\__,_|_|_| |_| |_| |_|  \__,_|_| |_| |_|\___| \_/\_/ \___/|_|  |_|\_\
1999  *
2000  ***********************************************************************************/
2001
2002 /**
2003  * Enters the emitter functions for handled nodes into the generic
2004  * pointer of an opcode.
2005  */
2006 static
2007 void ia32_register_emitters(void) {
2008
2009 #define IA32_EMIT2(a,b) op_ia32_##a->ops.generic = (op_func)emit_ia32_##b
2010 #define IA32_EMIT(a)    IA32_EMIT2(a,a)
2011 #define EMIT(a)         op_##a->ops.generic = (op_func)emit_##a
2012 #define IGN(a)                  op_##a->ops.generic = (op_func)emit_Nothing
2013 #define BE_EMIT(a)      op_be_##a->ops.generic = (op_func)emit_be_##a
2014 #define BE_IGN(a)               op_be_##a->ops.generic = (op_func)emit_Nothing
2015
2016         /* first clear the generic function pointer for all ops */
2017         clear_irp_opcodes_generic_func();
2018
2019         /* register all emitter functions defined in spec */
2020         ia32_register_spec_emitters();
2021
2022         /* other ia32 emitter functions */
2023         IA32_EMIT(Asm);
2024         IA32_EMIT(CondJmp);
2025         IA32_EMIT(TestJmp);
2026         IA32_EMIT(CmpCMov);
2027         IA32_EMIT(TestCMov);
2028         IA32_EMIT(CmpSet);
2029         IA32_EMIT(TestSet);
2030         IA32_EMIT(SwitchJmp);
2031         IA32_EMIT(CopyB);
2032         IA32_EMIT(CopyB_i);
2033         IA32_EMIT(Conv_I2FP);
2034         IA32_EMIT(Conv_FP2I);
2035         IA32_EMIT(Conv_FP2FP);
2036         IA32_EMIT(Conv_I2I);
2037         IA32_EMIT(Conv_I2I8Bit);
2038         IA32_EMIT(Const);
2039         IA32_EMIT(LdTls);
2040         IA32_EMIT(xCmp);
2041         IA32_EMIT(xCmpSet);
2042         IA32_EMIT(xCmpCMov);
2043         IA32_EMIT(xCondJmp);
2044         IA32_EMIT2(fcomJmp, x87CondJmp);
2045         IA32_EMIT2(fcompJmp, x87CondJmp);
2046         IA32_EMIT2(fcomppJmp, x87CondJmp);
2047         IA32_EMIT2(fcomrJmp, x87CondJmp);
2048         IA32_EMIT2(fcomrpJmp, x87CondJmp);
2049         IA32_EMIT2(fcomrppJmp, x87CondJmp);
2050
2051         /* benode emitter */
2052         BE_EMIT(Call);
2053         BE_EMIT(IncSP);
2054         BE_EMIT(SetSP);
2055         BE_EMIT(Copy);
2056         BE_EMIT(CopyKeep);
2057         BE_EMIT(Perm);
2058         BE_EMIT(Return);
2059
2060         BE_IGN(RegParams);
2061         BE_IGN(Barrier);
2062         BE_IGN(Keep);
2063
2064         /* firm emitter */
2065         EMIT(Jmp);
2066         IGN(Proj);
2067         IGN(Phi);
2068         IGN(Start);
2069
2070 #undef BE_EMIT
2071 #undef EMIT
2072 #undef IGN
2073 #undef IA32_EMIT2
2074 #undef IA32_EMIT
2075 }
2076
2077 static const char *last_name = NULL;
2078 static unsigned last_line = -1;
2079 static unsigned num = -1;
2080
2081 /**
2082  * Emit the debug support for node node.
2083  */
2084 static
2085 void ia32_emit_dbg(ia32_emit_env_t *env, const ir_node *node) {
2086         dbg_info *db = get_irn_dbg_info(node);
2087         unsigned lineno;
2088         const char *fname = be_retrieve_dbg_info(db, &lineno);
2089
2090         if (! env->cg->birg->main_env->options->stabs_debug_support)
2091                 return;
2092
2093         if (fname) {
2094                 if (last_name != fname) {
2095                         last_line = -1;
2096                         be_dbg_include_begin(env->cg->birg->main_env->db_handle, fname);
2097                         last_name = fname;
2098                 }
2099                 if (last_line != lineno) {
2100                         char name[64];
2101
2102                         snprintf(name, sizeof(name), ".LM%u", ++num);
2103                         last_line = lineno;
2104                         be_dbg_line(env->cg->birg->main_env->db_handle, lineno, name);
2105                         be_emit_string(env, name);
2106                         be_emit_cstring(env, ":\n");
2107                         be_emit_write_line(env);
2108                 }
2109         }
2110 }
2111
2112 typedef void (*emit_func_ptr) (ia32_emit_env_t *, const ir_node *);
2113
2114 /**
2115  * Emits code for a node.
2116  */
2117 static
2118 void ia32_emit_node(ia32_emit_env_t *env, const ir_node *node) {
2119         ir_op *op = get_irn_op(node);
2120
2121         DBG((dbg, LEVEL_1, "emitting code for %+F\n", node));
2122
2123         if (op->ops.generic) {
2124                 emit_func_ptr func = (emit_func_ptr) op->ops.generic;
2125                 ia32_emit_dbg(env, node);
2126                 (*func) (env, node);
2127         } else {
2128                 emit_Nothing(env, node);
2129                 ir_fprintf(stderr, "Error: No emit handler for node %+F (%+G, graph %+F)\n", node, node, current_ir_graph);
2130                 abort();
2131         }
2132 }
2133
2134 /**
2135  * Emits gas alignment directives
2136  */
2137 static
2138 void ia32_emit_alignment(ia32_emit_env_t *env, unsigned align, unsigned skip) {
2139         be_emit_cstring(env, "\t.p2align ");
2140         be_emit_irprintf(env->emit, "%u,,%u\n", align, skip);
2141         be_emit_write_line(env);
2142 }
2143
2144 /**
2145  * Emits gas alignment directives for Functions depended on cpu architecture.
2146  */
2147 static
2148 void ia32_emit_align_func(ia32_emit_env_t *env, cpu_support cpu) {
2149         unsigned align;
2150         unsigned maximum_skip;
2151
2152         switch (cpu) {
2153                 case arch_i386:
2154                         align = 2;
2155                         break;
2156                 case arch_i486:
2157                         align = 4;
2158                         break;
2159                 case arch_k6:
2160                         align = 5;
2161                         break;
2162                 default:
2163                         align = 4;
2164         }
2165         maximum_skip = (1 << align) - 1;
2166         ia32_emit_alignment(env, align, maximum_skip);
2167 }
2168
2169 /**
2170  * Emits gas alignment directives for Labels depended on cpu architecture.
2171  */
2172 static
2173 void ia32_emit_align_label(ia32_emit_env_t *env, cpu_support cpu) {
2174         unsigned align; unsigned maximum_skip;
2175
2176         switch (cpu) {
2177                 case arch_i386:
2178                         align = 2;
2179                         break;
2180                 case arch_i486:
2181                         align = 4;
2182                         break;
2183                 case arch_k6:
2184                         align = 5;
2185                         break;
2186                 default:
2187                         align = 4;
2188         }
2189         maximum_skip = (1 << align) - 1;
2190         ia32_emit_alignment(env, align, maximum_skip);
2191 }
2192
2193 /**
2194  * Test wether a block should be aligned.
2195  * For cpus in the P4/Athlon class it is usefull to align jump labels to
2196  * 16 bytes. However we should only do that if the alignment nops before the
2197  * label aren't executed more often than we have jumps to the label.
2198  */
2199 static
2200 int should_align_block(ia32_emit_env_t *env, ir_node *block, ir_node *prev) {
2201         static const double DELTA = .0001;
2202         ir_exec_freq *exec_freq = env->cg->birg->exec_freq;
2203         double        block_freq;
2204         double        prev_freq = 0;  /**< execfreq of the fallthrough block */
2205         double        jmp_freq  = 0;  /**< execfreq of all non-fallthrough blocks */
2206         cpu_support   cpu       = env->isa->opt_arch;
2207         int           i, n_cfgpreds;
2208
2209         if(exec_freq == NULL)
2210                 return 0;
2211         if(cpu == arch_i386 || cpu == arch_i486)
2212                 return 0;
2213
2214         block_freq = get_block_execfreq(exec_freq, block);
2215         if(block_freq < DELTA)
2216                 return 0;
2217
2218         n_cfgpreds = get_Block_n_cfgpreds(block);
2219         for(i = 0; i < n_cfgpreds; ++i) {
2220                 ir_node *pred      = get_Block_cfgpred_block(block, i);
2221                 double   pred_freq = get_block_execfreq(exec_freq, pred);
2222
2223                 if(pred == prev) {
2224                         prev_freq += pred_freq;
2225                 } else {
2226                         jmp_freq  += pred_freq;
2227                 }
2228         }
2229
2230         if(prev_freq < DELTA && !(jmp_freq < DELTA))
2231                 return 1;
2232
2233         jmp_freq /= prev_freq;
2234
2235         switch (cpu) {
2236                 case arch_athlon:
2237                 case arch_athlon_64:
2238                 case arch_k6:
2239                         return jmp_freq > 3;
2240                 default:
2241                         return jmp_freq > 2;
2242         }
2243 }
2244
2245 static
2246 void ia32_emit_block_header(ia32_emit_env_t *env, ir_node *block, ir_node *prev)
2247 {
2248         int           n_cfgpreds;
2249         int           need_label;
2250         int           i, arity;
2251         ir_exec_freq  *exec_freq = env->cg->birg->exec_freq;
2252
2253         n_cfgpreds = get_Block_n_cfgpreds(block);
2254         need_label = (n_cfgpreds != 0);
2255
2256         if (should_align_block(env, block, prev)) {
2257                 assert(need_label);
2258                 ia32_emit_align_label(env, env->isa->opt_arch);
2259         }
2260
2261         if(need_label) {
2262                 ia32_emit_block_name(env, block);
2263                 be_emit_char(env, ':');
2264
2265                 be_emit_pad_comment(env);
2266                 be_emit_cstring(env, "   /* preds:");
2267
2268                 /* emit list of pred blocks in comment */
2269                 arity = get_irn_arity(block);
2270                 for (i = 0; i < arity; ++i) {
2271                         ir_node *predblock = get_Block_cfgpred_block(block, i);
2272                         be_emit_irprintf(env->emit, " %d", get_irn_node_nr(predblock));
2273                 }
2274         } else {
2275                 be_emit_cstring(env, "\t/* ");
2276                 ia32_emit_block_name(env, block);
2277                 be_emit_cstring(env, ": ");
2278         }
2279         if (exec_freq != NULL) {
2280                 be_emit_irprintf(env->emit, " freq: %f",
2281                                  get_block_execfreq(exec_freq, block));
2282         }
2283         be_emit_cstring(env, " */\n");
2284         be_emit_write_line(env);
2285 }
2286
2287 /**
2288  * Walks over the nodes in a block connected by scheduling edges
2289  * and emits code for each node.
2290  */
2291 static
2292 void ia32_gen_block(ia32_emit_env_t *env, ir_node *block, ir_node *last_block)
2293 {
2294         const ir_node *node;
2295
2296         ia32_emit_block_header(env, block, last_block);
2297
2298         /* emit the contents of the block */
2299         ia32_emit_dbg(env, block);
2300         sched_foreach(block, node) {
2301                 ia32_emit_node(env, node);
2302         }
2303 }
2304
2305 /**
2306  * Emits code for function start.
2307  */
2308 static
2309 void ia32_emit_func_prolog(ia32_emit_env_t *env, ir_graph *irg) {
2310         ir_entity  *irg_ent  = get_irg_entity(irg);
2311         const char *irg_name = get_entity_ld_name(irg_ent);
2312         cpu_support cpu      = env->isa->opt_arch;
2313         const be_irg_t *birg = env->cg->birg;
2314
2315         be_emit_write_line(env);
2316         be_gas_emit_switch_section(env->emit, GAS_SECTION_TEXT);
2317         be_dbg_method_begin(birg->main_env->db_handle, irg_ent, be_abi_get_stack_layout(birg->abi));
2318         ia32_emit_align_func(env, cpu);
2319         if (get_entity_visibility(irg_ent) == visibility_external_visible) {
2320                 be_emit_cstring(env, ".global ");
2321                 be_emit_string(env, irg_name);
2322                 be_emit_char(env, '\n');
2323                 be_emit_write_line(env);
2324         }
2325         ia32_emit_function_object(env, irg_name);
2326         be_emit_string(env, irg_name);
2327         be_emit_cstring(env, ":\n");
2328         be_emit_write_line(env);
2329 }
2330
2331 /**
2332  * Emits code for function end
2333  */
2334 static
2335 void ia32_emit_func_epilog(ia32_emit_env_t *env, ir_graph *irg) {
2336         const char *irg_name = get_entity_ld_name(get_irg_entity(irg));
2337         const be_irg_t *birg = env->cg->birg;
2338
2339         ia32_emit_function_size(env, irg_name);
2340         be_dbg_method_end(birg->main_env->db_handle);
2341         be_emit_char(env, '\n');
2342         be_emit_write_line(env);
2343 }
2344
2345 /**
2346  * Block-walker:
2347  * Sets labels for control flow nodes (jump target)
2348  */
2349 static
2350 void ia32_gen_labels(ir_node *block, void *data)
2351 {
2352         ir_node *pred;
2353         int n = get_Block_n_cfgpreds(block);
2354         (void) data;
2355
2356         for (n--; n >= 0; n--) {
2357                 pred = get_Block_cfgpred(block, n);
2358                 set_irn_link(pred, block);
2359         }
2360 }
2361
2362 /**
2363  * Emit an exception label if the current instruction can fail.
2364  */
2365 void ia32_emit_exc_label(ia32_emit_env_t *env, const ir_node *node) {
2366         if (get_ia32_exc_label(node)) {
2367                 be_emit_irprintf(env->emit, ".EXL%u\n", 0);
2368                 be_emit_write_line(env);
2369         }
2370 }
2371
2372 /**
2373  * Main driver. Emits the code for one routine.
2374  */
2375 void ia32_gen_routine(ia32_code_gen_t *cg, ir_graph *irg) {
2376         ia32_emit_env_t env;
2377         ir_node *block;
2378         ir_node *last_block = NULL;
2379         int i, n;
2380
2381         env.isa      = (ia32_isa_t *)cg->arch_env->isa;
2382         env.emit     = &env.isa->emit;
2383         env.arch_env = cg->arch_env;
2384         env.cg       = cg;
2385
2386         ia32_register_emitters();
2387
2388         ia32_emit_func_prolog(&env, irg);
2389         irg_block_walk_graph(irg, ia32_gen_labels, NULL, &env);
2390
2391         n = ARR_LEN(cg->blk_sched);
2392         for (i = 0; i < n;) {
2393                 ir_node *next_bl;
2394
2395                 block   = cg->blk_sched[i];
2396                 ++i;
2397                 next_bl = i < n ? cg->blk_sched[i] : NULL;
2398
2399                 /* set here the link. the emitter expects to find the next block here */
2400                 set_irn_link(block, next_bl);
2401                 ia32_gen_block(&env, block, last_block);
2402                 last_block = block;
2403         }
2404
2405         ia32_emit_func_epilog(&env, irg);
2406 }
2407
2408 void ia32_init_emitter(void)
2409 {
2410         FIRM_DBG_REGISTER(dbg, "firm.be.ia32.emitter");
2411 }