sparc: Keep stack pointer 8 bytes aligned when generating code for MemPerm.
[libfirm] / ir / be / sparc / sparc_emitter.c
1 /*
2  * Copyright (C) 1995-2010 University of Karlsruhe.  All right reserved.
3  *
4  * This file is part of libFirm.
5  *
6  * This file may be distributed and/or modified under the terms of the
7  * GNU General Public License version 2 as published by the Free Software
8  * Foundation and appearing in the file LICENSE.GPL included in the
9  * packaging of this file.
10  *
11  * Licensees holding valid libFirm Professional Edition licenses may use
12  * this file in accordance with the libFirm Commercial License.
13  * Agreement provided with the Software.
14  *
15  * This file is provided AS IS with NO WARRANTY OF ANY KIND, INCLUDING THE
16  * WARRANTY OF DESIGN, MERCHANTABILITY AND FITNESS FOR A PARTICULAR
17  * PURPOSE.
18  */
19
20 /**
21  * @file
22  * @brief   emit assembler for a backend graph
23  * @author  Hannes Rapp, Matthias Braun
24  * @version $Id$
25  */
26 #include "config.h"
27
28 #include <limits.h>
29
30 #include "xmalloc.h"
31 #include "tv.h"
32 #include "iredges.h"
33 #include "debug.h"
34 #include "irgwalk.h"
35 #include "irprintf.h"
36 #include "irop_t.h"
37 #include "irargs_t.h"
38 #include "irprog.h"
39 #include "irargs_t.h"
40 #include "error.h"
41 #include "raw_bitset.h"
42 #include "dbginfo.h"
43 #include "heights.h"
44
45 #include "../besched.h"
46 #include "../beblocksched.h"
47 #include "../beirg.h"
48 #include "../begnuas.h"
49 #include "../be_dbgout.h"
50 #include "../benode.h"
51 #include "../bestack.h"
52
53 #include "sparc_emitter.h"
54 #include "gen_sparc_emitter.h"
55 #include "sparc_nodes_attr.h"
56 #include "sparc_new_nodes.h"
57 #include "gen_sparc_regalloc_if.h"
58
59 DEBUG_ONLY(static firm_dbg_module_t *dbg = NULL;)
60
61 static ir_heights_t  *heights;
62 static const ir_node *delay_slot_filler; /**< this node has been choosen to fill
63                                               the next delay slot */
64
65 static void sparc_emit_node(const ir_node *node);
66
67 void sparc_emit_immediate(const ir_node *node)
68 {
69         const sparc_attr_t *attr   = get_sparc_attr_const(node);
70         ir_entity          *entity = attr->immediate_value_entity;
71
72         if (entity == NULL) {
73                 int32_t value = attr->immediate_value;
74                 assert(sparc_is_value_imm_encodeable(value));
75                 be_emit_irprintf("%d", value);
76         } else {
77                 if (get_entity_owner(entity) == get_tls_type()) {
78                         be_emit_cstring("%tle_lox10(");
79                 } else {
80                         be_emit_cstring("%lo(");
81                 }
82                 be_gas_emit_entity(entity);
83                 if (attr->immediate_value != 0) {
84                         be_emit_irprintf("%+d", attr->immediate_value);
85                 }
86                 be_emit_char(')');
87         }
88 }
89
90 void sparc_emit_high_immediate(const ir_node *node)
91 {
92         const sparc_attr_t *attr   = get_sparc_attr_const(node);
93         ir_entity          *entity = attr->immediate_value_entity;
94
95         if (entity == NULL) {
96                 uint32_t value = (uint32_t) attr->immediate_value;
97                 be_emit_irprintf("%%hi(0x%X)", value);
98         } else {
99                 if (get_entity_owner(entity) == get_tls_type()) {
100                         be_emit_cstring("%tle_hix22(");
101                 } else {
102                         be_emit_cstring("%hi(");
103                 }
104                 be_gas_emit_entity(entity);
105                 if (attr->immediate_value != 0) {
106                         be_emit_irprintf("%+d", attr->immediate_value);
107                 }
108                 be_emit_char(')');
109         }
110 }
111
112 void sparc_emit_source_register(const ir_node *node, int pos)
113 {
114         const arch_register_t *reg = arch_get_irn_register_in(node, pos);
115         be_emit_char('%');
116         be_emit_string(arch_register_get_name(reg));
117 }
118
119 void sparc_emit_dest_register(const ir_node *node, int pos)
120 {
121         const arch_register_t *reg = arch_get_irn_register_out(node, pos);
122         be_emit_char('%');
123         be_emit_string(arch_register_get_name(reg));
124 }
125
126 /**
127  * Emits either a imm or register depending on arity of node
128  * @param node
129  * @param register no (-1 if no register)
130  */
131 void sparc_emit_reg_or_imm(const ir_node *node, int pos)
132 {
133         if (arch_get_irn_flags(node) & ((arch_irn_flags_t)sparc_arch_irn_flag_immediate_form)) {
134                 // we have a imm input
135                 sparc_emit_immediate(node);
136         } else {
137                 // we have reg input
138                 sparc_emit_source_register(node, pos);
139         }
140 }
141
142 /**
143  * emit SP offset
144  */
145 void sparc_emit_offset(const ir_node *node, int offset_node_pos)
146 {
147         const sparc_load_store_attr_t *attr = get_sparc_load_store_attr_const(node);
148
149         if (attr->is_reg_reg) {
150                 assert(!attr->is_frame_entity);
151                 assert(attr->base.immediate_value == 0);
152                 assert(attr->base.immediate_value_entity == NULL);
153                 be_emit_char('+');
154                 sparc_emit_source_register(node, offset_node_pos);
155         } else if (attr->is_frame_entity) {
156                 int32_t offset = attr->base.immediate_value;
157                 if (offset != 0) {
158                         assert(sparc_is_value_imm_encodeable(offset));
159                         be_emit_irprintf("%+ld", offset);
160                 }
161         } else if (attr->base.immediate_value != 0
162                         || attr->base.immediate_value_entity != NULL) {
163                 be_emit_char('+');
164                 sparc_emit_immediate(node);
165         }
166 }
167
168 void sparc_emit_float_load_store_mode(const ir_node *node)
169 {
170         const sparc_load_store_attr_t *attr = get_sparc_load_store_attr_const(node);
171         ir_mode *mode = attr->load_store_mode;
172         int      bits = get_mode_size_bits(mode);
173
174         assert(mode_is_float(mode));
175
176         switch (bits) {
177         case 32:  return;
178         case 64:  be_emit_char('d'); return;
179         case 128: be_emit_char('q'); return;
180         }
181         panic("invalid flaot load/store mode %+F", mode);
182 }
183
184 /**
185  *  Emit load mode char
186  */
187 void sparc_emit_load_mode(const ir_node *node)
188 {
189         const sparc_load_store_attr_t *attr = get_sparc_load_store_attr_const(node);
190         ir_mode *mode      = attr->load_store_mode;
191         int      bits      = get_mode_size_bits(mode);
192         bool     is_signed = mode_is_signed(mode);
193
194         if (bits == 16) {
195                 be_emit_string(is_signed ? "sh" : "uh");
196         } else if (bits == 8) {
197                 be_emit_string(is_signed ? "sb" : "ub");
198         } else if (bits == 64) {
199                 be_emit_char('d');
200         } else {
201                 assert(bits == 32);
202         }
203 }
204
205 /**
206  * Emit store mode char
207  */
208 void sparc_emit_store_mode(const ir_node *node)
209 {
210         const sparc_load_store_attr_t *attr = get_sparc_load_store_attr_const(node);
211         ir_mode *mode      = attr->load_store_mode;
212         int      bits      = get_mode_size_bits(mode);
213
214         if (bits == 16) {
215                 be_emit_string("h");
216         } else if (bits == 8) {
217                 be_emit_string("b");
218         } else if (bits == 64) {
219                 be_emit_char('d');
220         } else {
221                 assert(bits == 32);
222         }
223 }
224
225 static void emit_fp_suffix(const ir_mode *mode)
226 {
227         unsigned bits = get_mode_size_bits(mode);
228         assert(mode_is_float(mode));
229
230         if (bits == 32) {
231                 be_emit_char('s');
232         } else if (bits == 64) {
233                 be_emit_char('d');
234         } else if (bits == 128) {
235                 be_emit_char('q');
236         } else {
237                 panic("invalid FP mode");
238         }
239 }
240
241 void sparc_emit_fp_conv_source(const ir_node *node)
242 {
243         const sparc_fp_conv_attr_t *attr = get_sparc_fp_conv_attr_const(node);
244         emit_fp_suffix(attr->src_mode);
245 }
246
247 void sparc_emit_fp_conv_destination(const ir_node *node)
248 {
249         const sparc_fp_conv_attr_t *attr = get_sparc_fp_conv_attr_const(node);
250         emit_fp_suffix(attr->dest_mode);
251 }
252
253 /**
254  * emits the FP mode suffix char
255  */
256 void sparc_emit_fp_mode_suffix(const ir_node *node)
257 {
258         const sparc_fp_attr_t *attr = get_sparc_fp_attr_const(node);
259         emit_fp_suffix(attr->fp_mode);
260 }
261
262 static ir_node *get_jump_target(const ir_node *jump)
263 {
264         return (ir_node*)get_irn_link(jump);
265 }
266
267 /**
268  * Returns the target label for a control flow node.
269  */
270 static void sparc_emit_cfop_target(const ir_node *node)
271 {
272         ir_node *block = get_jump_target(node);
273         be_gas_emit_block_name(block);
274 }
275
276 static int get_sparc_Call_dest_addr_pos(const ir_node *node)
277 {
278         return get_irn_arity(node)-1;
279 }
280
281 static bool ba_is_fallthrough(const ir_node *node)
282 {
283         ir_node *block      = get_nodes_block(node);
284         ir_node *next_block = (ir_node*)get_irn_link(block);
285         return get_irn_link(node) == next_block;
286 }
287
288 static bool is_no_instruction(const ir_node *node)
289 {
290         /* copies are nops if src_reg == dest_reg */
291         if (be_is_Copy(node) || be_is_CopyKeep(node)) {
292                 const arch_register_t *src_reg  = arch_get_irn_register_in(node, 0);
293                 const arch_register_t *dest_reg = arch_get_irn_register_out(node, 0);
294
295                 if (src_reg == dest_reg)
296                         return true;
297         }
298         if (be_is_IncSP(node) && be_get_IncSP_offset(node) == 0)
299                 return true;
300         /* Ba is not emitted if it is a simple fallthrough */
301         if (is_sparc_Ba(node) && ba_is_fallthrough(node))
302                 return true;
303
304         return be_is_Keep(node) || be_is_Start(node) || is_Phi(node);
305 }
306
307 static bool has_delay_slot(const ir_node *node)
308 {
309         if (is_sparc_Ba(node) && ba_is_fallthrough(node))
310                 return false;
311
312         return is_sparc_Bicc(node) || is_sparc_fbfcc(node) || is_sparc_Ba(node)
313                 || is_sparc_SwitchJmp(node) || is_sparc_Call(node)
314                 || is_sparc_SDiv(node) || is_sparc_UDiv(node)
315                 || is_sparc_Return(node);
316 }
317
318 /** returns true if the emitter for this sparc node can produce more than one
319  * actual sparc instruction.
320  * Usually it is a bad sign if we have to add instructions here. We should
321  * rather try to get them lowered down. So we can actually put them into
322  * delay slots and make them more accessible to the scheduler.
323  */
324 static bool emits_multiple_instructions(const ir_node *node)
325 {
326         if (has_delay_slot(node))
327                 return true;
328
329         if (is_sparc_Call(node)) {
330                 return arch_get_irn_flags(node) & sparc_arch_irn_flag_aggregate_return;
331         }
332
333         return is_sparc_SMulh(node) || is_sparc_UMulh(node)
334                 || is_sparc_SDiv(node) || is_sparc_UDiv(node)
335                 || be_is_MemPerm(node) || be_is_Perm(node);
336 }
337
338 /**
339  * search for an instruction that can fill the delay slot of @p node
340  */
341 static const ir_node *pick_delay_slot_for(const ir_node *node)
342 {
343         const ir_node *check      = node;
344         const ir_node *schedpoint = node;
345         unsigned       tries      = 0;
346         /* currently we don't track which registers are still alive, so we can't
347          * pick any other instructions other than the one directly preceding */
348         static const unsigned PICK_DELAY_SLOT_MAX_DISTANCE = 1;
349
350         assert(has_delay_slot(node));
351
352         if (is_sparc_Call(node)) {
353                 const sparc_attr_t *attr   = get_sparc_attr_const(node);
354                 ir_entity          *entity = attr->immediate_value_entity;
355                 if (entity != NULL) {
356                         check = NULL; /* pick any instruction, dependencies on Call
357                                          don't matter */
358                 } else {
359                         /* we only need to check the value for the call destination */
360                         check = get_irn_n(node, get_sparc_Call_dest_addr_pos(node));
361                 }
362
363                 /* the Call also destroys the value of %o7, but since this is currently
364                  * marked as ignore register in the backend, it should never be used by
365                  * the instruction in the delay slot. */
366         } else if (is_sparc_Return(node)) {
367                 /* we only have to check the jump destination value */
368                 int arity = get_irn_arity(node);
369                 int i;
370
371                 check = NULL;
372                 for (i = 0; i < arity; ++i) {
373                         ir_node               *in  = get_irn_n(node, i);
374                         const arch_register_t *reg = arch_get_irn_register(in);
375                         if (reg == &sparc_registers[REG_O7]) {
376                                 check = skip_Proj(in);
377                                 break;
378                         }
379                 }
380         } else {
381                 check = node;
382         }
383
384         while (sched_has_prev(schedpoint)) {
385                 schedpoint = sched_prev(schedpoint);
386
387                 if (has_delay_slot(schedpoint))
388                         break;
389
390                 /* skip things which don't really result in instructions */
391                 if (is_no_instruction(schedpoint))
392                         continue;
393
394                 if (tries++ >= PICK_DELAY_SLOT_MAX_DISTANCE)
395                         break;
396
397                 if (emits_multiple_instructions(schedpoint))
398                         continue;
399
400                 /* if check and schedpoint are not in the same block, give up. */
401                 if (check != NULL
402                                 && get_nodes_block(check) != get_nodes_block(schedpoint))
403                         break;
404
405                 /* allowed for delayslot: any instruction which is not necessary to
406                  * compute an input to the branch. */
407                 if (check != NULL
408                                 && heights_reachable_in_block(heights, check, schedpoint))
409                         continue;
410
411                 /* found something */
412                 return schedpoint;
413         }
414
415         return NULL;
416 }
417
418 /**
419  * Emits code for stack space management
420  */
421 static void emit_be_IncSP(const ir_node *irn)
422 {
423         int offset = be_get_IncSP_offset(irn);
424
425         if (offset == 0)
426                 return;
427
428         /* SPARC stack grows downwards */
429         if (offset < 0) {
430                 be_emit_cstring("\tsub ");
431                 offset = -offset;
432         } else {
433                 be_emit_cstring("\tadd ");
434         }
435
436         sparc_emit_source_register(irn, 0);
437         be_emit_irprintf(", %d", -offset);
438         be_emit_cstring(", ");
439         sparc_emit_dest_register(irn, 0);
440         be_emit_finish_line_gas(irn);
441 }
442
443 /**
444  * emits code for mulh
445  */
446 static void emit_sparc_Mulh(const ir_node *irn)
447 {
448         be_emit_cstring("\t");
449         if (is_sparc_UMulh(irn)) {
450                 be_emit_char('u');
451         } else {
452                 assert(is_sparc_SMulh(irn));
453                 be_emit_char('s');
454         }
455         be_emit_cstring("mul ");
456
457         sparc_emit_source_register(irn, 0);
458         be_emit_cstring(", ");
459         sparc_emit_reg_or_imm(irn, 1);
460         be_emit_cstring(", ");
461         sparc_emit_dest_register(irn, 0);
462         be_emit_finish_line_gas(irn);
463
464         // our result is in the y register now
465         // we just copy it to the assigned target reg
466         be_emit_cstring("\tmov %y, ");
467         sparc_emit_dest_register(irn, 0);
468         be_emit_finish_line_gas(irn);
469 }
470
471 static void fill_delay_slot(void)
472 {
473         if (delay_slot_filler != NULL) {
474                 sparc_emit_node(delay_slot_filler);
475                 delay_slot_filler = NULL;
476         } else {
477                 be_emit_cstring("\tnop\n");
478                 be_emit_write_line();
479         }
480 }
481
482 static void emit_sparc_Div(const ir_node *node, bool is_signed)
483 {
484         /* can we get the delay count of the wr instruction somewhere? */
485         unsigned wry_delay_count = 3;
486         unsigned i;
487
488         be_emit_cstring("\twr ");
489         sparc_emit_source_register(node, 0);
490         be_emit_cstring(", 0, %y");
491         be_emit_finish_line_gas(node);
492
493         for (i = 0; i < wry_delay_count; ++i) {
494                 fill_delay_slot();
495         }
496
497         be_emit_irprintf("\t%s ", is_signed ? "sdiv" : "udiv");
498         sparc_emit_source_register(node, 1);
499         be_emit_cstring(", ");
500         sparc_emit_reg_or_imm(node, 2);
501         be_emit_cstring(", ");
502         sparc_emit_dest_register(node, 0);
503         be_emit_finish_line_gas(node);
504 }
505
506 static void emit_sparc_SDiv(const ir_node *node)
507 {
508         emit_sparc_Div(node, true);
509 }
510
511 static void emit_sparc_UDiv(const ir_node *node)
512 {
513         emit_sparc_Div(node, false);
514 }
515
516 /**
517  * Emits code for Call node
518  */
519 static void emit_sparc_Call(const ir_node *node)
520 {
521         const sparc_attr_t *attr   = get_sparc_attr_const(node);
522         ir_entity          *entity = attr->immediate_value_entity;
523
524         be_emit_cstring("\tcall ");
525         if (entity != NULL) {
526             be_gas_emit_entity(entity);
527             if (attr->immediate_value != 0) {
528                         be_emit_irprintf("%+d", attr->immediate_value);
529                 }
530                 be_emit_cstring(", 0");
531         } else {
532                 int dest_addr = get_sparc_Call_dest_addr_pos(node);
533                 sparc_emit_source_register(node, dest_addr);
534         }
535         be_emit_finish_line_gas(node);
536
537         fill_delay_slot();
538
539         if (arch_get_irn_flags(node) & sparc_arch_irn_flag_aggregate_return) {
540                 be_emit_cstring("\tunimp 8\n");
541                 be_emit_write_line();
542         }
543 }
544
545 /**
546  * Emit code for Perm node
547  */
548 static void emit_be_Perm(const ir_node *irn)
549 {
550         be_emit_cstring("\txor ");
551         sparc_emit_source_register(irn, 1);
552         be_emit_cstring(", ");
553         sparc_emit_source_register(irn, 0);
554         be_emit_cstring(", ");
555         sparc_emit_source_register(irn, 0);
556         be_emit_finish_line_gas(NULL);
557
558         be_emit_cstring("\txor ");
559         sparc_emit_source_register(irn, 1);
560         be_emit_cstring(", ");
561         sparc_emit_source_register(irn, 0);
562         be_emit_cstring(", ");
563         sparc_emit_source_register(irn, 1);
564         be_emit_finish_line_gas(NULL);
565
566         be_emit_cstring("\txor ");
567         sparc_emit_source_register(irn, 1);
568         be_emit_cstring(", ");
569         sparc_emit_source_register(irn, 0);
570         be_emit_cstring(", ");
571         sparc_emit_source_register(irn, 0);
572         be_emit_finish_line_gas(irn);
573 }
574
575 /* The stack pointer must always be 8 bytes aligned, so get the next bigger
576  * integer that's evenly divisible by 8. */
577 static unsigned get_aligned_sp_change(int memperm_arity)
578 {
579         const unsigned bytes = ((unsigned) memperm_arity) * 4;
580         return (bytes + 7) & ~7U;
581 }
582
583 static void emit_be_MemPerm(const ir_node *node)
584 {
585         int      i;
586         int      memperm_arity;
587         unsigned aligned_sp_change;
588         int      sp_change = 0;
589         ir_graph          *irg    = get_irn_irg(node);
590         be_stack_layout_t *layout = be_get_irg_stack_layout(irg);
591
592         /* this implementation only works with frame pointers currently */
593         assert(layout->sp_relative == false);
594
595         /* TODO: this implementation is slower than necessary.
596            The longterm goal is however to avoid the memperm node completely */
597
598         memperm_arity = be_get_MemPerm_entity_arity(node);
599         // we use our local registers - so this is limited to 8 inputs !
600         if (memperm_arity > 8)
601                 panic("memperm with more than 8 inputs not supported yet");
602
603         aligned_sp_change = get_aligned_sp_change(memperm_arity);
604         be_emit_irprintf("\tsub %%sp, %u, %%sp", aligned_sp_change);
605         be_emit_finish_line_gas(node);
606
607         for (i = 0; i < memperm_arity; ++i) {
608                 ir_entity *entity = be_get_MemPerm_in_entity(node, i);
609                 int        offset = be_get_stack_entity_offset(layout, entity, 0);
610
611                 /* spill register */
612                 be_emit_irprintf("\tst %%l%d, [%%sp%+d]", i, sp_change + SPARC_MIN_STACKSIZE);
613                 be_emit_finish_line_gas(node);
614
615                 /* load from entity */
616                 be_emit_irprintf("\tld [%%fp%+d], %%l%d", offset, i);
617                 be_emit_finish_line_gas(node);
618                 sp_change += 4;
619         }
620
621         for (i = memperm_arity-1; i >= 0; --i) {
622                 ir_entity *entity = be_get_MemPerm_out_entity(node, i);
623                 int        offset = be_get_stack_entity_offset(layout, entity, 0);
624
625                 sp_change -= 4;
626
627                 /* store to new entity */
628                 be_emit_irprintf("\tst %%l%d, [%%fp%+d]", i, offset);
629                 be_emit_finish_line_gas(node);
630                 /* restore register */
631                 be_emit_irprintf("\tld [%%sp%+d], %%l%d", sp_change + SPARC_MIN_STACKSIZE, i);
632                 be_emit_finish_line_gas(node);
633         }
634
635         be_emit_irprintf("\tadd %%sp, %u, %%sp", aligned_sp_change);
636         be_emit_finish_line_gas(node);
637
638         assert(sp_change == 0);
639 }
640
641 static void emit_sparc_Return(const ir_node *node)
642 {
643         ir_graph  *irg    = get_irn_irg(node);
644         ir_entity *entity = get_irg_entity(irg);
645         ir_type   *type   = get_entity_type(entity);
646
647         const char *destreg = "%o7";
648
649         /* hack: we don't explicitely model register changes because of the
650          * restore node. So we have to do it manually here */
651         if (delay_slot_filler != NULL &&
652                         (is_sparc_Restore(delay_slot_filler)
653                          || is_sparc_RestoreZero(delay_slot_filler))) {
654                 destreg = "%i7";
655         }
656         be_emit_cstring("\tjmp ");
657         be_emit_string(destreg);
658         if (get_method_calling_convention(type) & cc_compound_ret) {
659                 be_emit_cstring("+12");
660         } else {
661                 be_emit_cstring("+8");
662         }
663         be_emit_finish_line_gas(node);
664         fill_delay_slot();
665 }
666
667 static void emit_sparc_FrameAddr(const ir_node *node)
668 {
669         const sparc_attr_t *attr   = get_sparc_attr_const(node);
670         int32_t             offset = attr->immediate_value;
671
672         if (offset < 0) {
673                 be_emit_cstring("\tadd ");
674                 sparc_emit_source_register(node, 0);
675                 be_emit_cstring(", ");
676                 assert(sparc_is_value_imm_encodeable(offset));
677                 be_emit_irprintf("%ld", offset);
678         } else {
679                 be_emit_cstring("\tsub ");
680                 sparc_emit_source_register(node, 0);
681                 be_emit_cstring(", ");
682                 assert(sparc_is_value_imm_encodeable(-offset));
683                 be_emit_irprintf("%ld", -offset);
684         }
685
686         be_emit_cstring(", ");
687         sparc_emit_dest_register(node, 0);
688         be_emit_finish_line_gas(node);
689 }
690
691 static const char *get_icc_unsigned(ir_relation relation)
692 {
693         switch (relation & (ir_relation_less_equal_greater)) {
694         case ir_relation_false:              return "bn";
695         case ir_relation_equal:              return "be";
696         case ir_relation_less:               return "blu";
697         case ir_relation_less_equal:         return "bleu";
698         case ir_relation_greater:            return "bgu";
699         case ir_relation_greater_equal:      return "bgeu";
700         case ir_relation_less_greater:       return "bne";
701         case ir_relation_less_equal_greater: return "ba";
702         default: panic("Cmp has unsupported relation");
703         }
704 }
705
706 static const char *get_icc_signed(ir_relation relation)
707 {
708         switch (relation & (ir_relation_less_equal_greater)) {
709         case ir_relation_false:              return "bn";
710         case ir_relation_equal:              return "be";
711         case ir_relation_less:               return "bl";
712         case ir_relation_less_equal:         return "ble";
713         case ir_relation_greater:            return "bg";
714         case ir_relation_greater_equal:      return "bge";
715         case ir_relation_less_greater:       return "bne";
716         case ir_relation_less_equal_greater: return "ba";
717         default: panic("Cmp has unsupported relation");
718         }
719 }
720
721 static const char *get_fcc(ir_relation relation)
722 {
723         switch (relation) {
724         case ir_relation_false:                   return "fbn";
725         case ir_relation_equal:                   return "fbe";
726         case ir_relation_less:                    return "fbl";
727         case ir_relation_less_equal:              return "fble";
728         case ir_relation_greater:                 return "fbg";
729         case ir_relation_greater_equal:           return "fbge";
730         case ir_relation_less_greater:            return "fblg";
731         case ir_relation_less_equal_greater:      return "fbo";
732         case ir_relation_unordered:               return "fbu";
733         case ir_relation_unordered_equal:         return "fbue";
734         case ir_relation_unordered_less:          return "fbul";
735         case ir_relation_unordered_less_equal:    return "fbule";
736         case ir_relation_unordered_greater:       return "fbug";
737         case ir_relation_unordered_greater_equal: return "fbuge";
738         case ir_relation_unordered_less_greater:  return "fbne";
739         case ir_relation_true:                    return "fba";
740         }
741         panic("invalid relation");
742 }
743
744 typedef const char* (*get_cc_func)(ir_relation relation);
745
746 static void emit_sparc_branch(const ir_node *node, get_cc_func get_cc)
747 {
748         const sparc_jmp_cond_attr_t *attr = get_sparc_jmp_cond_attr_const(node);
749         ir_relation      relation    = attr->relation;
750         const ir_node   *proj_true   = NULL;
751         const ir_node   *proj_false  = NULL;
752         const ir_edge_t *edge;
753         const ir_node   *block;
754         const ir_node   *next_block;
755
756         foreach_out_edge(node, edge) {
757                 ir_node *proj = get_edge_src_irn(edge);
758                 long nr = get_Proj_proj(proj);
759                 if (nr == pn_Cond_true) {
760                         proj_true = proj;
761                 } else {
762                         proj_false = proj;
763                 }
764         }
765
766         /* for now, the code works for scheduled and non-schedules blocks */
767         block = get_nodes_block(node);
768
769         /* we have a block schedule */
770         next_block = (ir_node*)get_irn_link(block);
771
772         if (get_irn_link(proj_true) == next_block) {
773                 /* exchange both proj's so the second one can be omitted */
774                 const ir_node *t = proj_true;
775
776                 proj_true  = proj_false;
777                 proj_false = t;
778                 relation   = get_negated_relation(relation);
779         }
780
781         /* emit the true proj */
782         be_emit_cstring("\t");
783         be_emit_string(get_cc(relation));
784         be_emit_char(' ');
785         sparc_emit_cfop_target(proj_true);
786         be_emit_finish_line_gas(proj_true);
787
788         fill_delay_slot();
789
790         if (get_irn_link(proj_false) == next_block) {
791                 be_emit_cstring("\t/* fallthrough to ");
792                 sparc_emit_cfop_target(proj_false);
793                 be_emit_cstring(" */");
794                 be_emit_finish_line_gas(proj_false);
795         } else {
796                 be_emit_cstring("\tba ");
797                 sparc_emit_cfop_target(proj_false);
798                 be_emit_finish_line_gas(proj_false);
799                 fill_delay_slot();
800         }
801 }
802
803 static void emit_sparc_Bicc(const ir_node *node)
804 {
805         const sparc_jmp_cond_attr_t *attr = get_sparc_jmp_cond_attr_const(node);
806         bool             is_unsigned = attr->is_unsigned;
807         emit_sparc_branch(node, is_unsigned ? get_icc_unsigned : get_icc_signed);
808 }
809
810 static void emit_sparc_fbfcc(const ir_node *node)
811 {
812         /* if the flags producing node was immediately in front of us, emit
813          * a nop */
814         ir_node *flags = get_irn_n(node, n_sparc_fbfcc_flags);
815         ir_node *prev  = sched_prev(node);
816         if (is_Block(prev)) {
817                 /* TODO: when the flags come from another block, then we have to do
818                  * more complicated tests to see wether the flag producing node is
819                  * potentially in front of us (could happen for fallthroughs) */
820                 panic("TODO: fbfcc flags come from other block");
821         }
822         if (skip_Proj(flags) == prev) {
823                 be_emit_cstring("\tnop\n");
824         }
825         emit_sparc_branch(node, get_fcc);
826 }
827
828 static void emit_sparc_Ba(const ir_node *node)
829 {
830         if (ba_is_fallthrough(node)) {
831                 be_emit_cstring("\t/* fallthrough to ");
832                 sparc_emit_cfop_target(node);
833                 be_emit_cstring(" */");
834         } else {
835                 be_emit_cstring("\tba ");
836                 sparc_emit_cfop_target(node);
837                 be_emit_finish_line_gas(node);
838                 fill_delay_slot();
839         }
840         be_emit_finish_line_gas(node);
841 }
842
843 static void emit_sparc_SwitchJmp(const ir_node *node)
844 {
845         const sparc_switch_jmp_attr_t *attr = get_sparc_switch_jmp_attr_const(node);
846
847         be_emit_cstring("\tjmp ");
848         sparc_emit_source_register(node, 0);
849         be_emit_finish_line_gas(node);
850         fill_delay_slot();
851
852         emit_jump_table(node, attr->default_proj_num, attr->jump_table,
853                         get_jump_target);
854 }
855
856 static void emit_fmov(const ir_node *node, const arch_register_t *src_reg,
857                       const arch_register_t *dst_reg)
858 {
859         be_emit_cstring("\tfmovs %");
860         be_emit_string(arch_register_get_name(src_reg));
861         be_emit_cstring(", %");
862         be_emit_string(arch_register_get_name(dst_reg));
863         be_emit_finish_line_gas(node);
864 }
865
866 static const arch_register_t *get_next_fp_reg(const arch_register_t *reg)
867 {
868         unsigned idx = reg->global_index;
869         assert(reg == &sparc_registers[idx]);
870         idx++;
871         assert(idx - REG_F0 < N_sparc_fp_REGS);
872         return &sparc_registers[idx];
873 }
874
875 static void emit_be_Copy(const ir_node *node)
876 {
877         ir_mode               *mode    = get_irn_mode(node);
878         const arch_register_t *src_reg = arch_get_irn_register_in(node, 0);
879         const arch_register_t *dst_reg = arch_get_irn_register_out(node, 0);
880
881         if (src_reg == dst_reg)
882                 return;
883
884         if (mode_is_float(mode)) {
885                 unsigned bits = get_mode_size_bits(mode);
886                 int      n    = bits > 32 ? bits > 64 ? 3 : 1 : 0;
887                 int      i;
888                 emit_fmov(node, src_reg, dst_reg);
889                 for (i = 0; i < n; ++i) {
890                         src_reg = get_next_fp_reg(src_reg);
891                         dst_reg = get_next_fp_reg(dst_reg);
892                         emit_fmov(node, src_reg, dst_reg);
893                 }
894         } else if (mode_is_data(mode)) {
895                 be_emit_cstring("\tmov ");
896                 sparc_emit_source_register(node, 0);
897                 be_emit_cstring(", ");
898                 sparc_emit_dest_register(node, 0);
899                 be_emit_finish_line_gas(node);
900         } else {
901                 panic("emit_be_Copy: invalid mode");
902         }
903 }
904
905 static void emit_nothing(const ir_node *irn)
906 {
907         (void) irn;
908 }
909
910 typedef void (*emit_func) (const ir_node *);
911
912 static inline void set_emitter(ir_op *op, emit_func sparc_emit_node)
913 {
914         op->ops.generic = (op_func)sparc_emit_node;
915 }
916
917 /**
918  * Enters the emitter functions for handled nodes into the generic
919  * pointer of an opcode.
920  */
921 static void sparc_register_emitters(void)
922 {
923         /* first clear the generic function pointer for all ops */
924         clear_irp_opcodes_generic_func();
925         /* register all emitter functions defined in spec */
926         sparc_register_spec_emitters();
927
928         /* custom emitter */
929         set_emitter(op_be_Copy,         emit_be_Copy);
930         set_emitter(op_be_CopyKeep,     emit_be_Copy);
931         set_emitter(op_be_IncSP,        emit_be_IncSP);
932         set_emitter(op_be_MemPerm,      emit_be_MemPerm);
933         set_emitter(op_be_Perm,         emit_be_Perm);
934         set_emitter(op_sparc_Ba,        emit_sparc_Ba);
935         set_emitter(op_sparc_Bicc,      emit_sparc_Bicc);
936         set_emitter(op_sparc_Call,      emit_sparc_Call);
937         set_emitter(op_sparc_fbfcc,     emit_sparc_fbfcc);
938         set_emitter(op_sparc_FrameAddr, emit_sparc_FrameAddr);
939         set_emitter(op_sparc_SMulh,     emit_sparc_Mulh);
940         set_emitter(op_sparc_UMulh,     emit_sparc_Mulh);
941         set_emitter(op_sparc_Return,    emit_sparc_Return);
942         set_emitter(op_sparc_SDiv,      emit_sparc_SDiv);
943         set_emitter(op_sparc_SwitchJmp, emit_sparc_SwitchJmp);
944         set_emitter(op_sparc_UDiv,      emit_sparc_UDiv);
945
946         /* no need to emit anything for the following nodes */
947         set_emitter(op_be_Keep,     emit_nothing);
948         set_emitter(op_sparc_Start, emit_nothing);
949         set_emitter(op_Phi,         emit_nothing);
950 }
951
952 /**
953  * Emits code for a node.
954  */
955 static void sparc_emit_node(const ir_node *node)
956 {
957         ir_op *op = get_irn_op(node);
958
959         if (op->ops.generic) {
960                 emit_func func = (emit_func) op->ops.generic;
961                 be_dbg_set_dbg_info(get_irn_dbg_info(node));
962                 (*func) (node);
963         } else {
964                 panic("No emit handler for node %+F (graph %+F)\n", node,
965                       current_ir_graph);
966         }
967 }
968
969 static ir_node *find_next_delay_slot(ir_node *from)
970 {
971         ir_node *schedpoint = from;
972         while (!has_delay_slot(schedpoint)) {
973                 if (!sched_has_next(schedpoint))
974                         return NULL;
975                 schedpoint = sched_next(schedpoint);
976         }
977         return schedpoint;
978 }
979
980 /**
981  * Walks over the nodes in a block connected by scheduling edges
982  * and emits code for each node.
983  */
984 static void sparc_emit_block(ir_node *block)
985 {
986         ir_node *node;
987         ir_node *next_delay_slot;
988
989         assert(is_Block(block));
990
991         be_gas_emit_block_name(block);
992         be_emit_cstring(":\n");
993         be_emit_write_line();
994
995         next_delay_slot = find_next_delay_slot(sched_first(block));
996         if (next_delay_slot != NULL)
997                 delay_slot_filler = pick_delay_slot_for(next_delay_slot);
998
999         sched_foreach(block, node) {
1000                 if (node == delay_slot_filler) {
1001                         continue;
1002                 }
1003
1004                 sparc_emit_node(node);
1005
1006                 if (node == next_delay_slot) {
1007                         assert(delay_slot_filler == NULL);
1008                         next_delay_slot = find_next_delay_slot(sched_next(node));
1009                         if (next_delay_slot != NULL)
1010                                 delay_slot_filler = pick_delay_slot_for(next_delay_slot);
1011                 }
1012         }
1013 }
1014
1015 /**
1016  * Emits code for function start.
1017  */
1018 static void sparc_emit_func_prolog(ir_graph *irg)
1019 {
1020         ir_entity *ent = get_irg_entity(irg);
1021         be_gas_emit_function_prolog(ent, 4);
1022         be_emit_write_line();
1023 }
1024
1025 /**
1026  * Emits code for function end
1027  */
1028 static void sparc_emit_func_epilog(ir_graph *irg)
1029 {
1030         ir_entity *ent = get_irg_entity(irg);
1031         const char *irg_name = get_entity_ld_name(ent);
1032         be_emit_write_line();
1033         be_emit_irprintf("\t.size  %s, .-%s\n", irg_name, irg_name);
1034         be_emit_cstring("# -- End ");
1035         be_emit_string(irg_name);
1036         be_emit_cstring("\n");
1037         be_emit_write_line();
1038 }
1039
1040 static void sparc_gen_labels(ir_node *block, void *env)
1041 {
1042         ir_node *pred;
1043         int n = get_Block_n_cfgpreds(block);
1044         (void) env;
1045
1046         for (n--; n >= 0; n--) {
1047                 pred = get_Block_cfgpred(block, n);
1048                 set_irn_link(pred, block); // link the pred of a block (which is a jmp)
1049         }
1050 }
1051
1052 void sparc_emit_routine(ir_graph *irg)
1053 {
1054         ir_entity  *entity = get_irg_entity(irg);
1055         ir_node   **block_schedule;
1056         size_t      i;
1057         size_t      n;
1058
1059         heights = heights_new(irg);
1060
1061         /* register all emitter functions */
1062         sparc_register_emitters();
1063         be_dbg_method_begin(entity);
1064
1065         /* create the block schedule. For now, we don't need it earlier. */
1066         block_schedule = be_create_block_schedule(irg);
1067
1068         sparc_emit_func_prolog(irg);
1069         irg_block_walk_graph(irg, sparc_gen_labels, NULL, NULL);
1070
1071         /* inject block scheduling links & emit code of each block */
1072         n = ARR_LEN(block_schedule);
1073         for (i = 0; i < n; ++i) {
1074                 ir_node *block      = block_schedule[i];
1075                 ir_node *next_block = i+1 < n ? block_schedule[i+1] : NULL;
1076                 set_irn_link(block, next_block);
1077         }
1078
1079         for (i = 0; i < n; ++i) {
1080                 ir_node *block = block_schedule[i];
1081                 if (block == get_irg_end_block(irg))
1082                         continue;
1083                 sparc_emit_block(block);
1084         }
1085
1086         /* emit function epilog */
1087         sparc_emit_func_epilog(irg);
1088
1089         heights_free(heights);
1090 }
1091
1092 void sparc_init_emitter(void)
1093 {
1094         FIRM_DBG_REGISTER(dbg, "firm.be.sparc.emit");
1095 }