sparc: implement div instructions correctly
[libfirm] / ir / be / sparc / sparc_emitter.c
1 /*
2  * Copyright (C) 1995-2010 University of Karlsruhe.  All right reserved.
3  *
4  * This file is part of libFirm.
5  *
6  * This file may be distributed and/or modified under the terms of the
7  * GNU General Public License version 2 as published by the Free Software
8  * Foundation and appearing in the file LICENSE.GPL included in the
9  * packaging of this file.
10  *
11  * Licensees holding valid libFirm Professional Edition licenses may use
12  * this file in accordance with the libFirm Commercial License.
13  * Agreement provided with the Software.
14  *
15  * This file is provided AS IS with NO WARRANTY OF ANY KIND, INCLUDING THE
16  * WARRANTY OF DESIGN, MERCHANTABILITY AND FITNESS FOR A PARTICULAR
17  * PURPOSE.
18  */
19
20 /**
21  * @file
22  * @brief   emit assembler for a backend graph
23  * @version $Id$
24  */
25 #include "config.h"
26
27 #include <limits.h>
28
29 #include "xmalloc.h"
30 #include "tv.h"
31 #include "iredges.h"
32 #include "debug.h"
33 #include "irgwalk.h"
34 #include "irprintf.h"
35 #include "irop_t.h"
36 #include "irargs_t.h"
37 #include "irprog.h"
38 #include "irargs_t.h"
39 #include "error.h"
40 #include "raw_bitset.h"
41 #include "dbginfo.h"
42
43 #include "../besched.h"
44 #include "../beblocksched.h"
45 #include "../beirg.h"
46 #include "../begnuas.h"
47 #include "../be_dbgout.h"
48 #include "../benode.h"
49
50 #include "sparc_emitter.h"
51 #include "gen_sparc_emitter.h"
52 #include "sparc_nodes_attr.h"
53 #include "sparc_new_nodes.h"
54 #include "gen_sparc_regalloc_if.h"
55
56 DEBUG_ONLY(static firm_dbg_module_t *dbg = NULL;)
57
58 /**
59  * Returns the register at in position pos.
60  */
61 static const arch_register_t *get_in_reg(const ir_node *node, int pos)
62 {
63         ir_node                *op;
64         const arch_register_t  *reg = NULL;
65
66         assert(get_irn_arity(node) > pos && "Invalid IN position");
67
68         /* The out register of the operator at position pos is the
69            in register we need. */
70         op = get_irn_n(node, pos);
71
72         reg = arch_get_irn_register(op);
73
74         assert(reg && "no in register found");
75         return reg;
76 }
77
78 /**
79  * Returns the register at out position pos.
80  */
81 static const arch_register_t *get_out_reg(const ir_node *node, int pos)
82 {
83         ir_node                *proj;
84         const arch_register_t  *reg = NULL;
85
86         /* 1st case: irn is not of mode_T, so it has only                 */
87         /*           one OUT register -> good                             */
88         /* 2nd case: irn is of mode_T -> collect all Projs and ask the    */
89         /*           Proj with the corresponding projnum for the register */
90
91         if (get_irn_mode(node) != mode_T) {
92                 reg = arch_get_irn_register(node);
93         } else if (is_sparc_irn(node)) {
94                 reg = arch_irn_get_register(node, pos);
95         } else {
96                 const ir_edge_t *edge;
97
98                 foreach_out_edge(node, edge) {
99                         proj = get_edge_src_irn(edge);
100                         assert(is_Proj(proj) && "non-Proj from mode_T node");
101                         if (get_Proj_proj(proj) == pos) {
102                                 reg = arch_get_irn_register(proj);
103                                 break;
104                         }
105                 }
106         }
107
108         assert(reg && "no out register found");
109         return reg;
110 }
111
112 static bool is_valid_immediate(int32_t value)
113 {
114         return -4096 <= value && value < 4096;
115 }
116
117 void sparc_emit_immediate(const ir_node *node)
118 {
119         const sparc_attr_t *attr   = get_sparc_attr_const(node);
120         ir_entity          *entity = attr->immediate_value_entity;
121
122         if (entity == NULL) {
123                 int32_t value = attr->immediate_value;
124                 assert(is_valid_immediate(value));
125                 be_emit_irprintf("%d", value);
126         } else {
127                 be_emit_cstring("%lo(");
128                 be_gas_emit_entity(entity);
129                 if (attr->immediate_value != 0) {
130                         be_emit_irprintf("%+d", attr->immediate_value);
131                 }
132                 be_emit_char(')');
133         }
134 }
135
136 void sparc_emit_high_immediate(const ir_node *node)
137 {
138         const sparc_attr_t *attr   = get_sparc_attr_const(node);
139         ir_entity          *entity = attr->immediate_value_entity;
140
141         be_emit_cstring("%hi(");
142         if (entity == NULL) {
143                 uint32_t value = (uint32_t) attr->immediate_value;
144                 be_emit_irprintf("0x%X", value);
145         } else {
146                 be_gas_emit_entity(entity);
147                 if (attr->immediate_value != 0) {
148                         be_emit_irprintf("%+d", attr->immediate_value);
149                 }
150         }
151         be_emit_char(')');
152 }
153
154 void sparc_emit_source_register(const ir_node *node, int pos)
155 {
156         const arch_register_t *reg = get_in_reg(node, pos);
157         be_emit_char('%');
158         be_emit_string(arch_register_get_name(reg));
159 }
160
161 void sparc_emit_dest_register(const ir_node *node, int pos)
162 {
163         const arch_register_t *reg = get_out_reg(node, pos);
164         be_emit_char('%');
165         be_emit_string(arch_register_get_name(reg));
166 }
167
168 /**
169  * Emits either a imm or register depending on arity of node
170  * @param node
171  * @param register no (-1 if no register)
172  */
173 void sparc_emit_reg_or_imm(const ir_node *node, int pos)
174 {
175         if (get_irn_arity(node) > pos) {
176                 // we have reg input
177                 sparc_emit_source_register(node, pos);
178         } else {
179                 // we have a imm input
180                 sparc_emit_immediate(node);
181         }
182 }
183
184 static bool is_stack_pointer_relative(const ir_node *node)
185 {
186         const arch_register_t *sp = &sparc_gp_regs[REG_SP];
187         return (is_sparc_St(node) && get_in_reg(node, n_sparc_St_ptr) == sp)
188             || (is_sparc_Ld(node) && get_in_reg(node, n_sparc_Ld_ptr) == sp);
189 }
190
191 /**
192  * emit SP offset
193  */
194 void sparc_emit_offset(const ir_node *node)
195 {
196         const sparc_load_store_attr_t *attr = get_sparc_load_store_attr_const(node);
197
198         if (attr->is_frame_entity) {
199                 int32_t offset = attr->base.immediate_value;
200                 /* bad hack: the real stack stuff is behind the always-there spill
201                  * space for the register window and stack */
202                 if (is_stack_pointer_relative(node))
203                         offset += SPARC_MIN_STACKSIZE;
204                 if (offset != 0) {
205                         assert(is_valid_immediate(offset));
206                         be_emit_irprintf("%+ld", offset);
207                 }
208         } else {
209                 be_emit_char('+');
210                 sparc_emit_immediate(node);
211         }
212 }
213
214 void sparc_emit_float_load_store_mode(const ir_node *node)
215 {
216         const sparc_load_store_attr_t *attr = get_sparc_load_store_attr_const(node);
217         ir_mode *mode = attr->load_store_mode;
218         int      bits = get_mode_size_bits(mode);
219
220         assert(mode_is_float(mode));
221
222         switch (bits) {
223         case 32:  return;
224         case 64:  be_emit_char('d'); return;
225         case 128: be_emit_char('q'); return;
226         }
227         panic("invalid flaot load/store mode %+F", mode);
228 }
229
230 /**
231  *  Emit load mode char
232  */
233 void sparc_emit_load_mode(const ir_node *node)
234 {
235         const sparc_load_store_attr_t *attr = get_sparc_load_store_attr_const(node);
236         ir_mode *mode      = attr->load_store_mode;
237         int      bits      = get_mode_size_bits(mode);
238         bool     is_signed = mode_is_signed(mode);
239
240         if (bits == 16) {
241                 be_emit_string(is_signed ? "sh" : "uh");
242         } else if (bits == 8) {
243                 be_emit_string(is_signed ? "sb" : "ub");
244         } else if (bits == 64) {
245                 be_emit_char('d');
246         } else {
247                 assert(bits == 32);
248         }
249 }
250
251 /**
252  * Emit store mode char
253  */
254 void sparc_emit_store_mode(const ir_node *node)
255 {
256         const sparc_load_store_attr_t *attr = get_sparc_load_store_attr_const(node);
257         ir_mode *mode      = attr->load_store_mode;
258         int      bits      = get_mode_size_bits(mode);
259
260         if (bits == 16) {
261                 be_emit_string("h");
262         } else if (bits == 8) {
263                 be_emit_string("b");
264         } else if (bits == 64) {
265                 be_emit_char('d');
266         } else {
267                 assert(bits == 32);
268         }
269 }
270
271 /**
272  * emit integer signed/unsigned prefix char
273  */
274 void sparc_emit_mode_sign_prefix(const ir_node *node)
275 {
276         ir_mode *mode      = get_irn_mode(node);
277         bool     is_signed = mode_is_signed(mode);
278         be_emit_string(is_signed ? "s" : "u");
279 }
280
281 static void emit_fp_suffix(const ir_mode *mode)
282 {
283         unsigned bits = get_mode_size_bits(mode);
284         assert(mode_is_float(mode));
285
286         if (bits == 32) {
287                 be_emit_char('s');
288         } else if (bits == 64) {
289                 be_emit_char('d');
290         } else if (bits == 128) {
291                 be_emit_char('q');
292         } else {
293                 panic("invalid FP mode");
294         }
295 }
296
297 void sparc_emit_fp_conv_source(const ir_node *node)
298 {
299         const sparc_fp_conv_attr_t *attr = get_sparc_fp_conv_attr_const(node);
300         emit_fp_suffix(attr->src_mode);
301 }
302
303 void sparc_emit_fp_conv_destination(const ir_node *node)
304 {
305         const sparc_fp_conv_attr_t *attr = get_sparc_fp_conv_attr_const(node);
306         emit_fp_suffix(attr->dest_mode);
307 }
308
309 /**
310  * emits the FP mode suffix char
311  */
312 void sparc_emit_fp_mode_suffix(const ir_node *node)
313 {
314         const sparc_fp_attr_t *attr = get_sparc_fp_attr_const(node);
315         emit_fp_suffix(attr->fp_mode);
316 }
317
318 /**
319  * Returns the target label for a control flow node.
320  */
321 static void sparc_emit_cfop_target(const ir_node *node)
322 {
323         ir_node *block = get_irn_link(node);
324         be_gas_emit_block_name(block);
325 }
326
327 /**
328  * Emit single entity
329  */
330 static void sparc_emit_entity(ir_entity *entity)
331 {
332         be_gas_emit_entity(entity);
333 }
334
335 /**
336  * Emits code for stack space management
337  */
338 static void emit_be_IncSP(const ir_node *irn)
339 {
340         int offs = -be_get_IncSP_offset(irn);
341
342         if (offs == 0)
343                         return;
344
345         /* SPARC stack grows downwards */
346         if (offs < 0) {
347                 be_emit_cstring("\tsub ");
348                 offs = -offs;
349         } else {
350                 be_emit_cstring("\tadd ");
351         }
352
353         sparc_emit_source_register(irn, 0);
354         be_emit_irprintf(", %d", offs);
355         be_emit_cstring(", ");
356         sparc_emit_dest_register(irn, 0);
357         be_emit_finish_line_gas(irn);
358 }
359
360 /**
361  * emits code for save instruction with min. required stack space
362  */
363 static void emit_sparc_Save(const ir_node *irn)
364 {
365         const sparc_save_attr_t *save_attr = get_sparc_save_attr_const(irn);
366         be_emit_cstring("\tsave ");
367         sparc_emit_source_register(irn, 0);
368         be_emit_irprintf(", %d, ", -save_attr->initial_stacksize);
369         sparc_emit_dest_register(irn, 0);
370         be_emit_finish_line_gas(irn);
371 }
372
373 /**
374  * emits code for mulh
375  */
376 static void emit_sparc_Mulh(const ir_node *irn)
377 {
378         be_emit_cstring("\t");
379         sparc_emit_mode_sign_prefix(irn);
380         be_emit_cstring("mul ");
381
382         sparc_emit_source_register(irn, 0);
383         be_emit_cstring(", ");
384         sparc_emit_reg_or_imm(irn, 1);
385         be_emit_cstring(", ");
386         sparc_emit_dest_register(irn, 0);
387         be_emit_finish_line_gas(irn);
388
389         // our result is in the y register now
390         // we just copy it to the assigned target reg
391         be_emit_cstring("\tmov %y, ");
392         sparc_emit_dest_register(irn, 0);
393         be_emit_finish_line_gas(irn);
394 }
395
396 static void emit_sparc_Div(const ir_node *node, bool is_signed)
397 {
398         /* can we get the delay count of the wr instruction somewhere? */
399         unsigned wry_delay_count = 3;
400         unsigned i;
401
402         be_emit_cstring("\twr ");
403         sparc_emit_source_register(node, 0);
404         be_emit_cstring(", 0, %y");
405         be_emit_finish_line_gas(node);
406
407         for (i = 0; i < wry_delay_count; ++i) {
408                 be_emit_cstring("\tnop");
409                 be_emit_finish_line_gas(node);
410         }
411
412         be_emit_irprintf("\t%s ", is_signed ? "sdiv" : "udiv");
413         sparc_emit_source_register(node, 1);
414         be_emit_cstring(", ");
415         sparc_emit_reg_or_imm(node, 2);
416         be_emit_cstring(", ");
417         sparc_emit_dest_register(node, 0);
418         be_emit_finish_line_gas(node);
419 }
420
421 static void emit_sparc_SDiv(const ir_node *node)
422 {
423         emit_sparc_Div(node, true);
424 }
425
426 static void emit_sparc_UDiv(const ir_node *node)
427 {
428         emit_sparc_Div(node, false);
429 }
430
431 /**
432  * Emits code for return node
433  */
434 static void emit_be_Return(const ir_node *irn)
435 {
436         be_emit_cstring("\tret");
437         //be_emit_cstring("\tjmp %i7+8");
438         be_emit_finish_line_gas(irn);
439         be_emit_cstring("\trestore");
440         be_emit_finish_line_gas(irn);
441 }
442
443 /**
444  * Emits code for Call node
445  */
446 static void emit_sparc_Call(const ir_node *node)
447 {
448         const sparc_attr_t *attr   = get_sparc_attr_const(node);
449         ir_entity          *entity = attr->immediate_value_entity;
450
451         be_emit_cstring("\tcall ");
452         if (entity != NULL) {
453             sparc_emit_entity(entity);
454             if (attr->immediate_value != 0) {
455                         be_emit_irprintf("%+d", attr->immediate_value);
456                 }
457                 be_emit_cstring(", 0");
458         } else {
459                 int last = get_irn_arity(node);
460                 sparc_emit_source_register(node, last-1);
461         }
462         be_emit_finish_line_gas(node);
463
464         /* fill delay slot */
465         be_emit_cstring("\tnop");
466         be_emit_finish_line_gas(node);
467 }
468
469 /**
470  * Emit code for Perm node
471  */
472 static void emit_be_Perm(const ir_node *irn)
473 {
474         be_emit_cstring("\txor ");
475         sparc_emit_source_register(irn, 1);
476         be_emit_cstring(", ");
477         sparc_emit_source_register(irn, 0);
478         be_emit_cstring(", ");
479         sparc_emit_source_register(irn, 0);
480         be_emit_finish_line_gas(NULL);
481
482         be_emit_cstring("\txor ");
483         sparc_emit_source_register(irn, 1);
484         be_emit_cstring(", ");
485         sparc_emit_source_register(irn, 0);
486         be_emit_cstring(", ");
487         sparc_emit_source_register(irn, 1);
488         be_emit_finish_line_gas(NULL);
489
490         be_emit_cstring("\txor ");
491         sparc_emit_source_register(irn, 1);
492         be_emit_cstring(", ");
493         sparc_emit_source_register(irn, 0);
494         be_emit_cstring(", ");
495         sparc_emit_source_register(irn, 0);
496         be_emit_finish_line_gas(irn);
497 }
498
499 /**
500  * TODO: not really tested but seems to work with memperm_arity == 1
501  */
502 static void emit_be_MemPerm(const ir_node *node)
503 {
504         int i;
505         int memperm_arity;
506         int sp_change = 0;
507         ir_graph          *irg    = get_irn_irg(node);
508         be_stack_layout_t *layout = be_get_irg_stack_layout(irg);
509
510         /* this implementation only works with frame pointers currently */
511         assert(layout->sp_relative == false);
512
513         /* TODO: this implementation is slower than necessary.
514            The longterm goal is however to avoid the memperm node completely */
515
516         memperm_arity = be_get_MemPerm_entity_arity(node);
517         // we use our local registers - so this is limited to 8 inputs !
518         if (memperm_arity > 8)
519                 panic("memperm with more than 8 inputs not supported yet");
520
521         be_emit_irprintf("\tsub %%sp, %d, %%sp", memperm_arity*4);
522         be_emit_finish_line_gas(node);
523
524         for (i = 0; i < memperm_arity; ++i) {
525                 ir_entity *entity = be_get_MemPerm_in_entity(node, i);
526                 int        offset = be_get_stack_entity_offset(layout, entity, 0);
527
528                 /* spill register */
529                 be_emit_irprintf("\tst %%l%d, [%%sp%+d]", i, sp_change + SPARC_MIN_STACKSIZE);
530                 be_emit_finish_line_gas(node);
531
532                 /* load from entity */
533                 be_emit_irprintf("\tld [%%fp%+d], %%l%d", offset, i);
534                 be_emit_finish_line_gas(node);
535                 sp_change += 4;
536         }
537
538         for (i = memperm_arity-1; i >= 0; --i) {
539                 ir_entity *entity = be_get_MemPerm_out_entity(node, i);
540                 int        offset = be_get_stack_entity_offset(layout, entity, 0);
541
542                 sp_change -= 4;
543
544                 /* store to new entity */
545                 be_emit_irprintf("\tst %%l%d, [%%fp%+d]", i, offset);
546                 be_emit_finish_line_gas(node);
547                 /* restore register */
548                 be_emit_irprintf("\tld [%%sp%+d], %%l%d", sp_change + SPARC_MIN_STACKSIZE, i);
549                 be_emit_finish_line_gas(node);
550         }
551
552         be_emit_irprintf("\tadd %%sp, %d, %%sp", memperm_arity*4);
553         be_emit_finish_line_gas(node);
554
555         assert(sp_change == 0);
556 }
557
558 /**
559  * Emits code for FrameAddr fix
560  */
561 static void emit_sparc_FrameAddr(const ir_node *node)
562 {
563         const sparc_attr_t *attr = get_sparc_attr_const(node);
564
565         // no need to fix offset as we are adressing via the framepointer
566         if (attr->immediate_value >= 0) {
567                 be_emit_cstring("\tadd ");
568                 sparc_emit_source_register(node, 0);
569                 be_emit_cstring(", ");
570                 be_emit_irprintf("%ld", attr->immediate_value);
571         } else {
572                 be_emit_cstring("\tsub ");
573                 sparc_emit_source_register(node, 0);
574                 be_emit_cstring(", ");
575                 be_emit_irprintf("%ld", -attr->immediate_value);
576         }
577
578         be_emit_cstring(", ");
579         sparc_emit_dest_register(node, 0);
580         be_emit_finish_line_gas(node);
581 }
582
583 static const char *get_icc_unsigned(pn_Cmp pnc)
584 {
585         switch (pnc) {
586         case pn_Cmp_False: return "bn";
587         case pn_Cmp_Eq:    return "be";
588         case pn_Cmp_Lt:    return "blu";
589         case pn_Cmp_Le:    return "bleu";
590         case pn_Cmp_Gt:    return "bgu";
591         case pn_Cmp_Ge:    return "bgeu";
592         case pn_Cmp_Lg:    return "bne";
593         case pn_Cmp_Leg:   return "ba";
594         default: panic("Cmp has unsupported pnc");
595         }
596 }
597
598 static const char *get_icc_signed(pn_Cmp pnc)
599 {
600         switch (pnc) {
601         case pn_Cmp_False: return "bn";
602         case pn_Cmp_Eq:    return "be";
603         case pn_Cmp_Lt:    return "bl";
604         case pn_Cmp_Le:    return "ble";
605         case pn_Cmp_Gt:    return "bg";
606         case pn_Cmp_Ge:    return "bge";
607         case pn_Cmp_Lg:    return "bne";
608         case pn_Cmp_Leg:   return "ba";
609         default: panic("Cmp has unsupported pnc");
610         }
611 }
612
613 static const char *get_fcc(pn_Cmp pnc)
614 {
615         switch (pnc) {
616         case pn_Cmp_False: return "fbn";
617         case pn_Cmp_Eq:    return "fbe";
618         case pn_Cmp_Lt:    return "fbl";
619         case pn_Cmp_Le:    return "fble";
620         case pn_Cmp_Gt:    return "fbg";
621         case pn_Cmp_Ge:    return "fbge";
622         case pn_Cmp_Lg:    return "fblg";
623         case pn_Cmp_Leg:   return "fbo";
624         case pn_Cmp_Uo:    return "fbu";
625         case pn_Cmp_Ue:    return "fbue";
626         case pn_Cmp_Ul:    return "fbul";
627         case pn_Cmp_Ule:   return "fbule";
628         case pn_Cmp_Ug:    return "fbug";
629         case pn_Cmp_Uge:   return "fbuge";
630         case pn_Cmp_Ne:    return "fbne";
631         case pn_Cmp_True:  return "fba";
632         case pn_Cmp_max:
633                 break;
634         }
635         panic("invalid pnc");
636 }
637
638 typedef const char* (*get_cc_func)(pn_Cmp pnc);
639
640 /**
641  * Emits code for Branch
642  */
643 static void emit_sparc_branch(const ir_node *node, get_cc_func get_cc)
644 {
645         const sparc_jmp_cond_attr_t *attr = get_sparc_jmp_cond_attr_const(node);
646         pn_Cmp           pnc         = attr->pnc;
647         const ir_node   *proj_true   = NULL;
648         const ir_node   *proj_false  = NULL;
649         const ir_edge_t *edge;
650         const ir_node   *block;
651         const ir_node   *next_block;
652
653         foreach_out_edge(node, edge) {
654                 ir_node *proj = get_edge_src_irn(edge);
655                 long nr = get_Proj_proj(proj);
656                 if (nr == pn_Cond_true) {
657                         proj_true = proj;
658                 } else {
659                         proj_false = proj;
660                 }
661         }
662
663         /* for now, the code works for scheduled and non-schedules blocks */
664         block = get_nodes_block(node);
665
666         /* we have a block schedule */
667         next_block = get_irn_link(block);
668
669         if (get_irn_link(proj_true) == next_block) {
670                 /* exchange both proj's so the second one can be omitted */
671                 const ir_node *t = proj_true;
672
673                 proj_true  = proj_false;
674                 proj_false = t;
675                 if (is_sparc_fbfcc(node)) {
676                         pnc = get_negated_pnc(pnc, mode_F);
677                 } else {
678                         pnc = get_negated_pnc(pnc, mode_Iu);
679                 }
680         }
681
682         /* emit the true proj */
683         be_emit_cstring("\t");
684         be_emit_string(get_cc(pnc));
685         be_emit_char(' ');
686         sparc_emit_cfop_target(proj_true);
687         be_emit_finish_line_gas(proj_true);
688
689         be_emit_cstring("\tnop");
690         be_emit_pad_comment();
691         be_emit_cstring("/* TODO: use delay slot */\n");
692
693         if (get_irn_link(proj_false) == next_block) {
694                 be_emit_cstring("\t/* fallthrough to ");
695                 sparc_emit_cfop_target(proj_false);
696                 be_emit_cstring(" */");
697                 be_emit_finish_line_gas(proj_false);
698         } else {
699                 be_emit_cstring("\tba ");
700                 sparc_emit_cfop_target(proj_false);
701                 be_emit_finish_line_gas(proj_false);
702                 be_emit_cstring("\tnop\t\t/* TODO: use delay slot */\n");
703                 be_emit_finish_line_gas(proj_false);
704         }
705 }
706
707 static void emit_sparc_Bicc(const ir_node *node)
708 {
709         const sparc_jmp_cond_attr_t *attr = get_sparc_jmp_cond_attr_const(node);
710         bool             is_unsigned = attr->is_unsigned;
711         emit_sparc_branch(node, is_unsigned ? get_icc_unsigned : get_icc_signed);
712 }
713
714 static void emit_sparc_fbfcc(const ir_node *node)
715 {
716         emit_sparc_branch(node, get_fcc);
717 }
718
719 /**
720  * emit Jmp (which actually is a branch always (ba) instruction)
721  */
722 static void emit_sparc_Ba(const ir_node *node)
723 {
724         ir_node *block, *next_block;
725
726         /* for now, the code works for scheduled and non-schedules blocks */
727         block = get_nodes_block(node);
728
729         /* we have a block schedule */
730         next_block = get_irn_link(block);
731         if (get_irn_link(node) != next_block) {
732                 be_emit_cstring("\tba ");
733                 sparc_emit_cfop_target(node);
734                 be_emit_finish_line_gas(node);
735                 be_emit_cstring("\tnop\t\t/* TODO: use delay slot */\n");
736         } else {
737                 be_emit_cstring("\t/* fallthrough to ");
738                 sparc_emit_cfop_target(node);
739                 be_emit_cstring(" */");
740         }
741         be_emit_finish_line_gas(node);
742 }
743
744 static void emit_fmov(const ir_node *node, const arch_register_t *src_reg,
745                       const arch_register_t *dst_reg)
746 {
747         be_emit_cstring("\tfmov ");
748         be_emit_string(arch_register_get_name(src_reg));
749         be_emit_cstring(", ");
750         be_emit_string(arch_register_get_name(dst_reg));
751         be_emit_finish_line_gas(node);
752 }
753
754 static const arch_register_t *get_next_fp_reg(const arch_register_t *reg)
755 {
756         unsigned index = reg->index;
757         assert(reg == &sparc_fp_regs[index]);
758         index++;
759         assert(index < N_sparc_fp_REGS);
760         return &sparc_fp_regs[index];
761 }
762
763 /**
764  * emit copy node
765  */
766 static void emit_be_Copy(const ir_node *node)
767 {
768         ir_mode               *mode    = get_irn_mode(node);
769         const arch_register_t *src_reg = get_in_reg(node, 0);
770         const arch_register_t *dst_reg = get_out_reg(node, 0);
771
772         if (src_reg == dst_reg)
773                 return;
774
775         if (mode_is_float(mode)) {
776                 unsigned bits = get_mode_size_bits(mode);
777                 int      n    = bits > 32 ? bits > 64 ? 3 : 1 : 0;
778                 int      i;
779                 emit_fmov(node, src_reg, dst_reg);
780                 for (i = 0; i < n; ++i) {
781                         src_reg = get_next_fp_reg(src_reg);
782                         dst_reg = get_next_fp_reg(dst_reg);
783                         emit_fmov(node, src_reg, dst_reg);
784                 }
785         } else if (mode_is_data(mode)) {
786                 be_emit_cstring("\tmov ");
787                 sparc_emit_source_register(node, 0);
788                 be_emit_cstring(", ");
789                 sparc_emit_dest_register(node, 0);
790                 be_emit_finish_line_gas(node);
791         } else {
792                 panic("emit_be_Copy: invalid mode");
793         }
794 }
795
796
797 /**
798  * dummy emitter for ignored nodes
799  */
800 static void emit_nothing(const ir_node *irn)
801 {
802         (void) irn;
803 }
804
805 /**
806  * type of emitter function
807  */
808 typedef void (*emit_func) (const ir_node *);
809
810 /**
811  * Set a node emitter. Make it a bit more type safe.
812  */
813 static inline void set_emitter(ir_op *op, emit_func sparc_emit_node)
814 {
815         op->ops.generic = (op_func)sparc_emit_node;
816 }
817
818 /**
819  * Enters the emitter functions for handled nodes into the generic
820  * pointer of an opcode.
821  */
822 static void sparc_register_emitters(void)
823 {
824         /* first clear the generic function pointer for all ops */
825         clear_irp_opcodes_generic_func();
826         /* register all emitter functions defined in spec */
827         sparc_register_spec_emitters();
828
829         /* custom emitter */
830         set_emitter(op_be_Copy,         emit_be_Copy);
831         set_emitter(op_be_CopyKeep,     emit_be_Copy);
832         set_emitter(op_be_IncSP,        emit_be_IncSP);
833         set_emitter(op_be_MemPerm,      emit_be_MemPerm);
834         set_emitter(op_be_Perm,         emit_be_Perm);
835         set_emitter(op_be_Return,       emit_be_Return);
836         set_emitter(op_sparc_Ba,        emit_sparc_Ba);
837         set_emitter(op_sparc_Bicc,      emit_sparc_Bicc);
838         set_emitter(op_sparc_Call,      emit_sparc_Call);
839         set_emitter(op_sparc_fbfcc,     emit_sparc_fbfcc);
840         set_emitter(op_sparc_FrameAddr, emit_sparc_FrameAddr);
841         set_emitter(op_sparc_Mulh,      emit_sparc_Mulh);
842         set_emitter(op_sparc_Save,      emit_sparc_Save);
843         set_emitter(op_sparc_SDiv,      emit_sparc_SDiv);
844         set_emitter(op_sparc_UDiv,      emit_sparc_UDiv);
845
846         /* no need to emit anything for the following nodes */
847         set_emitter(op_be_Barrier, emit_nothing);
848         set_emitter(op_be_Keep,    emit_nothing);
849         set_emitter(op_be_Start,   emit_nothing);
850         set_emitter(op_Phi,        emit_nothing);
851 }
852
853 /**
854  * Emits code for a node.
855  */
856 static void sparc_emit_node(const ir_node *node)
857 {
858         ir_op *op = get_irn_op(node);
859
860         if (op->ops.generic) {
861                 emit_func func = (emit_func) op->ops.generic;
862                 be_dbg_set_dbg_info(get_irn_dbg_info(node));
863                 (*func) (node);
864         } else {
865                 panic("No emit handler for node %+F (graph %+F)\n",     node,
866                       current_ir_graph);
867         }
868 }
869
870 /**
871  * Walks over the nodes in a block connected by scheduling edges
872  * and emits code for each node.
873  */
874 static void sparc_gen_block(ir_node *block, void *data)
875 {
876         ir_node *node;
877         (void) data;
878
879         if (! is_Block(block))
880                 return;
881
882         be_gas_emit_block_name(block);
883         be_emit_cstring(":\n");
884         be_emit_write_line();
885
886         sched_foreach(block, node) {
887                 sparc_emit_node(node);
888         }
889 }
890
891
892 /**
893  * Emits code for function start.
894  */
895 static void sparc_emit_func_prolog(ir_graph *irg)
896 {
897         ir_entity *ent = get_irg_entity(irg);
898         be_gas_emit_function_prolog(ent, 4);
899         be_emit_write_line();
900 }
901
902 /**
903  * Emits code for function end
904  */
905 static void sparc_emit_func_epilog(ir_graph *irg)
906 {
907         ir_entity *ent = get_irg_entity(irg);
908         const char *irg_name = get_entity_ld_name(ent);
909         be_emit_write_line();
910         be_emit_irprintf("\t.size  %s, .-%s\n", irg_name, irg_name);
911         be_emit_cstring("# -- End ");
912         be_emit_string(irg_name);
913         be_emit_cstring("\n");
914         be_emit_write_line();
915 }
916
917 /**
918  * Block-walker:
919  * TODO: Sets labels for control flow nodes (jump target).
920  * Links control predecessors to there destination blocks.
921  */
922 static void sparc_gen_labels(ir_node *block, void *env)
923 {
924         ir_node *pred;
925         int n = get_Block_n_cfgpreds(block);
926         (void) env;
927
928         for (n--; n >= 0; n--) {
929                 pred = get_Block_cfgpred(block, n);
930                 set_irn_link(pred, block); // link the pred of a block (which is a jmp)
931         }
932 }
933
934
935 /**
936  * Main driver
937  */
938 void sparc_gen_routine(const sparc_code_gen_t *cg, ir_graph *irg)
939 {
940         ir_node **blk_sched;
941         ir_node *last_block = NULL;
942         ir_entity *entity     = get_irg_entity(irg);
943         int i, n;
944         (void) cg;
945
946         be_gas_elf_type_char = '#';
947         be_gas_object_file_format = OBJECT_FILE_FORMAT_ELF_SPARC;
948
949         /* register all emitter functions */
950         sparc_register_emitters();
951         be_dbg_method_begin(entity);
952
953         /* create the block schedule. For now, we don't need it earlier. */
954         blk_sched = be_create_block_schedule(irg);
955
956         // emit function prolog
957         sparc_emit_func_prolog(irg);
958
959         // generate BLOCK labels
960         irg_block_walk_graph(irg, sparc_gen_labels, NULL, NULL);
961
962         // inject block scheduling links & emit code of each block
963         n = ARR_LEN(blk_sched);
964         for (i = 0; i < n;) {
965                 ir_node *block, *next_bl;
966
967                 block = blk_sched[i];
968                 ++i;
969                 next_bl = i < n ? blk_sched[i] : NULL;
970
971                 /* set here the link. the emitter expects to find the next block here */
972                 set_irn_link(block, next_bl);
973                 sparc_gen_block(block, last_block);
974                 last_block = block;
975         }
976
977         // emit function epilog
978         sparc_emit_func_epilog(irg);
979 }
980
981 void sparc_init_emitter(void)
982 {
983         FIRM_DBG_REGISTER(dbg, "firm.be.sparc.emit");
984 }