Added alignment for stack params
[libfirm] / ir / be / beabi.c
1 /**
2  * ABI lowering.
3  *
4  * @author Sebastian Hack
5  * @date 7.3.2005
6  */
7
8 #ifdef HAVE_CONFIG_H
9 # include "config.h"
10 #endif
11
12 #include "obst.h"
13 #include "offset.h"
14
15 #include "type.h"
16 #include "irgopt.h"
17
18 #include "irgraph_t.h"
19 #include "irnode_t.h"
20 #include "ircons_t.h"
21 #include "iredges_t.h"
22 #include "irgmod.h"
23 #include "irgwalk.h"
24 #include "irprintf_t.h"
25 #include "irgopt.h"
26
27 #include "be.h"
28 #include "beabi.h"
29 #include "bearch.h"
30 #include "benode_t.h"
31 #include "belive_t.h"
32 #include "besched_t.h"
33
34 #define MAX(x, y) ((x) > (y) ? (x) : (y))
35 #define MIN(x, y) ((x) < (y) ? (x) : (y))
36
37 typedef struct _be_abi_call_arg_t {
38         unsigned is_res   : 1;
39         unsigned in_reg   : 1;
40         unsigned on_stack : 1;
41
42         int pos;
43         const arch_register_t *reg;
44         entity *stack_ent;
45         unsigned alignment;
46 } be_abi_call_arg_t;
47
48 struct _be_abi_call_t {
49         be_abi_call_flags_t flags;
50         const be_abi_callbacks_t *cb;
51         type *between_type;
52         set *params;
53 };
54
55 #define N_FRAME_TYPES 3
56
57 typedef struct _be_stack_frame_t {
58         type *arg_type;
59         type *between_type;
60         type *frame_type;
61
62         type *order[N_FRAME_TYPES];        /**< arg, between and frame types ordered. */
63
64         int initial_offset;
65         int stack_dir;
66 } be_stack_frame_t;
67
68 struct _be_stack_slot_t {
69         struct _be_stack_frame_t *frame;
70         entity *ent;
71 };
72
73 struct _be_abi_irg_t {
74         struct obstack       obst;
75         firm_dbg_module_t    *dbg;          /**< The debugging module. */
76         be_stack_frame_t     *frame;        /**< The stack frame model. */
77         const be_irg_t       *birg;         /**< The back end IRG. */
78         const arch_isa_t     *isa;          /**< The isa. */
79         survive_dce_t        *dce_survivor;
80
81         be_abi_call_t        *call;         /**< The ABI call information. */
82         type                 *method_type;  /**< The type of the method of the IRG. */
83
84         ir_node              *init_sp;      /**< The node representing the stack pointer
85                                                                              at the start of the function. */
86
87         ir_node              *reg_params;   /**< The reg params node. */
88         pmap                 *regs;         /**< A map of all callee-save and ignore regs to
89                                                                                         their Projs to the RegParams node. */
90
91         pset                 *stack_phis;   /**< The set of all Phi nodes inserted due to
92                                                                                         stack pointer modifying nodes. */
93
94         int                  start_block_bias;  /**< The stack bias at the end of the start block. */
95
96         void                 *cb;           /**< ABI Callback self pointer. */
97
98         arch_irn_handler_t irn_handler;
99         arch_irn_ops_t     irn_ops;
100 };
101
102 #define get_abi_from_handler(ptr) firm_container_of(ptr, be_abi_irg_t, irn_handler)
103 #define get_abi_from_ops(ptr)     firm_container_of(ptr, be_abi_irg_t, irn_ops)
104
105 /* Forward, since be need it in be_abi_introduce(). */
106 static const arch_irn_ops_if_t abi_irn_ops;
107 static const arch_irn_handler_t abi_irn_handler;
108
109 /*
110      _    ____ ___    ____      _ _ _                _
111     / \  | __ )_ _|  / ___|__ _| | | |__   __ _  ___| | _____
112    / _ \ |  _ \| |  | |   / _` | | | '_ \ / _` |/ __| |/ / __|
113   / ___ \| |_) | |  | |__| (_| | | | |_) | (_| | (__|   <\__ \
114  /_/   \_\____/___|  \____\__,_|_|_|_.__/ \__,_|\___|_|\_\___/
115
116   These callbacks are used by the backend to set the parameters
117   for a specific call type.
118 */
119
120 static int cmp_call_arg(const void *a, const void *b, size_t n)
121 {
122         const be_abi_call_arg_t *p = a, *q = b;
123         return !(p->is_res == q->is_res && p->pos == q->pos);
124 }
125
126 static be_abi_call_arg_t *get_or_set_call_arg(be_abi_call_t *call, int is_res, int pos, int do_insert)
127 {
128         be_abi_call_arg_t arg;
129         unsigned hash;
130
131         memset(&arg, 0, sizeof(arg));
132         arg.is_res = is_res;
133         arg.pos    = pos;
134
135         hash = is_res * 100 + pos;
136
137         return do_insert
138                 ? set_insert(call->params, &arg, sizeof(arg), hash)
139                 : set_find(call->params, &arg, sizeof(arg), hash);
140 }
141
142 static INLINE be_abi_call_arg_t *get_call_arg(be_abi_call_t *call, int is_res, int pos)
143 {
144         return get_or_set_call_arg(call, is_res, pos, 0);
145 }
146
147 void be_abi_call_set_flags(be_abi_call_t *call, be_abi_call_flags_t flags, const be_abi_callbacks_t *cb)
148 {
149         call->flags        = flags;
150         call->cb           = cb;
151 }
152
153 void be_abi_call_param_stack(be_abi_call_t *call, int arg_pos, unsigned alignment)
154 {
155         be_abi_call_arg_t *arg = get_or_set_call_arg(call, 0, arg_pos, 1);
156         arg->on_stack  = 1;
157         arg->alignment = alignment;
158         assert(alignment > 0 && "Alignment must be greater than 0");
159 }
160
161 void be_abi_call_param_reg(be_abi_call_t *call, int arg_pos, const arch_register_t *reg)
162 {
163         be_abi_call_arg_t *arg = get_or_set_call_arg(call, 0, arg_pos, 1);
164         arg->in_reg = 1;
165         arg->reg = reg;
166 }
167
168 void be_abi_call_res_reg(be_abi_call_t *call, int arg_pos, const arch_register_t *reg)
169 {
170         be_abi_call_arg_t *arg = get_or_set_call_arg(call, 1, arg_pos, 1);
171         arg->in_reg = 1;
172         arg->reg = reg;
173 }
174
175 be_abi_call_flags_t be_abi_call_get_flags(const be_abi_call_t *call)
176 {
177         return call->flags;
178 }
179
180 be_abi_call_t *be_abi_call_new(void)
181 {
182         be_abi_call_t *call = xmalloc(sizeof(call[0]));
183         call->flags.val  = 0;
184         call->params     = new_set(cmp_call_arg, 16);
185         call->cb         = NULL;
186         return call;
187 }
188
189 void be_abi_call_free(be_abi_call_t *call)
190 {
191         del_set(call->params);
192         free(call);
193 }
194
195 /*
196   _____                           _   _                 _ _ _
197  |  ___| __ __ _ _ __ ___   ___  | | | | __ _ _ __   __| | (_)_ __   __ _
198  | |_ | '__/ _` | '_ ` _ \ / _ \ | |_| |/ _` | '_ \ / _` | | | '_ \ / _` |
199  |  _|| | | (_| | | | | | |  __/ |  _  | (_| | | | | (_| | | | | | | (_| |
200  |_|  |_|  \__,_|_| |_| |_|\___| |_| |_|\__,_|_| |_|\__,_|_|_|_| |_|\__, |
201                                                                     |___/
202
203   Handling of the stack frame. It is composed of three types:
204   1) The type of the arguments which are pushed on the stack.
205   2) The "between type" which consists of stuff the call of the
206      function pushes on the stack (like the return address and
207          the old base pointer for ia32).
208   3) The Firm frame type which consists of all local variables
209      and the spills.
210 */
211
212 static int get_stack_entity_offset(be_stack_frame_t *frame, entity *ent, int bias)
213 {
214         type *t = get_entity_owner(ent);
215         int ofs = get_entity_offset_bytes(ent);
216
217         int i, index;
218
219         /* Find the type the entity is contained in. */
220         for(index = 0; index < N_FRAME_TYPES; ++index) {
221                 if(frame->order[index] == t)
222                         break;
223         }
224
225         /* Add the size of all the types below the one of the entity to the entity's offset */
226         for(i = 0; i < index; ++i)
227                 ofs += get_type_size_bytes(frame->order[i]);
228
229         /* correct the offset by the initial position of the frame pointer */
230         ofs -= frame->initial_offset;
231
232         /* correct the offset with the current bias. */
233         ofs += bias;
234
235         return ofs;
236 }
237
238 static entity *search_ent_with_offset(type *t, int offset)
239 {
240         int i, n;
241
242         for(i = 0, n = get_class_n_members(t); i < n; ++i) {
243                 entity *ent = get_class_member(t, i);
244                 if(get_entity_offset_bytes(ent) == offset)
245                         return ent;
246         }
247
248         return NULL;
249 }
250
251 static int stack_frame_compute_initial_offset(be_stack_frame_t *frame)
252 {
253         type   *base = frame->stack_dir < 0 ? frame->between_type : frame->frame_type;
254         entity *ent  = search_ent_with_offset(base, 0);
255         frame->initial_offset = 0;
256         frame->initial_offset = get_stack_entity_offset(frame, ent, 0);
257         return frame->initial_offset;
258 }
259
260 static be_stack_frame_t *stack_frame_init(be_stack_frame_t *frame, type *args, type *between, type *locals, int stack_dir)
261 {
262         frame->arg_type       = args;
263         frame->between_type   = between;
264         frame->frame_type     = locals;
265         frame->initial_offset = 0;
266         frame->stack_dir      = stack_dir;
267         frame->order[1]       = between;
268
269         if(stack_dir > 0) {
270                 frame->order[0] = args;
271                 frame->order[2] = locals;
272         }
273
274         else {
275                 frame->order[0] = locals;
276                 frame->order[2] = args;
277         }
278
279         return frame;
280 }
281
282 static void stack_frame_dump(FILE *file, be_stack_frame_t *frame)
283 {
284         int i, j, n;
285
286         ir_fprintf(file, "initial offset: %d\n", frame->initial_offset);
287         for(j = 0; j < N_FRAME_TYPES; ++j) {
288                 type *t = frame->order[j];
289
290                 ir_fprintf(file, "type %d: %Fm size: %d\n", j, t, get_type_size_bytes(t));
291                 for(i = 0, n = get_class_n_members(t); i < n; ++i) {
292                         entity *ent = get_class_member(t, i);
293                         ir_fprintf(file, "\t%F int ofs: %d glob ofs: %d\n", ent, get_entity_offset_bytes(ent), get_stack_entity_offset(frame, ent, 0));
294                 }
295         }
296 }
297
298 /**
299  * If irn is a Sel node computing the address of an entity
300  * on the frame type return the entity, else NULL.
301  */
302 static INLINE entity *get_sel_ent(ir_node *irn)
303 {
304         if(get_irn_opcode(irn) == iro_Sel
305                 && get_Sel_ptr(irn) == get_irg_frame(get_irn_irg(irn))) {
306
307                 return get_Sel_entity(irn);
308         }
309
310         return NULL;
311 }
312
313 /**
314  * Walker: Replaces Loads, Stores and Sels of frame type entities
315  * by FrameLoad, FrameStore and FrameAdress.
316  */
317 static void lower_frame_sels_walker(ir_node *irn, void *data)
318 {
319         ir_node *nw  = NULL;
320         entity *ent = get_sel_ent(irn);
321
322         if(ent != NULL) {
323                 be_abi_irg_t *env = data;
324                 ir_node *bl       = get_nodes_block(irn);
325                 ir_graph *irg     = get_irn_irg(bl);
326                 ir_node *frame    = get_irg_frame(irg);
327
328                 nw = be_new_FrameAddr(env->isa->sp->reg_class, irg, bl, frame, ent);
329         }
330
331         if(nw != NULL)
332                 exchange(irn, nw);
333 }
334
335 static INLINE int is_on_stack(be_abi_call_t *call, int pos)
336 {
337         be_abi_call_arg_t *arg = get_call_arg(call, 0, pos);
338         return arg && !arg->in_reg;
339 }
340
341 /*
342    ____      _ _
343   / ___|__ _| | |___
344  | |   / _` | | / __|
345  | |__| (_| | | \__ \
346   \____\__,_|_|_|___/
347
348   Adjustment of the calls inside a graph.
349
350 */
351
352 /**
353  * Transform a call node.
354  * @param env The ABI environment for the current irg.
355  * @param irn The call node.
356  * @param curr_sp The stack pointer node to use.
357  * @return The stack pointer after the call.
358  */
359 static ir_node *adjust_call(be_abi_irg_t *env, ir_node *irn, ir_node *curr_sp)
360 {
361         ir_graph *irg             = env->birg->irg;
362         const arch_isa_t *isa     = env->birg->main_env->arch_env->isa;
363         be_abi_call_t *call       = be_abi_call_new();
364         ir_type *mt               = get_Call_type(irn);
365         ir_node *call_ptr         = get_Call_ptr(irn);
366         int n_params              = get_method_n_params(mt);
367         ir_node *curr_mem         = get_Call_mem(irn);
368         ir_node *bl               = get_nodes_block(irn);
369         pset *results             = pset_new_ptr(8);
370         pset *caller_save         = pset_new_ptr(8);
371         int stack_size            = 0;
372         int stack_dir             = arch_isa_stack_dir(isa);
373         const arch_register_t *sp = arch_isa_sp(isa);
374         ir_mode *mach_mode        = sp->reg_class->mode;
375         struct obstack *obst      = &env->obst;
376         ir_node *no_mem           = get_irg_no_mem(irg);
377
378         ir_node *res_proj = NULL;
379         int curr_res_proj = pn_Call_max;
380         int n_low_args    = 0;
381         int n_pos         = 0;
382
383         ir_node *low_call;
384         ir_node **in;
385         ir_node **res_projs;
386         const ir_edge_t *edge;
387         int *low_args;
388         int *pos;
389         int i, n;
390
391         /* Let the isa fill out the abi description for that call node. */
392         arch_isa_get_call_abi(isa, mt, call);
393
394         /* Insert code to put the stack arguments on the stack. */
395         assert(get_Call_n_params(irn) == n_params);
396         for(i = 0; i < n_params; ++i) {
397                 be_abi_call_arg_t *arg = get_call_arg(call, 0, i);
398                 assert(arg);
399                 if(arg->on_stack) {
400                         stack_size += get_type_size_bytes(get_method_param_type(mt, i));
401                         obstack_int_grow(obst, i);
402                         n_pos++;
403                 }
404         }
405         pos = obstack_finish(obst);
406
407         /* Collect all arguments which are passed in registers. */
408         for(i = 0, n = get_Call_n_params(irn); i < n; ++i) {
409                 be_abi_call_arg_t *arg = get_call_arg(call, 0, i);
410                 if(arg && arg->in_reg) {
411                         obstack_int_grow(obst, i);
412                         n_low_args++;
413                 }
414         }
415         low_args = obstack_finish(obst);
416
417         /* If there are some parameters which shall be passed on the stack. */
418         if(n_pos > 0) {
419                 int curr_ofs      = 0;
420                 int do_seq        = call->flags.bits.store_args_sequential;
421
422                 /* Reverse list of stack parameters if call arguments are from left to right */
423                 if(call->flags.bits.left_to_right) {
424                         for(i = 0; i < n_pos / 2; ++i) {
425                                 int other  = n_pos - i - 1;
426                                 int tmp    = pos[i];
427                                 pos[i]     = pos[other];
428                                 pos[other] = tmp;
429                         }
430                 }
431
432                 /*
433                  * If the stack is decreasing and we do not want to store sequentially,
434                  * we allocate as much space on the stack all parameters need, by
435                  * moving the stack pointer along the stack's direction.
436                  */
437                 if(stack_dir < 0 && !do_seq) {
438                         curr_sp = be_new_IncSP(sp, irg, bl, curr_sp, no_mem, stack_size, be_stack_dir_along);
439                 }
440
441                 assert(mode_is_reference(mach_mode) && "machine mode must be pointer");
442                 for(i = 0; i < n_pos; ++i) {
443                         int p            = pos[i];
444                         ir_node *param   = get_Call_param(irn, p);
445                         ir_node *addr    = curr_sp;
446                         ir_node *mem     = NULL;
447                         type *param_type = get_method_param_type(mt, p);
448                         int param_size   = get_type_size_bytes(param_type);
449
450                         /* Make the expression to compute the argument's offset. */
451                         if(curr_ofs > 0) {
452                                 addr = new_r_Const_long(irg, bl, mode_Is, curr_ofs);
453                                 addr = new_r_Add(irg, bl, curr_sp, addr, mach_mode);
454                         }
455
456                         /* Insert a store for primitive arguments. */
457                         if(is_atomic_type(param_type)) {
458                                 mem = new_r_Store(irg, bl, curr_mem, addr, param);
459                                 mem = new_r_Proj(irg, bl, mem, mode_M, pn_Store_M);
460                         }
461
462                         /* Make a memcopy for compound arguments. */
463                         else {
464                                 assert(mode_is_reference(get_irn_mode(param)));
465                                 mem = new_r_CopyB(irg, bl, curr_mem, addr, param, param_type);
466                                 mem = new_r_Proj(irg, bl, mem, mode_M, pn_CopyB_M_regular);
467                         }
468
469                         obstack_ptr_grow(obst, mem);
470
471                         curr_ofs += param_size;
472
473                         /*
474                         * If we wanted to build the arguments sequentially,
475                         * the stack pointer for the next must be incremented,
476                         * and the memory value propagated.
477                         */
478                         if(do_seq) {
479                                 curr_ofs = 0;
480                                 curr_sp  = be_new_IncSP(sp, irg, bl, curr_sp, no_mem, param_size, be_stack_dir_along);
481                                 curr_mem = mem;
482                         }
483                 }
484
485                 in = (ir_node **) obstack_finish(obst);
486
487                 /* We need the sync only, if we didn't build the stores sequentially. */
488                 if(!do_seq)
489                         curr_mem = new_r_Sync(irg, bl, n_pos, in);
490                 obstack_free(obst, in);
491         }
492
493         /* Collect caller save registers */
494         for(i = 0, n = arch_isa_get_n_reg_class(isa); i < n; ++i) {
495                 int j;
496                 const arch_register_class_t *cls = arch_isa_get_reg_class(isa, i);
497                 for(j = 0; j < cls->n_regs; ++j) {
498                         const arch_register_t *reg = arch_register_for_index(cls, j);
499                         if(arch_register_type_is(reg, caller_save))
500                                 pset_insert_ptr(caller_save, (void *) reg);
501                 }
502         }
503
504         /* search the greatest result proj number */
505         foreach_out_edge(irn, edge) {
506                 const ir_edge_t *res_edge;
507                 ir_node *irn = get_edge_src_irn(edge);
508
509                 if(is_Proj(irn) && get_irn_mode(irn) == mode_T) {
510                         res_proj = irn;
511                         foreach_out_edge(irn, res_edge) {
512                                 int proj;
513                                 be_abi_call_arg_t *arg;
514                                 ir_node *res = get_edge_src_irn(res_edge);
515
516                                 assert(is_Proj(res));
517
518                                 proj = get_Proj_proj(res);
519                                 arg = get_call_arg(call, 1, proj);
520
521                                 /*
522                                         shift the proj number to the right, since we will drop the
523                                         unspeakable Proj_T from the Call. Therefore, all real argument
524                                         Proj numbers must be increased by pn_Call_max
525                                 */
526                                 proj += pn_Call_max;
527                                 set_Proj_proj(res, proj);
528                                 obstack_ptr_grow(obst, res);
529
530                                 if(proj > curr_res_proj)
531                                         curr_res_proj = proj;
532                                 if(arg->in_reg) {
533                                         pset_remove_ptr(caller_save, arg->reg);
534                                         //pmap_insert(arg_regs, arg->reg, INT_TO_PTR(proj + 1))
535                                 }
536                         }
537                 }
538         }
539
540         curr_res_proj++;
541         obstack_ptr_grow(obst, NULL);
542         res_projs = obstack_finish(obst);
543
544         /* make the back end call node and set its register requirements. */
545         for(i = 0; i < n_low_args; ++i)
546                 obstack_ptr_grow(obst, get_Call_param(irn, low_args[i]));
547
548         in = obstack_finish(obst);
549
550         if(env->call->flags.bits.call_has_imm && get_irn_opcode(call_ptr) == iro_SymConst) {
551                 low_call = be_new_Call(irg, bl, curr_mem, curr_sp, curr_sp, curr_res_proj + pset_count(caller_save), n_low_args, in);
552                 be_Call_set_entity(low_call, get_SymConst_entity(call_ptr));
553         }
554
555         else
556                 low_call = be_new_Call(irg, bl, curr_mem, curr_sp, call_ptr, curr_res_proj + pset_count(caller_save), n_low_args, in);
557
558         /* Set the register classes and constraints of the Call parameters. */
559         for(i = 0; i < n_low_args; ++i) {
560                 int index = low_args[i];
561                 be_abi_call_arg_t *arg = get_call_arg(call, 0, index);
562                 assert(arg->reg != NULL);
563
564                 be_set_constr_single_reg(low_call, be_pos_Call_first_arg + index, arg->reg);
565         }
566
567         /* Set the register constraints of the results. */
568         for(i = 0; res_projs[i]; ++i) {
569                 ir_node *irn                 = res_projs[i];
570                 int proj                     = get_Proj_proj(irn);
571
572                 /* Correct Proj number since it has been adjusted! (see above) */
573                 const be_abi_call_arg_t *arg = get_call_arg(call, 1, proj - pn_Call_max);
574
575                 assert(arg->in_reg);
576                 be_set_constr_single_reg(low_call, BE_OUT_POS(proj), arg->reg);
577         }
578         obstack_free(obst, in);
579         exchange(irn, low_call);
580
581         /* redirect the result projs to the lowered call instead of the Proj_T */
582         for(i = 0; res_projs[i]; ++i)
583                 set_Proj_pred(res_projs[i], low_call);
584
585         /* Make additional projs for the caller save registers
586            and the Keep node which keeps them alive. */
587         if(pset_count(caller_save) > 0) {
588                 const arch_register_t *reg;
589                 ir_node **in, *keep;
590                 int i, n;
591
592                 for(reg = pset_first(caller_save), n = 0; reg; reg = pset_next(caller_save), ++n) {
593                         ir_node *proj = new_r_Proj(irg, bl, low_call, reg->reg_class->mode, curr_res_proj);
594
595                         /* memorize the register in the link field. we need afterwards to set the register class of the keep correctly. */
596                         be_set_constr_single_reg(low_call, BE_OUT_POS(curr_res_proj), reg);
597                         set_irn_link(proj, (void *) reg);
598                         obstack_ptr_grow(obst, proj);
599                         curr_res_proj++;
600                 }
601
602                 in   = (ir_node **) obstack_finish(obst);
603                 keep = be_new_Keep(NULL, irg, bl, n, in);
604                 for(i = 0; i < n; ++i) {
605                         const arch_register_t *reg = get_irn_link(in[i]);
606                         be_node_set_reg_class(keep, i, reg->reg_class);
607                 }
608                 obstack_free(obst, in);
609         }
610
611         /* Clean up the stack. */
612         if(stack_size > 0) {
613                 ir_node *mem_proj = NULL;
614
615                 foreach_out_edge(low_call, edge) {
616                         ir_node *irn = get_edge_src_irn(edge);
617                         if(is_Proj(irn) && get_Proj_proj(irn) == pn_Call_M) {
618                                 mem_proj = irn;
619                                 break;
620                         }
621                 }
622
623                 if(!mem_proj)
624                         mem_proj = new_r_Proj(irg, bl, low_call, mode_M, pn_Call_M);
625
626                 /* Make a Proj for the stack pointer. */
627                 curr_sp     = be_new_IncSP(sp, irg, bl, curr_sp, mem_proj, stack_size, be_stack_dir_against);
628         }
629
630         be_abi_call_free(call);
631         obstack_free(obst, pos);
632         del_pset(results);
633         del_pset(caller_save);
634
635         return curr_sp;
636 }
637
638 /**
639  * Adjust an alloca.
640  * The alloca is transformed into a back end alloca node and connected to the stack nodes.
641  */
642 static ir_node *adjust_alloc(be_abi_irg_t *env, ir_node *alloc, ir_node *curr_sp)
643 {
644         if(get_Alloc_where(alloc) == stack_alloc) {
645                 ir_node *bl        = get_nodes_block(alloc);
646                 ir_graph *irg      = get_irn_irg(bl);
647                 ir_node *alloc_mem = NULL;
648                 ir_node *alloc_res = NULL;
649
650                 const ir_edge_t *edge;
651                 ir_node *new_alloc;
652
653                 env->call->flags.bits.try_omit_fp = 0;
654
655                 new_alloc = be_new_AddSP(env->isa->sp, irg, bl, curr_sp, get_Alloc_size(alloc));
656
657                 foreach_out_edge(alloc, edge) {
658                         ir_node *irn = get_edge_src_irn(edge);
659
660                         assert(is_Proj(irn));
661                         switch(get_Proj_proj(irn)) {
662                         case pn_Alloc_M:
663                                 alloc_mem = irn;
664                                 break;
665                         case pn_Alloc_res:
666                                 alloc_res = irn;
667                                 break;
668                         default:
669                                 break;
670                         }
671                 }
672
673                 assert(alloc_res != NULL);
674                 exchange(alloc_res, env->isa->stack_dir < 0 ? new_alloc : curr_sp);
675
676                 if(alloc_mem != NULL)
677                         exchange(alloc_mem, new_r_NoMem(irg));
678
679                 curr_sp = new_alloc;
680         }
681
682         return curr_sp;
683 }
684
685 /**
686  * Walker for dependent_on().
687  * This function searches a node tgt recursively from a given node
688  * but is restricted to the given block.
689  * @return 1 if tgt was reachable from curr, 0 if not.
690  */
691 static int check_dependence(ir_node *curr, ir_node *tgt, ir_node *bl, unsigned long visited_nr)
692 {
693         int n, i;
694
695         if(get_irn_visited(curr) >= visited_nr)
696                 return 0;
697
698         set_irn_visited(curr, visited_nr);
699         if(get_nodes_block(curr) != bl)
700                 return 0;
701
702         if(curr == tgt)
703                 return 1;
704
705         for(i = 0, n = get_irn_arity(curr); i < n; ++i) {
706                 if(check_dependence(get_irn_n(curr, i), tgt, bl, visited_nr))
707                         return 1;
708         }
709
710         return 0;
711 }
712
713 /**
714  * Check if a node is somehow data dependent on another one.
715  * both nodes must be in the same basic block.
716  * @param n1 The first node.
717  * @param n2 The second node.
718  * @return 1, if n1 is data dependent (transitively) on n2, 0 if not.
719  */
720 static int dependent_on(ir_node *n1, ir_node *n2)
721 {
722         ir_node *bl   = get_nodes_block(n1);
723         ir_graph *irg = get_irn_irg(bl);
724         long vis_nr   = get_irg_visited(irg) + 1;
725
726         assert(bl == get_nodes_block(n2));
727         set_irg_visited(irg, vis_nr);
728         return check_dependence(n1, n2, bl, vis_nr);
729 }
730
731 static int cmp_call_dependecy(const void *c1, const void *c2)
732 {
733         ir_node *n1 = *(ir_node **) c1;
734         ir_node *n2 = *(ir_node **) c2;
735
736         /*
737                 Classical qsort() comparison function behavior:
738                 0  if both elements are equal
739                 1  if second is "smaller" that first
740                 -1 if first is "smaller" that second
741         */
742         return n1 == n2 ? 0 : (dependent_on(n1, n2) ? -1 : 1);
743 }
744
745 static void link_calls_in_block_walker(ir_node *irn, void *data)
746 {
747         if(is_Call(irn)) {
748                 be_abi_irg_t *env = data;
749                 ir_node *bl       = get_nodes_block(irn);
750                 void *save        = get_irn_link(bl);
751
752                 env->call->flags.bits.irg_is_leaf = 0;
753
754                 set_irn_link(irn, save);
755                 set_irn_link(bl, irn);
756         }
757 }
758
759 /**
760  * Process all call nodes inside a basic block.
761  * Note that the link field of the block must contain a linked list of all
762  * Call nodes inside the block. We first order this list according to data dependency
763  * and that connect the calls together.
764  */
765 static void process_calls_in_block(ir_node *bl, void *data)
766 {
767         be_abi_irg_t *env = data;
768         ir_node *curr_sp  = env->init_sp;
769         ir_node *irn;
770         int n;
771
772         for(irn = get_irn_link(bl), n = 0; irn; irn = get_irn_link(irn), ++n)
773                 obstack_ptr_grow(&env->obst, irn);
774
775         /* If there were call nodes in the block. */
776         if(n > 0) {
777                 ir_node **nodes;
778                 int i;
779
780                 nodes = obstack_finish(&env->obst);
781
782                 /* order the call nodes according to data dependency */
783                 qsort(nodes, n, sizeof(nodes[0]), cmp_call_dependecy);
784
785                 for(i = n - 1; i >= 0; --i) {
786                         ir_node *irn = nodes[i];
787
788                         switch(get_irn_opcode(irn)) {
789                         case iro_Call:
790                                 curr_sp = adjust_call(env, irn, curr_sp);
791                                 break;
792                         case iro_Alloc:
793                                 curr_sp = adjust_alloc(env, irn, curr_sp);
794                                 break;
795                         default:
796                                 break;
797                         }
798                 }
799
800                 obstack_free(&env->obst, nodes);
801
802                 /* Keep the last stack state in the block by tying it to Keep node */
803                 nodes[0] = curr_sp;
804                 be_new_Keep(env->isa->sp->reg_class, get_irn_irg(bl), bl, 1, nodes);
805         }
806
807         set_irn_link(bl, curr_sp);
808 }
809
810 /**
811  * Adjust all call nodes in the graph to the ABI conventions.
812  */
813 static void process_calls(be_abi_irg_t *env)
814 {
815         ir_graph *irg = env->birg->irg;
816
817         env->call->flags.bits.irg_is_leaf = 1;
818         irg_walk_graph(irg, firm_clear_link, link_calls_in_block_walker, env);
819         irg_block_walk_graph(irg, NULL, process_calls_in_block, env);
820 }
821
822 static void collect_return_walker(ir_node *irn, void *data)
823 {
824         if(get_irn_opcode(irn) == iro_Return) {
825                 struct obstack *obst = data;
826                 obstack_ptr_grow(obst, irn);
827         }
828 }
829
830 static ir_node *setup_frame(be_abi_irg_t *env)
831 {
832         const arch_isa_t *isa = env->birg->main_env->arch_env->isa;
833         const arch_register_t *sp = isa->sp;
834         const arch_register_t *bp = isa->bp;
835         be_abi_call_flags_bits_t flags = env->call->flags.bits;
836         ir_graph *irg      = env->birg->irg;
837         ir_node *bl        = get_irg_start_block(irg);
838         ir_node *no_mem    = get_irg_no_mem(irg);
839         ir_node *old_frame = get_irg_frame(irg);
840         ir_node *stack     = pmap_get(env->regs, (void *) sp);
841         ir_node *frame     = pmap_get(env->regs, (void *) bp);
842
843         int stack_nr       = get_Proj_proj(stack);
844
845         if(flags.try_omit_fp) {
846                 stack = be_new_IncSP(sp, irg, bl, stack, no_mem, BE_STACK_FRAME_SIZE, be_stack_dir_along);
847                 frame = stack;
848         }
849
850         else {
851                 frame = be_new_Copy(bp->reg_class, irg, bl, stack);
852
853                 be_node_set_flags(frame, -1, arch_irn_flags_dont_spill);
854                 if(!flags.fp_free) {
855                         be_set_constr_single_reg(frame, -1, bp);
856                         be_node_set_flags(frame, -1, arch_irn_flags_ignore);
857                         arch_set_irn_register(env->birg->main_env->arch_env, frame, bp);
858                 }
859
860                 stack = be_new_IncSP(sp, irg, bl, stack, frame, BE_STACK_FRAME_SIZE, be_stack_dir_along);
861         }
862
863         be_node_set_flags(env->reg_params, -(stack_nr + 1), arch_irn_flags_ignore);
864         env->init_sp = stack;
865         set_irg_frame(irg, frame);
866         edges_reroute(old_frame, frame, irg);
867
868         return frame;
869 }
870
871 static void clearup_frame(be_abi_irg_t *env, ir_node *ret, pmap *reg_map, struct obstack *obst)
872 {
873         const arch_isa_t *isa = env->birg->main_env->arch_env->isa;
874         const arch_register_t *sp = isa->sp;
875         const arch_register_t *bp = isa->bp;
876         ir_graph *irg      = env->birg->irg;
877         ir_node *ret_mem   = get_Return_mem(ret);
878         ir_node *frame     = get_irg_frame(irg);
879         ir_node *bl        = get_nodes_block(ret);
880         ir_node *stack     = get_irn_link(bl);
881
882         pmap_entry *ent;
883
884         if(env->call->flags.bits.try_omit_fp) {
885                 stack = be_new_IncSP(sp, irg, bl, stack, ret_mem, BE_STACK_FRAME_SIZE, be_stack_dir_against);
886         }
887
888         else {
889                 stack = be_new_SetSP(sp, irg, bl, stack, frame, ret_mem);
890                 be_set_constr_single_reg(stack, -1, sp);
891                 be_node_set_flags(stack, -1, arch_irn_flags_ignore);
892         }
893
894         pmap_foreach(env->regs, ent) {
895                 const arch_register_t *reg = ent->key;
896                 ir_node *irn               = ent->value;
897
898                 if(reg == sp)
899                         obstack_ptr_grow(&env->obst, stack);
900                 else if(reg == bp)
901                         obstack_ptr_grow(&env->obst, frame);
902                 else if(arch_register_type_is(reg, callee_save) || arch_register_type_is(reg, ignore))
903                         obstack_ptr_grow(obst, irn);
904         }
905 }
906
907 static ir_type *compute_arg_type(be_abi_irg_t *env, be_abi_call_t *call, ir_type *method_type)
908 {
909         int dir  = env->call->flags.bits.left_to_right ? 1 : -1;
910         int inc  = env->birg->main_env->arch_env->isa->stack_dir * dir;
911         int n    = get_method_n_params(method_type);
912         int curr = inc > 0 ? 0 : n - 1;
913         int ofs  = 0;
914
915         char buf[128];
916         ir_type *res;
917         int i;
918
919         snprintf(buf, sizeof(buf), "%s_arg_type", get_entity_name(get_irg_entity(env->birg->irg)));
920         res = new_type_class(new_id_from_str(buf));
921
922         for(i = 0; i < n; ++i, curr += inc) {
923                 type *param_type       = get_method_param_type(method_type, curr);
924                 be_abi_call_arg_t *arg = get_call_arg(call, 0, curr);
925
926                 if(arg->on_stack) {
927                         snprintf(buf, sizeof(buf), "param_%d", i);
928                         arg->stack_ent = new_entity(res, new_id_from_str(buf), param_type);
929                         ofs = round_up2(ofs, arg->alignment);
930                         set_entity_offset_bytes(arg->stack_ent, ofs);
931                         ofs += get_type_size_bytes(param_type);
932                 }
933         }
934
935         set_type_size_bytes(res, ofs);
936         return res;
937 }
938
939 static void create_register_perms(const arch_isa_t *isa, ir_graph *irg, ir_node *bl, pmap *regs)
940 {
941         int i, j, n;
942         struct obstack obst;
943
944         obstack_init(&obst);
945
946         /* Create a Perm after the RegParams node to delimit it. */
947         for(i = 0, n = arch_isa_get_n_reg_class(isa); i < n; ++i) {
948                 const arch_register_class_t *cls = arch_isa_get_reg_class(isa, i);
949                 ir_node *perm;
950                 ir_node **in;
951                 int n_regs;
952
953                 for(n_regs = 0, j = 0; j < cls->n_regs; ++j) {
954                         const arch_register_t *reg = &cls->regs[j];
955                         ir_node *irn = pmap_get(regs, (void *) reg);
956
957                         if(irn && !arch_register_type_is(reg, ignore)) {
958                                 n_regs++;
959                                 obstack_ptr_grow(&obst, irn);
960                                 set_irn_link(irn, (void *) reg);
961                         }
962                 }
963
964                 obstack_ptr_grow(&obst, NULL);
965                 in = obstack_finish(&obst);
966                 if(n_regs > 0) {
967                         perm = be_new_Perm(cls, irg, bl, n_regs, in);
968                         for(j = 0; j < n_regs; ++j) {
969                                 ir_node *arg = in[j];
970                                 arch_register_t *reg = get_irn_link(arg);
971                                 pmap_insert(regs, reg, arg);
972                                 be_set_constr_single_reg(perm, BE_OUT_POS(j), reg);
973                         }
974                 }
975                 obstack_free(&obst, in);
976         }
977
978         obstack_free(&obst, NULL);
979 }
980
981 typedef struct {
982         const arch_register_t *reg;
983         ir_node *irn;
984 } reg_node_map_t;
985
986 static int cmp_regs(const void *a, const void *b)
987 {
988         const reg_node_map_t *p = a;
989         const reg_node_map_t *q = b;
990
991         if(p->reg->reg_class == q->reg->reg_class)
992                 return p->reg->index - q->reg->index;
993         else
994                 return p->reg->reg_class - q->reg->reg_class;
995 }
996
997 static reg_node_map_t *reg_map_to_arr(struct obstack *obst, pmap *reg_map)
998 {
999         pmap_entry *ent;
1000         int n = pmap_count(reg_map);
1001         int i = 0;
1002         reg_node_map_t *res = obstack_alloc(obst, n * sizeof(res[0]));
1003
1004         pmap_foreach(reg_map, ent) {
1005                 res[i].reg = ent->key;
1006                 res[i].irn = ent->value;
1007                 i++;
1008         }
1009
1010         qsort(res, n, sizeof(res[0]), cmp_regs);
1011         return res;
1012 }
1013
1014 static void create_barrier(be_abi_irg_t *env, ir_node *bl, ir_node **mem, pmap *regs, int in_req)
1015 {
1016         ir_graph *irg = env->birg->irg;
1017         int i, n;
1018         int n_regs = pmap_count(regs);
1019         ir_node *irn;
1020         ir_node **in;
1021         reg_node_map_t *rm;
1022
1023         rm = reg_map_to_arr(&env->obst, regs);
1024
1025         for(i = 0, n = 0; i < n_regs; ++i, ++n)
1026                 obstack_ptr_grow(&env->obst, rm[i].irn);
1027
1028         if(mem) {
1029                 obstack_ptr_grow(&env->obst, *mem);
1030                 n++;
1031         }
1032
1033         in = (ir_node **) obstack_finish(&env->obst);
1034         irn = be_new_Barrier(env->birg->irg, bl, n, in);
1035         obstack_free(&env->obst, in);
1036
1037         for(n = 0; n < n_regs; ++n) {
1038                 int pos = BE_OUT_POS(n);
1039                 ir_node *proj;
1040                 const arch_register_t *reg = rm[n].reg;
1041
1042                 proj = new_r_Proj(env->birg->irg, bl, irn, get_irn_mode(rm[i].irn), n);
1043                 be_node_set_reg_class(irn, n, reg->reg_class);
1044                 if(in_req)
1045                         be_set_constr_single_reg(irn, n, reg);
1046                 be_set_constr_single_reg(irn, pos, reg);
1047                 be_node_set_reg_class(irn, pos, reg->reg_class);
1048                 arch_set_irn_register(env->birg->main_env->arch_env, proj, reg);
1049                 if(arch_register_type_is(reg, ignore))
1050                         be_node_set_flags(irn, pos, arch_irn_flags_ignore);
1051
1052                 pmap_insert(regs, (void *) reg, proj);
1053         }
1054
1055         if(mem) {
1056                 *mem = new_r_Proj(env->birg->irg, bl, irn, mode_M, n);
1057         }
1058
1059         obstack_free(&env->obst, rm);
1060 }
1061
1062 /**
1063  * Modify the irg itself and the frame type.
1064  */
1065 static void modify_irg(be_abi_irg_t *env)
1066 {
1067         firm_dbg_module_t *dbg    = env->dbg;
1068         be_abi_call_t *call       = env->call;
1069         const arch_isa_t *isa     = env->birg->main_env->arch_env->isa;
1070         const arch_register_t *sp = arch_isa_sp(isa);
1071         ir_graph *irg             = env->birg->irg;
1072         ir_node *bl               = get_irg_start_block(irg);
1073         ir_node *end              = get_irg_end_block(irg);
1074         ir_node *arg_tuple        = get_irg_args(irg);
1075         ir_node *no_mem           = get_irg_no_mem(irg);
1076         ir_node *mem              = get_irg_initial_mem(irg);
1077         type *method_type         = get_entity_type(get_irg_entity(irg));
1078         pset *dont_save           = pset_new_ptr(8);
1079         pmap *reg_proj_map        = pmap_create();
1080         int n_params              = get_method_n_params(method_type);
1081         int max_arg               = 0;
1082         int arg_offset            = 0;
1083
1084         int i, j, n;
1085
1086         reg_node_map_t *rm;
1087         const arch_register_t *fp_reg;
1088         ir_node *frame_pointer;
1089         ir_node *reg_params_bl;
1090         ir_node **args;
1091         const ir_edge_t *edge;
1092         ir_type *arg_type, *bet_type;
1093
1094         pmap_entry *ent;
1095         bitset_t *used_proj_nr;
1096
1097         DBG((dbg, LEVEL_1, "introducing abi on %+F\n", irg));
1098
1099         /* Convert the Sel nodes in the irg to frame load/store/addr nodes. */
1100         irg_walk_graph(irg, lower_frame_sels_walker, NULL, env);
1101
1102         env->frame = obstack_alloc(&env->obst, sizeof(env->frame[0]));
1103         env->regs  = pmap_create();
1104
1105         /* Find the maximum proj number of the argument tuple proj */
1106         foreach_out_edge(arg_tuple, edge)  {
1107                 ir_node *irn = get_edge_src_irn(edge);
1108                 int nr       = get_Proj_proj(irn);
1109                 max_arg      = MAX(max_arg, nr);
1110         }
1111         max_arg = MAX(max_arg + 1, n_params);
1112         args        = obstack_alloc(&env->obst, max_arg * sizeof(args[0]));
1113         memset(args, 0, max_arg * sizeof(args[0]));
1114         used_proj_nr = bitset_alloca(1024);
1115
1116         /* Fill the argument vector */
1117         foreach_out_edge(arg_tuple, edge) {
1118                 ir_node *irn = get_edge_src_irn(edge);
1119                 int nr       = get_Proj_proj(irn);
1120                 args[nr]     = irn;
1121                 DBG((dbg, LEVEL_2, "\treading arg: %d -> %+F\n", nr, irn));
1122         }
1123
1124         arg_type = compute_arg_type(env, call, method_type);
1125         bet_type = call->cb->get_between_type(env->cb);
1126         stack_frame_init(env->frame, arg_type, bet_type, get_irg_frame_type(irg), isa->stack_dir);
1127
1128         /* Count the register params and add them to the number of Projs for the RegParams node */
1129         for(i = 0; i < n_params; ++i) {
1130                 be_abi_call_arg_t *arg = get_call_arg(call, 0, i);
1131                 if(arg->in_reg && args[i]) {
1132                         assert(arg->reg != sp && "cannot use stack pointer as parameter register");
1133                         assert(i == get_Proj_proj(args[i]));
1134
1135                         /* For now, associate the register with the old Proj from Start representing that argument. */
1136                         pmap_insert(env->regs, (void *) arg->reg, args[i]);
1137                         bitset_set(used_proj_nr, i);
1138                         DBG((dbg, LEVEL_2, "\targ #%d -> reg %s\n", i, arg->reg->name));
1139                 }
1140         }
1141
1142         /* Collect all callee-save registers */
1143         for(i = 0, n = arch_isa_get_n_reg_class(isa); i < n; ++i) {
1144                 const arch_register_class_t *cls = arch_isa_get_reg_class(isa, i);
1145                 for(j = 0; j < cls->n_regs; ++j) {
1146                         const arch_register_t *reg = &cls->regs[j];
1147                         if(arch_register_type_is(reg, callee_save) || arch_register_type_is(reg, ignore))
1148                                 pmap_insert(env->regs, (void *) reg, NULL);
1149                 }
1150         }
1151
1152         pmap_insert(env->regs, (void *) sp, NULL);
1153         pmap_insert(env->regs, (void *) isa->bp, NULL);
1154         reg_params_bl   = get_irg_start_block(irg);
1155         env->reg_params = be_new_RegParams(irg, reg_params_bl, pmap_count(env->regs));
1156
1157         /*
1158          * make proj nodes for the callee save registers.
1159          * memorize them, since Return nodes get those as inputs.
1160          *
1161          * Note, that if a register corresponds to an argument, the regs map contains
1162          * the old Proj from start for that argument.
1163          */
1164
1165         rm = reg_map_to_arr(&env->obst, env->regs);
1166         for(i = 0, n = pmap_count(env->regs); i < n; ++i) {
1167                 arch_register_t *reg = (void *) rm[i].reg;
1168                 ir_node *arg_proj    = rm[i].irn;
1169                 ir_node *proj;
1170                 ir_mode *mode        = arg_proj ? get_irn_mode(arg_proj) : reg->reg_class->mode;
1171                 long nr              = i;
1172                 int pos              = BE_OUT_POS((int) nr);
1173
1174                 assert(nr >= 0);
1175                 bitset_set(used_proj_nr, nr);
1176                 proj = new_r_Proj(irg, reg_params_bl, env->reg_params, mode, nr);
1177                 pmap_insert(env->regs, (void *) reg, proj);
1178                 be_set_constr_single_reg(env->reg_params, pos, reg);
1179                 arch_set_irn_register(env->birg->main_env->arch_env, proj, reg);
1180
1181                 /*
1182                  * If the register is an ignore register,
1183                  * The Proj for that register shall also be ignored during register allocation.
1184                  */
1185                 if(arch_register_type_is(reg, ignore))
1186                         be_node_set_flags(env->reg_params, pos, arch_irn_flags_ignore);
1187
1188                 DBG((dbg, LEVEL_2, "\tregister save proj #%d -> reg %s\n", nr, reg->name));
1189         }
1190         obstack_free(&env->obst, rm);
1191
1192         /* Generate the Prologue */
1193         fp_reg = call->cb->prologue(env->cb, &mem, env->regs);
1194         create_barrier(env, bl, &mem, env->regs, 0);
1195
1196         env->init_sp  = be_abi_reg_map_get(env->regs, sp);
1197         env->init_sp  = be_new_IncSP(sp, irg, bl, env->init_sp, no_mem, BE_STACK_FRAME_SIZE, be_stack_dir_along);
1198         arch_set_irn_register(env->birg->main_env->arch_env, env->init_sp, sp);
1199         be_abi_reg_map_set(env->regs, sp, env->init_sp);
1200         frame_pointer = be_abi_reg_map_get(env->regs, sp);
1201         set_irg_frame(irg, frame_pointer);
1202
1203         /* Now, introduce stack param nodes for all parameters passed on the stack */
1204         for(i = 0; i < max_arg; ++i) {
1205                 ir_node *arg_proj = args[i];
1206                 ir_node *repl     = NULL;
1207
1208                 if(arg_proj != NULL) {
1209                         be_abi_call_arg_t *arg;
1210                         ir_type *param_type;
1211                         int nr = get_Proj_proj(arg_proj);
1212
1213                         nr         = MIN(nr, n_params);
1214                         arg        = get_call_arg(call, 0, nr);
1215                         param_type = get_method_param_type(method_type, nr);
1216
1217                         if(arg->in_reg) {
1218                                 repl = pmap_get(env->regs, (void *) arg->reg);
1219                         }
1220
1221                         else if(arg->on_stack) {
1222                                 /* For atomic parameters which are actually used, we create a StackParam node. */
1223                                 if(is_atomic_type(param_type) && get_irn_n_edges(args[i]) > 0) {
1224                                         ir_mode *mode                    = get_type_mode(param_type);
1225                                         const arch_register_class_t *cls = arch_isa_get_reg_class_for_mode(isa, mode);
1226                                         repl = be_new_StackParam(cls, isa->bp->reg_class, irg, reg_params_bl, mode, frame_pointer, arg->stack_ent);
1227                                 }
1228
1229                                 /* The stack parameter is not primitive (it is a struct or array),
1230                                 we thus will create a node representing the parameter's address
1231                                 on the stack. */
1232                                 else {
1233                                         repl = be_new_FrameAddr(sp->reg_class, irg, reg_params_bl, frame_pointer, arg->stack_ent);
1234                                 }
1235                         }
1236
1237                         assert(repl != NULL);
1238                         edges_reroute(args[i], repl, irg);
1239                 }
1240         }
1241
1242         /* All Return nodes hang on the End node, so look for them there. */
1243         for(i = 0, n = get_irn_arity(end); i < n; ++i) {
1244                 ir_node *irn = get_irn_n(end, i);
1245
1246                 if(get_irn_opcode(irn) == iro_Return) {
1247                         ir_node *bl    = get_nodes_block(irn);
1248                         int n_res      = get_Return_n_ress(irn);
1249                         pmap *reg_map  = pmap_create();
1250                         ir_node *mem   = get_Return_mem(irn);
1251                         int in_max;
1252                         ir_node *ret;
1253                         int i, n;
1254                         ir_node **in;
1255                         const arch_register_t **regs;
1256
1257                         pmap_insert(reg_map, (void *) sp, pmap_get(env->regs, (void *) sp));
1258
1259                         /* Insert results for Return into the register map. */
1260                         for(i = 0; i < n_res; ++i) {
1261                                 ir_node *res           = get_Return_res(irn, i);
1262                                 be_abi_call_arg_t *arg = get_call_arg(call, 1, i);
1263                                 assert(arg->in_reg && "return value must be passed in register");
1264                                 pmap_insert(reg_map, (void *) arg->reg, res);
1265                         }
1266
1267                         /* Add uses of the callee save registers. */
1268                         pmap_foreach(env->regs, ent) {
1269                                 const arch_register_t *reg = ent->key;
1270                                 if(arch_register_type_is(reg, callee_save) || arch_register_type_is(reg, ignore))
1271                                         pmap_insert(reg_map, ent->key, ent->value);
1272                         }
1273
1274                         /* Make the Epilogue node and call the arch's epilogue maker. */
1275                         create_barrier(env, bl, &mem, reg_map, 1);
1276                         call->cb->epilogue(env->cb, bl, &mem, reg_map);
1277
1278                         /*
1279                                 Maximum size of the in array for Return nodes is
1280                                 return args + callee save/ignore registers + memory + stack pointer
1281                         */
1282                         in_max = pmap_count(reg_map) + get_Return_n_ress(irn) + 2;
1283
1284                         in   = obstack_alloc(&env->obst, in_max * sizeof(in[0]));
1285                         regs = obstack_alloc(&env->obst, in_max * sizeof(regs[0]));
1286
1287                         in[0]   = mem;
1288                         in[1]   = be_abi_reg_map_get(reg_map, sp);
1289                         regs[0] = NULL;
1290                         regs[1] = sp;
1291                         n       = 2;
1292
1293                         /* clear SP entry, since it has already been grown. */
1294                         pmap_insert(reg_map, (void *) sp, NULL);
1295                         for(i = 0; i < n_res; ++i) {
1296                                 ir_node *res           = get_Return_res(irn, i);
1297                                 be_abi_call_arg_t *arg = get_call_arg(call, 1, i);
1298
1299                                 in[n]     = be_abi_reg_map_get(reg_map, arg->reg);
1300                                 regs[n++] = arg->reg;
1301
1302                                 /* Clear the map entry to mark the register as processed. */
1303                                 be_abi_reg_map_set(reg_map, arg->reg, NULL);
1304                         }
1305
1306                         /* grow the rest of the stuff. */
1307                         pmap_foreach(reg_map, ent) {
1308                                 if(ent->value) {
1309                                         in[n]     = ent->value;
1310                                         regs[n++] = ent->key;
1311                                 }
1312                         }
1313
1314                         /* The in array for the new back end return is now ready. */
1315                         ret = be_new_Return(irg, bl, n, in);
1316
1317                         /* Set the register classes of the return's parameter accordingly. */
1318                         for(i = 0; i < n; ++i)
1319                                 if(regs[i])
1320                                         be_node_set_reg_class(ret, i, regs[i]->reg_class);
1321
1322                         /* Free the space of the Epilog's in array and the register <-> proj map. */
1323                         obstack_free(&env->obst, in);
1324                         exchange(irn, ret);
1325                         pmap_destroy(reg_map);
1326                 }
1327         }
1328
1329         obstack_free(&env->obst, args);
1330 }
1331
1332 /**
1333  * Walker: puts all Alloc(stack_alloc) on a obstack
1334  */
1335 static void collect_alloca_walker(ir_node *irn, void *data)
1336 {
1337         be_abi_irg_t *env = data;
1338         if(get_irn_opcode(irn) == iro_Alloc && get_Alloc_where(irn) == stack_alloc)
1339                 obstack_ptr_grow(&env->obst, irn);
1340 }
1341
1342 be_abi_irg_t *be_abi_introduce(be_irg_t *birg)
1343 {
1344         be_abi_irg_t *env  = xmalloc(sizeof(env[0]));
1345         ir_node *old_frame = get_irg_frame(birg->irg);
1346         ir_graph *irg      = birg->irg;
1347
1348         pmap_entry *ent;
1349         ir_node *dummy;
1350
1351         env->isa           = birg->main_env->arch_env->isa;
1352         env->method_type   = get_entity_type(get_irg_entity(irg));
1353         env->call          = be_abi_call_new();
1354         arch_isa_get_call_abi(env->isa, env->method_type, env->call);
1355
1356         env->dce_survivor     = new_survive_dce();
1357         env->birg             = birg;
1358         env->dbg              = firm_dbg_register("firm.be.abi");
1359         env->stack_phis       = pset_new_ptr(16);
1360         env->init_sp = dummy  = new_r_Unknown(irg, env->isa->sp->reg_class->mode);
1361
1362         env->cb = env->call->cb->init(env->call, birg->main_env->arch_env, irg);
1363
1364         obstack_init(&env->obst);
1365
1366         memcpy(&env->irn_handler, &abi_irn_handler, sizeof(abi_irn_handler));
1367         env->irn_ops.impl = &abi_irn_ops;
1368
1369         /* Lower all call nodes in the IRG. */
1370         process_calls(env);
1371
1372         /* Process the IRG */
1373         modify_irg(env);
1374
1375         /* reroute the stack origin of the calls to the true stack origin. */
1376         edges_reroute(dummy, env->init_sp, irg);
1377         edges_reroute(old_frame, get_irg_frame(irg), irg);
1378
1379         /* Make some important node pointers survive the dead node elimination. */
1380         survive_dce_register_irn(env->dce_survivor, &env->init_sp);
1381         pmap_foreach(env->regs, ent)
1382                 survive_dce_register_irn(env->dce_survivor, (ir_node **) &ent->value);
1383
1384         arch_env_push_irn_handler(env->birg->main_env->arch_env, &env->irn_handler);
1385
1386         env->call->cb->done(env->cb);
1387         be_liveness(irg);
1388         return env;
1389 }
1390
1391 void be_abi_free(be_abi_irg_t *env)
1392 {
1393         free_survive_dce(env->dce_survivor);
1394         del_pset(env->stack_phis);
1395         pmap_destroy(env->regs);
1396         obstack_free(&env->obst, NULL);
1397         arch_env_pop_irn_handler(env->birg->main_env->arch_env);
1398         free(env);
1399 }
1400
1401
1402 /*
1403
1404   _____ _        ____  _             _
1405  |  ___(_)_  __ / ___|| |_ __ _  ___| | __
1406  | |_  | \ \/ / \___ \| __/ _` |/ __| |/ /
1407  |  _| | |>  <   ___) | || (_| | (__|   <
1408  |_|   |_/_/\_\ |____/ \__\__,_|\___|_|\_\
1409
1410 */
1411
1412 static void collect_stack_nodes_walker(ir_node *irn, void *data)
1413 {
1414         pset *s = data;
1415
1416         if(be_is_AddSP(irn)     || be_is_IncSP(irn)     || be_is_SetSP(irn))
1417                 pset_insert_ptr(s, irn);
1418 }
1419
1420 void be_abi_fix_stack_nodes(be_abi_irg_t *env)
1421 {
1422         dom_front_info_t *df;
1423         pset *stack_nodes;
1424
1425         /* We need dominance frontiers for fix up */
1426         df = be_compute_dominance_frontiers(env->birg->irg);
1427         stack_nodes = pset_new_ptr(16);
1428         pset_insert_ptr(stack_nodes, env->init_sp);
1429         irg_walk_graph(env->birg->irg, collect_stack_nodes_walker, NULL, stack_nodes);
1430         be_ssa_constr_set_phis(df, stack_nodes, env->stack_phis);
1431         del_pset(stack_nodes);
1432
1433         /* Liveness could have changed due to Phi nodes. */
1434         be_liveness(env->birg->irg);
1435
1436         /* free these dominance frontiers */
1437         be_free_dominance_frontiers(df);
1438 }
1439
1440 /**
1441  * Translates a direction of an IncSP node (either be_stack_dir_against, or ...along)
1442  * into -1 or 1, respectively.
1443  * @param irn The node.
1444  * @return 1, if the direction of the IncSP was along, -1 if against.
1445  */
1446 static int get_dir(ir_node *irn)
1447 {
1448         return 1 - 2 * (be_get_IncSP_direction(irn) == be_stack_dir_against);
1449 }
1450
1451 static int process_stack_bias(be_abi_irg_t *env, ir_node *bl, int bias)
1452 {
1453         const arch_env_t *aenv = env->birg->main_env->arch_env;
1454         ir_node *irn;
1455         int start_bias = bias;
1456         int omit_fp    = env->call->flags.bits.try_omit_fp;
1457
1458         sched_foreach(bl, irn) {
1459
1460                 /*
1461                         If the node modifies the stack pointer by a constant offset,
1462                         record that in the bias.
1463                 */
1464                 if(be_is_IncSP(irn)) {
1465                         int ofs = be_get_IncSP_offset(irn);
1466                         int dir = get_dir(irn);
1467
1468                         if(ofs == BE_STACK_FRAME_SIZE) {
1469                                 ofs = get_type_size_bytes(get_irg_frame_type(env->birg->irg));
1470                                 be_set_IncSP_offset(irn, ofs);
1471                         }
1472
1473                         if(omit_fp)
1474                                 bias += dir * ofs;
1475                 }
1476
1477                 /*
1478                         Else check, if the node relates to an entity on the stack frame.
1479                         If so, set the true offset (including the bias) for that
1480                         node.
1481                 */
1482                 else {
1483                         entity *ent = arch_get_frame_entity(aenv, irn);
1484                         if(ent) {
1485                                 int offset = get_stack_entity_offset(env->frame, ent, bias);
1486                                 arch_set_frame_offset(aenv, irn, offset);
1487                                 DBG((env->dbg, LEVEL_2, "%F has offset %d\n", ent, offset));
1488                         }
1489                 }
1490         }
1491
1492         return bias;
1493 }
1494
1495 /**
1496  * A helper struct for the bias walker.
1497  */
1498 struct bias_walk {
1499         be_abi_irg_t *env;     /**< The ABI irg environment. */
1500         int start_block_bias;  /**< The bias at the end of the start block. */
1501 };
1502
1503 static void stack_bias_walker(ir_node *bl, void *data)
1504 {
1505         if(bl != get_irg_start_block(get_irn_irg(bl))) {
1506                 struct bias_walk *bw = data;
1507                 process_stack_bias(bw->env, bl, bw->start_block_bias);
1508         }
1509 }
1510
1511 void be_abi_fix_stack_bias(be_abi_irg_t *env)
1512 {
1513         ir_graph *irg  = env->birg->irg;
1514         struct bias_walk bw;
1515
1516         stack_frame_compute_initial_offset(env->frame);
1517         // stack_frame_dump(stdout, env->frame);
1518
1519         /* Determine the stack bias at the and of the start block. */
1520         bw.start_block_bias = process_stack_bias(env, get_irg_start_block(irg), 0);
1521
1522         /* fix the bias is all other blocks */
1523         bw.env = env;
1524         irg_block_walk_graph(irg, stack_bias_walker, NULL, &bw);
1525 }
1526
1527 ir_node *be_abi_get_callee_save_irn(be_abi_irg_t *abi, const arch_register_t *reg)
1528 {
1529         assert(arch_register_type_is(reg, callee_save));
1530         assert(pmap_contains(abi->regs, (void *) reg));
1531         return pmap_get(abi->regs, (void *) reg);
1532 }
1533
1534 /*
1535   _____ _____  _   _   _    _                 _ _
1536  |_   _|  __ \| \ | | | |  | |               | | |
1537    | | | |__) |  \| | | |__| | __ _ _ __   __| | | ___ _ __
1538    | | |  _  /| . ` | |  __  |/ _` | '_ \ / _` | |/ _ \ '__|
1539   _| |_| | \ \| |\  | | |  | | (_| | | | | (_| | |  __/ |
1540  |_____|_|  \_\_| \_| |_|  |_|\__,_|_| |_|\__,_|_|\___|_|
1541
1542   for Phi nodes which are created due to stack modifying nodes
1543   such as IncSP, AddSP and SetSP.
1544
1545   These Phis are always to be ignored by the reg alloc and are
1546   fixed on the SP register of the ISA.
1547 */
1548
1549 static const void *abi_get_irn_ops(const arch_irn_handler_t *handler, const ir_node *irn)
1550 {
1551         const be_abi_irg_t *abi = get_abi_from_handler(handler);
1552         const void *res = NULL;
1553
1554         if(is_Phi(irn) && pset_find_ptr(abi->stack_phis, (void *) irn))
1555                 res = &abi->irn_ops;
1556
1557         return res;
1558 }
1559
1560 static void be_abi_limited(void *data, bitset_t *bs)
1561 {
1562         be_abi_irg_t *abi = data;
1563         bitset_clear_all(bs);
1564         bitset_set(bs, abi->isa->sp->index);
1565 }
1566
1567 static const arch_register_req_t *abi_get_irn_reg_req(const void *self, arch_register_req_t *req, const ir_node *irn, int pos)
1568 {
1569         be_abi_irg_t *abi          = get_abi_from_ops(self);
1570         const arch_register_t *reg = abi->isa->sp;
1571
1572         memset(req, 0, sizeof(req[0]));
1573
1574         if(pos == BE_OUT_POS(0)) {
1575                 req->cls         = reg->reg_class;
1576                 req->type        = arch_register_req_type_limited;
1577                 req->limited     = be_abi_limited;
1578                 req->limited_env = abi;
1579         }
1580
1581         else if(pos >= 0 && pos < get_irn_arity(irn)) {
1582                 req->cls  = reg->reg_class;
1583                 req->type = arch_register_req_type_normal;
1584         }
1585
1586         return req;
1587 }
1588
1589 static void abi_set_irn_reg(const void *self, ir_node *irn, const arch_register_t *reg)
1590 {
1591 }
1592
1593 static const arch_register_t *abi_get_irn_reg(const void *self, const ir_node *irn)
1594 {
1595         const be_abi_irg_t *abi = get_abi_from_ops(self);
1596         return abi->isa->sp;
1597 }
1598
1599 static arch_irn_class_t abi_classify(const void *_self, const ir_node *irn)
1600 {
1601         return arch_irn_class_normal;
1602 }
1603
1604 static arch_irn_flags_t abi_get_flags(const void *_self, const ir_node *irn)
1605 {
1606         return arch_irn_flags_ignore;
1607 }
1608
1609 static entity *abi_get_frame_entity(const void *_self, const ir_node *irn)
1610 {
1611         return NULL;
1612 }
1613
1614 static void abi_set_stack_bias(const void *_self, ir_node *irn, int bias)
1615 {
1616 }
1617
1618 static const arch_irn_ops_if_t abi_irn_ops = {
1619         abi_get_irn_reg_req,
1620         abi_set_irn_reg,
1621         abi_get_irn_reg,
1622         abi_classify,
1623         abi_get_flags,
1624         abi_get_frame_entity,
1625         abi_set_stack_bias
1626 };
1627
1628 static const arch_irn_handler_t abi_irn_handler = {
1629         abi_get_irn_ops
1630 };