22b4028d422f0ee73dcd39a8adbfbbd857857857
[libfirm] / ir / be / bespill.c
1 /**
2  * Author:      Daniel Grund, Sebastian Hack
3  * Date:                29.09.2005
4  * Copyright:   (c) Universitaet Karlsruhe
5  * Licence:     This file protected by GPL -  GNU GENERAL PUBLIC LICENSE.
6  */
7 #ifdef HAVE_CONFIG_H
8 #include "config.h"
9 #endif
10
11 #include <stdlib.h>
12
13 #include "pset.h"
14 #include "irnode_t.h"
15 #include "ircons_t.h"
16 #include "iredges_t.h"
17 #include "ident_t.h"
18 #include "type_t.h"
19 #include "entity_t.h"
20 #include "debug.h"
21 #include "irgwalk.h"
22 #include "array.h"
23
24 #include "belive_t.h"
25 #include "besched_t.h"
26 #include "bespill.h"
27 #include "benode_t.h"
28 #include "bechordal_t.h"
29
30 #undef REMAT
31 /* This enables re-computation of values. Current state: Unfinished and buggy. */
32 #undef BUGGY_REMAT
33
34 typedef struct _reloader_t reloader_t;
35 typedef struct _spill_info_t spill_info_t;
36
37 struct _reloader_t {
38         reloader_t *next;
39         ir_node *reloader;
40 };
41
42 struct _spill_info_t {
43         ir_node *spilled_node;
44         reloader_t *reloaders;
45 };
46
47 typedef struct _spill_ctx_t {
48         ir_node *spilled;  /**< The spilled node. */
49         ir_node *user;     /**< The node this spill is for. */
50         ir_node *spill;    /**< The spill itself. */
51 } spill_ctx_t;
52
53 struct _spill_env_t {
54         const arch_register_class_t *cls;
55         const be_chordal_env_t *chordal_env;
56         struct obstack obst;
57         set *spill_ctxs;
58         set *spills;                            /**< all spill_info_t's, which must be placed */
59         pset *mem_phis;                         /**< set of all special spilled phis. allocated and freed separately */
60         decide_irn_t is_mem_phi;        /**< callback func to decide if a phi needs special spilling */
61         void *data;                                     /**< data passed to all callbacks */
62         DEBUG_ONLY(firm_dbg_module_t *dbg;)
63 };
64
65 static int cmp_spillctx(const void *a, const void *b, size_t n) {
66         const spill_ctx_t *p = a;
67         const spill_ctx_t *q = b;
68         return !(p->user == q->user && p->spilled == q->spilled);
69 }
70
71 static int cmp_spillinfo(const void *x, const void *y, size_t size) {
72         const spill_info_t *xx = x;
73         const spill_info_t *yy = y;
74         return ! (xx->spilled_node == yy->spilled_node);
75 }
76
77 spill_env_t *be_new_spill_env(const be_chordal_env_t *chordal_env, decide_irn_t is_mem_phi, void *data) {
78         spill_env_t *env = xmalloc(sizeof(env[0]));
79         env->spill_ctxs  = new_set(cmp_spillctx, 1024);
80         env->spills      = new_set(cmp_spillinfo, 1024);
81         env->cls         = chordal_env->cls;
82         env->is_mem_phi  = is_mem_phi;
83         env->data        = data;
84         env->chordal_env = chordal_env;
85         obstack_init(&env->obst);
86         return env;
87 }
88
89 void be_delete_spill_env(spill_env_t *senv) {
90         del_set(senv->spill_ctxs);
91         del_set(senv->spills);
92         obstack_free(&senv->obst, NULL);
93         free(senv);
94 }
95
96 static spill_ctx_t *be_get_spill_ctx(set *sc, ir_node *to_spill, ir_node *ctx_irn) {
97         spill_ctx_t templ;
98
99         templ.spilled = to_spill;
100         templ.user    = ctx_irn;
101         templ.spill   = NULL;
102
103         return set_insert(sc, &templ, sizeof(templ), HASH_COMBINE(HASH_PTR(to_spill), HASH_PTR(ctx_irn)));
104 }
105
106 static ir_node *be_spill_irn(spill_env_t *senv, ir_node *irn, ir_node *ctx_irn) {
107         spill_ctx_t *ctx;
108         DBG((senv->dbg, LEVEL_1, "%+F in ctx %+F\n", irn, ctx_irn));
109
110         ctx = be_get_spill_ctx(senv->spill_ctxs, irn, ctx_irn);
111         if(!ctx->spill) {
112                 const be_main_env_t *env = senv->chordal_env->birg->main_env;
113                 ctx->spill = be_spill(env->arch_env, irn, ctx_irn);
114         }
115
116         return ctx->spill;
117 }
118
119 /**
120  * If the first usage of a phi result would be out of memory
121  * there is no sense in allocating a register for it.
122  * Thus we spill it and all its operands to the same spill slot.
123  * Therefore the phi/dataB becomes a phi/Memory
124  */
125 static ir_node *be_spill_phi(spill_env_t *senv, ir_node *phi, ir_node *ctx_irn) {
126         int i, n = get_irn_arity(phi);
127         ir_node **ins, *bl = get_nodes_block(phi);
128         ir_graph *irg = senv->chordal_env->irg;
129         spill_ctx_t *ctx;
130
131         assert(is_Phi(phi));
132         DBG((senv->dbg, LEVEL_1, "%+F in ctx %+F\n", phi, ctx_irn));
133
134         /* search an existing spill for this context */
135         ctx = be_get_spill_ctx(senv->spill_ctxs, phi, ctx_irn);
136
137         /* if not found spill the phi */
138         if(!ctx->spill) {
139                 /* build a new PhiM with dummy in-array */
140     NEW_ARR_A(ir_node *, ins, n);
141                 for(i=0; i<n; ++i)
142                         ins[i] = new_r_Unknown(irg, mode_M);
143                 ctx->spill = new_r_Phi(senv->chordal_env->irg, bl, n, ins, mode_M);
144
145                 /* re-wire the phiM */
146                 for(i=0; i<n; ++i) {
147                         ir_node *arg = get_irn_n(phi, i);
148                         ir_node *sub_res;
149
150                         if(is_Phi(arg) && pset_find_ptr(senv->mem_phis, arg))
151                                 sub_res = be_spill_phi(senv, arg, ctx_irn);
152                         else
153                                 sub_res = be_spill_irn(senv, arg, ctx_irn);
154
155                         set_irn_n(ctx->spill, i, sub_res);
156                 }
157         }
158         return ctx->spill;
159 }
160
161 static ir_node *be_spill_node(spill_env_t *senv, ir_node *to_spill) {
162         ir_node *res;
163         if (pset_find_ptr(senv->mem_phis, to_spill))
164                 res = be_spill_phi(senv, to_spill, to_spill);
165         else
166                 res = be_spill_irn(senv, to_spill, to_spill);
167
168         return res;
169 }
170
171 static void phi_walker(ir_node *irn, void *env) {
172         spill_env_t *senv = env;
173         const arch_env_t *arch = senv->chordal_env->birg->main_env->arch_env;
174
175         if (is_Phi(irn) && arch_irn_has_reg_class(arch, irn, 0, senv->cls)
176                         && senv->is_mem_phi(irn, senv->data)) {
177                 DBG((senv->dbg, LEVEL_1, "  %+F\n", irn));
178                 pset_insert_ptr(senv->mem_phis, irn);
179         }
180 }
181
182 #ifdef REMAT
183
184 #ifdef BUGGY_REMAT
185
186 static int check_remat_conditions(spill_env_t *senv, ir_node *spill, ir_node *spilled, ir_node *reloader) {
187         int pos, max;
188
189         /* check for 'normal' spill and general remat condition */
190         if (!be_is_Spill(spill) || !arch_irn_is(senv->chordal_env->birg->main_env->arch_env, spilled, rematerializable))
191                 return 0;
192
193         /* check availability of original arguments */
194         if (is_Block(reloader)) {
195
196                 /* we want to remat at the end of a block.
197                  * thus all arguments must be alive at the end of the block
198                  */
199                 for (pos=0, max=get_irn_arity(spilled); pos<max; ++pos) {
200                         ir_node *arg = get_irn_n(spilled, pos);
201                         if (!is_live_end(reloader, arg))
202                                 return 0;
203                 }
204
205         } else {
206
207                 /* we want to remat before the insn reloader
208                  * thus an arguments is alive if
209                  *   - it interferes with the reloaders result
210                  * or
211                  *   - or it is (last-) used by reloader itself
212                  */
213                 for (pos=0, max=get_irn_arity(spilled); pos<max; ++pos) {
214                         ir_node *arg = get_irn_n(spilled, pos);
215                         int i, m;
216
217                         if (values_interfere(reloader, arg))
218                                 goto is_alive;
219
220                         for (i=0, m=get_irn_arity(reloader); i<m; ++i) {
221                                 ir_node *rel_arg = get_irn_n(reloader, i);
222                                 if (rel_arg == arg)
223                                         goto is_alive;
224                         }
225
226                         /* arg is not alive before reloader */
227                         return 0;
228
229 is_alive:       ;
230
231                 }
232
233         }
234
235         return 1;
236 }
237
238 #else /* BUGGY_REMAT */
239
240 static int check_remat_conditions(spill_env_t *senv, ir_node *spill, ir_node *spilled, ir_node *reloader) {
241         const arch_env_t *aenv = senv->chordal_env->birg->main_env->arch_env;
242
243         return get_irn_arity(spilled) == 0 &&
244                    be_is_Spill(spill) &&
245                    arch_irn_is(aenv, spilled, rematerializable);
246 }
247
248 #endif /* BUGGY_REMAT */
249
250 static ir_node *do_remat(spill_env_t *senv, ir_node *spilled, ir_node *reloader) {
251         ir_node *res;
252         ir_node *bl = (is_Block(reloader)) ? reloader : get_nodes_block(reloader);
253
254         /* recompute the value */
255         res = new_ir_node(get_irn_dbg_info(spilled), senv->chordal_env->irg, bl,
256                 get_irn_op(spilled),
257                 get_irn_mode(spilled),
258                 get_irn_arity(spilled),
259                 get_irn_in(spilled));
260         copy_node_attr(spilled, res);
261
262         DBG((senv->dbg, LEVEL_1, "Insert remat %+F before reloader %+F\n", res, reloader));
263
264         /* insert in schedule */
265         if (is_Block(reloader)) {
266                 ir_node *insert = sched_skip(reloader, 0, sched_skip_cf_predicator, (void *) senv->chordal_env->birg->main_env->arch_env);
267                 sched_add_after(insert, res);
268         } else {
269                 sched_add_before(reloader, res);
270         }
271
272         return res;
273 }
274
275 #endif
276
277 void be_insert_spills_reloads(spill_env_t *senv, pset *reload_set) {
278         const arch_env_t *aenv = senv->chordal_env->birg->main_env->arch_env;
279         ir_graph *irg          = senv->chordal_env->irg;
280         ir_node *irn;
281         spill_info_t *si;
282
283         /* get all special spilled phis */
284         DBG((senv->dbg, LEVEL_1, "Mem-phis:\n"));
285         senv->mem_phis = pset_new_ptr_default();
286         irg_walk_graph(senv->chordal_env->irg, phi_walker, NULL, senv);
287
288         /* Add reloads for mem_phis */
289         /* BETTER: These reloads (1) should only be inserted, if they are really needed */
290         DBG((senv->dbg, LEVEL_1, "Reloads for mem-phis:\n"));
291         for(irn = pset_first(senv->mem_phis); irn; irn = pset_next(senv->mem_phis)) {
292                 const ir_edge_t *e;
293                 DBG((senv->dbg, LEVEL_1, " Mem-phi %+F\n", irn));
294                 foreach_out_edge(irn, e) {
295                         ir_node *user = e->src;
296                         if (is_Phi(user) && !pset_find_ptr(senv->mem_phis, user)) {
297                                         ir_node *use_bl = get_nodes_block(user);
298                                         DBG((senv->dbg, LEVEL_1, " non-mem-phi user %+F\n", user));
299                                         be_add_reload_on_edge(senv, irn, use_bl, e->pos); /* (1) */
300                         }
301                 }
302         }
303
304         /* process each spilled node */
305         DBG((senv->dbg, LEVEL_1, "Insert spills and reloads:\n"));
306         for(si = set_first(senv->spills); si; si = set_next(senv->spills)) {
307                 reloader_t *rld;
308                 ir_mode *mode = get_irn_mode(si->spilled_node);
309                 pset *values = pset_new_ptr(16);
310
311                 /* go through all reloads for this spill */
312                 for(rld = si->reloaders; rld; rld = rld->next) {
313                         ir_node *new_val;
314
315                         /* the spill for this reloader */
316                         ir_node *spill   = be_spill_node(senv, si->spilled_node);
317
318 #ifdef REMAT
319                         if (check_remat_conditions(senv, spill, si->spilled_node, rld->reloader))
320                                 new_val = do_remat(senv, si->spilled_node, rld->reloader);
321                         else
322 #endif
323                                 /* do a reload */
324                                 new_val = be_reload(aenv, senv->cls, rld->reloader, mode, spill);
325
326                         DBG((senv->dbg, LEVEL_1, " %+F of %+F before %+F\n", new_val, si->spilled_node, rld->reloader));
327                         pset_insert_ptr(values, new_val);
328                         if(reload_set)
329                                 pset_insert_ptr(reload_set, new_val);
330                 }
331
332                 /* introduce copies, rewire the uses */
333                 assert(pset_count(values) > 0 && "???");
334                 pset_insert_ptr(values, si->spilled_node);
335                 be_ssa_constr_set_ignore(senv->chordal_env->dom_front, values, senv->mem_phis);
336
337                 del_pset(values);
338         }
339
340         for(irn = pset_first(senv->mem_phis); irn; irn = pset_next(senv->mem_phis)) {
341                 int i, n;
342                 for(i = 0, n = get_irn_arity(irn); i < n; ++i)
343                         set_irn_n(irn, i, new_r_Bad(senv->chordal_env->irg));
344                 sched_remove(irn);
345         }
346
347         del_pset(senv->mem_phis);
348 }
349
350 void be_add_reload(spill_env_t *senv, ir_node *to_spill, ir_node *before) {
351         spill_info_t templ, *res;
352         reloader_t *rel;
353
354         templ.spilled_node = to_spill;
355         templ.reloaders    = NULL;
356         res = set_insert(senv->spills, &templ, sizeof(templ), HASH_PTR(to_spill));
357
358         rel           = obstack_alloc(&senv->obst, sizeof(rel[0]));
359         rel->reloader = before;
360         rel->next     = res->reloaders;
361         res->reloaders = rel;
362 }
363
364 void be_add_reload_on_edge(spill_env_t *senv, ir_node *to_spill, ir_node *bl, int pos) {
365         ir_node *insert_bl = get_irn_arity(bl) == 1 ? sched_first(bl) : get_Block_cfgpred_block(bl, pos);
366         be_add_reload(senv, to_spill, insert_bl);
367 }
368
369
370
371 /****************************************
372
373         SPILL SLOT MANAGEMENT AND OPTS
374
375 ****************************************/
376
377 typedef struct _spill_slot_t {
378         unsigned size;
379         unsigned align;
380         pset *members;
381         ir_mode *largest_mode;  /* the mode of all members with largest size */
382 } spill_slot_t;
383
384 typedef struct _ss_env_t {
385         struct obstack ob;
386         be_chordal_env_t *cenv;
387         pmap *slots;            /* maps spill_contexts to spill_slots */
388         pmap *types;    /* maps modes to types */
389         DEBUG_ONLY(firm_dbg_module_t *dbg;)
390 } ss_env_t;
391
392 /**
393  * Walker: compute the spill slots
394  */
395 static void compute_spill_slots_walker(ir_node *spill, void *env) {
396         ss_env_t *ssenv = env;
397         ir_node *ctx;
398         pmap_entry *entry;
399         spill_slot_t *ss;
400
401         if (!be_is_Spill(spill))
402                 return;
403
404         /* check, if this spill is for a context already known */
405         ctx = be_get_Spill_context(spill);
406         entry = pmap_find(ssenv->slots, ctx);
407
408         if (!entry) {
409                 struct _arch_env_t *arch_env     = ssenv->cenv->birg->main_env->arch_env;
410                 ir_node *spilled                 = get_irn_n(spill, be_pos_Spill_val);
411                 const arch_register_t *reg       = arch_get_irn_register(arch_env, spilled);
412                 const arch_register_class_t *cls = arch_register_get_class(reg);
413                 ir_mode *largest_mode            = arch_register_class_mode(cls);
414
415                 /* this is a new spill context */
416                 ss = obstack_alloc(&ssenv->ob, sizeof(*ss));
417                 ss->members      = pset_new_ptr(8);
418                 ss->largest_mode = largest_mode;
419                 ss->size         = get_mode_size_bytes(ss->largest_mode);
420                 ss->align        = arch_isa_get_reg_class_alignment(arch_env->isa, cls);
421                 pmap_insert(ssenv->slots, ctx, ss);
422         } else {
423                 ir_node *irn;
424                 /* values with the same spill_ctx must go into the same spill slot */
425                 ss = entry->value;
426                 assert(ss->size == (unsigned)get_mode_size_bytes(get_irn_mode(get_irn_n(spill, be_pos_Spill_val))) && "Different sizes for the same spill slot are not allowed yet.");
427                 for (irn = pset_first(ss->members); irn; irn = pset_next(ss->members)) {
428                         /* use values_interfere here, because it uses the dominance check,
429                            which does work for values in memory */
430                         assert(!values_interfere(spill, irn) && "Spills for the same spill slot must not interfere!");
431                 }
432         }
433
434         pset_insert_ptr(ss->members, spill);
435 }
436
437 static int ss_sorter(const void *v1, const void *v2) {
438         const spill_slot_t *ss1 = v1;
439         const spill_slot_t *ss2 = v2;
440         return ((int) ss2->size) - ((int) ss1->size);
441 }
442
443
444 /**
445  * This function should optimize the spill slots.
446  *  - Coalescing of multiple slots
447  *  - Ordering the slots
448  *
449  * Input slots are in @p ssenv->slots
450  * @p size The count of initial spill slots in @p ssenv->slots
451  *         This also is the size of the preallocated array @p ass
452  *
453  * @return An array of spill slots @p ass in specific order
454  **/
455 static void optimize_slots(ss_env_t *ssenv, int size, spill_slot_t **ass) {
456         int i, o, used_slots;
457         pmap_entry *entr;
458
459         i=0;
460         pmap_foreach(ssenv->slots, entr)
461                 ass[i++] = entr->value;
462
463         /* Sort the array to minimize fragmentation and cache footprint.
464            Large slots come first */
465         qsort(ass, size, sizeof(ass[0]), ss_sorter);
466
467         /* For each spill slot:
468                 - assign a new offset to this slot
469             - xor find another slot to coalesce with */
470         used_slots = 0;
471         for (i=0; i<size; ++i) { /* for each spill slot */
472                 ir_node *n1;
473                 int tgt_slot = -1;
474
475                 DBG((ssenv->dbg, LEVEL_1, "Spill slot %d members:\n", i));
476                 for(n1 = pset_first(ass[i]->members); n1; n1 = pset_next(ass[i]->members))
477                         DBG((ssenv->dbg, LEVEL_1, "  %+F\n", n1));
478
479
480                 for (o=0; o < used_slots && tgt_slot == -1; ++o) { /* for each offset-assigned spill slot */
481                         /* check inter-slot-pairs for interference */
482                         ir_node *n2;
483                         for(n1 = pset_first(ass[i]->members); n1; n1 = pset_next(ass[i]->members))
484                                 for(n2 = pset_first(ass[o]->members); n2; n2 = pset_next(ass[o]->members))
485                                         if(values_interfere(n1, n2)) {
486                                                 pset_break(ass[i]->members);
487                                                 pset_break(ass[o]->members);
488                                                 DBG((ssenv->dbg, LEVEL_1, "    Interf %+F -- %+F\n", n1, n2));
489                                                 goto interf_detected;
490                                         }
491
492                         /* if we are here, there is no interference between ass[i] and ass[o] */
493                         tgt_slot = o;
494
495 interf_detected: /*nothing*/ ;
496                 }
497
498                 /* now the members of ass[i] join the members of ass[tgt_slot] */
499
500                 /* do we need a new slot? */
501                 if (tgt_slot == -1) {
502                         tgt_slot = used_slots;
503                         used_slots++;
504
505                         /* init slot */
506                         if (tgt_slot != i) {
507                                 ass[tgt_slot]->size = ass[i]->size;
508                                 del_pset(ass[tgt_slot]->members);
509                                 ass[tgt_slot]->members = pset_new_ptr(8);
510                         }
511                 }
512
513                 /* copy the members to the target pset */
514                 /* NOTE: If src and tgt pset are the same, inserting while iterating is not allowed */
515                 if (tgt_slot != i)
516                         for(n1 = pset_first(ass[i]->members); n1; n1 = pset_next(ass[i]->members))
517                                         pset_insert_ptr(ass[tgt_slot]->members, n1);
518         }
519 }
520
521 #define ALIGN_SPILL_AREA 16
522 #define pset_foreach(pset, elm)  for(elm=pset_first(pset); elm; elm=pset_next(pset))
523
524 /**
525  * Returns a spill type for a mode. Keep them in a map to reduce
526  * the number of types.
527  */
528 static ir_type *get_spill_type(pmap *types, ir_mode *mode) {
529   pmap_entry *e = pmap_find(types, mode);
530   ir_type *res;
531
532   if (! e) {
533                 char buf[64];
534     snprintf(buf, sizeof(buf), "spill_slot_type_%s", get_mode_name(mode));
535     res = new_type_primitive(new_id_from_str(buf), mode);
536     pmap_insert(types, mode, res);
537   }
538   else
539     res = e->value;
540   return res;
541 }
542
543 static void assign_entities(ss_env_t *ssenv, int n, spill_slot_t **ss) {
544         int i, offset;
545         ir_type *frame = get_irg_frame_type(ssenv->cenv->irg);
546
547         /* aligning by increasing frame size */
548         offset = get_type_size_bits(frame) / 8;
549         offset = round_up2(offset, ALIGN_SPILL_AREA);
550         set_type_size_bytes(frame, -1);
551
552         /* create entities and assign offsets according to size and alignment*/
553         for (i=0; i<n; ++i) {
554                 char buf[64];
555                 ident *name;
556                 entity *spill_ent;
557                 ir_node *irn;
558
559                 /* build entity */
560                 snprintf(buf, sizeof(buf), "spill_slot_%d", i);
561                 name = new_id_from_str(buf);
562
563                 spill_ent = new_entity(frame, name, get_spill_type(ssenv->types, ss[i]->largest_mode));
564
565                 /* align */
566                 offset = round_up2(offset, ss[i]->align);
567                 /* set */
568                 set_entity_offset_bytes(spill_ent, offset);
569                 /* next possible offset */
570                 offset += ss[i]->size;
571
572                 pset_foreach(ss[i]->members, irn)
573                         be_set_Spill_entity(irn, spill_ent);
574         }
575
576         /* set final size of stack frame */
577         set_type_size_bytes(frame, offset);
578 }
579
580 void be_compute_spill_offsets(be_chordal_env_t *cenv) {
581         ss_env_t ssenv;
582         spill_slot_t **ss;
583         int ss_size;
584         pmap_entry *pme;
585
586         obstack_init(&ssenv.ob);
587         ssenv.cenv  = cenv;
588         ssenv.slots = pmap_create();
589         ssenv.types = pmap_create();
590         FIRM_DBG_REGISTER(ssenv.dbg, "ir.be.spillslots");
591
592         /* Get initial spill slots */
593         irg_walk_graph(cenv->irg, NULL, compute_spill_slots_walker, &ssenv);
594
595         /* Build an empty array for optimized spill slots */
596         ss_size = pmap_count(ssenv.slots);
597         ss = obstack_alloc(&ssenv.ob, ss_size * sizeof(*ss));
598         optimize_slots(&ssenv, ss_size, ss);
599
600         /* Integrate slots into the stack frame entity */
601         assign_entities(&ssenv, ss_size, ss);
602
603         /* Clean up */
604         pmap_foreach(ssenv.slots, pme)
605         del_pset(((spill_slot_t *)pme->value)->members);
606         pmap_destroy(ssenv.slots);
607         pmap_destroy(ssenv.types);
608         obstack_free(&ssenv.ob, NULL);
609
610         be_copy_entities_to_reloads(cenv->irg);
611 }