remove more barrier handling code
[libfirm] / ir / be / beabihelper.c
1 /*
2  * Copyright (C) 1995-2008 University of Karlsruhe.  All right reserved.
3  *
4  * This file is part of libFirm.
5  *
6  * This file may be distributed and/or modified under the terms of the
7  * GNU General Public License version 2 as published by the Free Software
8  * Foundation and appearing in the file LICENSE.GPL included in the
9  * packaging of this file.
10  *
11  * Licensees holding valid libFirm Professional Edition licenses may use
12  * this file in accordance with the libFirm Commercial License.
13  * Agreement provided with the Software.
14  *
15  * This file is provided AS IS with NO WARRANTY OF ANY KIND, INCLUDING THE
16  * WARRANTY OF DESIGN, MERCHANTABILITY AND FITNESS FOR A PARTICULAR
17  * PURPOSE.
18  */
19
20 /**
21  * @file
22  * @brief       Helper functions for handling ABI constraints in the code
23  *              selection phase.
24  * @author      Matthias Braun
25  * @version     $Id$
26  */
27 #include "config.h"
28
29 #include "beabihelper.h"
30 #include "bearch.h"
31 #include "benode.h"
32 #include "besched.h"
33 #include "ircons.h"
34 #include "iredges.h"
35 #include "irgwalk.h"
36 #include "irphase_t.h"
37 #include "heights.h"
38
39 /**
40  * An entry in the register state map.
41  */
42 typedef struct reg_flag_t {
43         const arch_register_t *reg;     /**< register at an input position.
44                                              may be NULL in case of memory input */
45         arch_register_req_type_t flags; /**< requirement flags for this register. */
46 } reg_flag_t;
47
48 /**
49  * A register state mapping keeps track of the symbol values (=firm nodes)
50  * to registers. This is useful when constructing straight line code
51  * like the function prolog or epilog in some architectures.
52  */
53 typedef struct register_state_mapping_t {
54         ir_node   **value_map;     /**< mapping of state indices to values */
55         size_t    **reg_index_map; /**< mapping of regclass,regnum to an index
56                                         into the value_map */
57         reg_flag_t *regs;          /**< registers (and memory values) that form a
58                                         state */
59 } register_state_mapping_t;
60
61 /**
62  * The environment for all helper functions.
63  */
64 struct beabi_helper_env_t {
65         ir_graph                 *irg;         /**< the graph we operate on */
66         register_state_mapping_t  prolog;      /**< the register state map for the prolog */
67         register_state_mapping_t  epilog;      /**< the register state map for the epilog */
68         ir_phase                 *stack_order; /**< a phase to handle stack dependencies. */
69 };
70
71 /**
72  * Create a new empty register state map for the given
73  * architecture.
74  *
75  * @param rsm       the register state map to be initialized
76  * @param arch_env  the architecture environment
77  *
78  * After this call, the register map is initialized to empty.
79  */
80 static void prepare_rsm(register_state_mapping_t *rsm,
81                         const arch_env_t *arch_env)
82 {
83         unsigned   n_reg_classes = arch_env->n_register_classes;
84         unsigned   c;
85         reg_flag_t memory = { NULL, arch_register_req_type_none };
86
87         rsm->regs = NEW_ARR_F(reg_flag_t, 0);
88         /* memory input at 0 */
89         ARR_APP1(reg_flag_t, rsm->regs, memory);
90
91         rsm->value_map     = NULL;
92         rsm->reg_index_map = XMALLOCN(size_t*, n_reg_classes);
93         for (c = 0; c < n_reg_classes; ++c) {
94                 const arch_register_class_t *cls    = &arch_env->register_classes[c];
95                 unsigned                     n_regs = arch_register_class_n_regs(cls);
96                 unsigned                     r;
97
98                 rsm->reg_index_map[c] = XMALLOCN(size_t, n_regs);
99                 for (r = 0; r < n_regs; ++r) {
100                         rsm->reg_index_map[c][r] = (size_t)-1;
101                 }
102         }
103 }
104
105 /**
106  * Destroy a register state map for the given
107  * architecture.
108  *
109  * @param rsm       the register state map to be destroyed
110  * @param arch_env  the architecture environment
111  *
112  * After this call, the register map is initialized to empty.
113  */
114 static void free_rsm(register_state_mapping_t *rsm, const arch_env_t *arch_env)
115 {
116         unsigned n_reg_classes = arch_env->n_register_classes;
117         unsigned c;
118
119         for (c = 0; c < n_reg_classes; ++c) {
120                 free(rsm->reg_index_map[c]);
121         }
122
123         free(rsm->reg_index_map);
124         if (rsm->value_map != NULL)
125                 DEL_ARR_F(rsm->value_map);
126         DEL_ARR_F(rsm->regs);
127
128         rsm->regs          = NULL;
129         rsm->reg_index_map = NULL;
130         rsm->value_map     = NULL;
131 }
132
133 /**
134  * Remove all registers from a register state map.
135  *
136  * @param rsm       the register state map to be destroyed
137  * @param arch_env  the architecture environment
138  */
139 static void rsm_clear_regs(register_state_mapping_t *rsm,
140                            const arch_env_t *arch_env)
141 {
142         unsigned   n_reg_classes = arch_env->n_register_classes;
143         unsigned   c;
144         reg_flag_t memory = { NULL, arch_register_req_type_none };
145
146         for (c = 0; c < n_reg_classes; ++c) {
147                 const arch_register_class_t *cls    = &arch_env->register_classes[c];
148                 unsigned                     n_regs = arch_register_class_n_regs(cls);
149                 unsigned                     r;
150
151                 for (r = 0; r < n_regs; ++r) {
152                         rsm->reg_index_map[c][r] = (size_t)-1;
153                 }
154         }
155         ARR_RESIZE(reg_flag_t, rsm->regs, 0);
156         ARR_APP1(reg_flag_t, rsm->regs, memory);
157
158         if (rsm->value_map != NULL) {
159                 DEL_ARR_F(rsm->value_map);
160                 rsm->value_map = NULL;
161         }
162 }
163
164 /**
165  * Add a register and its constraint flags to a register state map
166  * and return its index inside the map.
167  */
168 static int rsm_add_reg(register_state_mapping_t *rsm,
169                        const arch_register_t *reg,
170                        arch_register_req_type_t flags)
171 {
172         size_t     input_idx = ARR_LEN(rsm->regs);
173         int        cls_idx   = reg->reg_class->index;
174         int        reg_idx   = reg->index;
175         reg_flag_t regflag   = { reg, flags };
176
177         /* we must not have used get_value yet */
178         assert(rsm->reg_index_map[cls_idx][reg_idx] == (size_t)-1);
179         rsm->reg_index_map[cls_idx][reg_idx] = input_idx;
180         ARR_APP1(reg_flag_t, rsm->regs, regflag);
181
182         if (rsm->value_map != NULL) {
183                 ARR_APP1(ir_node*, rsm->value_map, NULL);
184                 assert(ARR_LEN(rsm->value_map) == ARR_LEN(rsm->regs));
185         }
186         return input_idx;
187 }
188
189 /**
190  * Retrieve the ir_node stored at the given index in the register state map.
191  */
192 static ir_node *rsm_get_value(register_state_mapping_t *rsm, size_t index)
193 {
194         assert(index < ARR_LEN(rsm->value_map));
195         return rsm->value_map[index];
196 }
197
198 /**
199  * Retrieve the ir_node occupying the given register in the register state map.
200  */
201 static ir_node *rsm_get_reg_value(register_state_mapping_t *rsm,
202                                   const arch_register_t *reg)
203 {
204         int    cls_idx   = reg->reg_class->index;
205         int    reg_idx   = reg->index;
206         size_t input_idx = rsm->reg_index_map[cls_idx][reg_idx];
207
208         return rsm_get_value(rsm, input_idx);
209 }
210
211 /**
212  * Enter a ir_node at the given index in the register state map.
213  */
214 static void rsm_set_value(register_state_mapping_t *rsm, size_t index,
215                           ir_node *value)
216 {
217         assert(index < ARR_LEN(rsm->value_map));
218         rsm->value_map[index] = value;
219 }
220
221 /**
222  * Enter a ir_node at the given register in the register state map.
223  */
224 static void rsm_set_reg_value(register_state_mapping_t *rsm,
225                               const arch_register_t *reg, ir_node *value)
226 {
227         int    cls_idx   = reg->reg_class->index;
228         int    reg_idx   = reg->index;
229         size_t input_idx = rsm->reg_index_map[cls_idx][reg_idx];
230         rsm_set_value(rsm, input_idx, value);
231 }
232
233
234 beabi_helper_env_t *be_abihelper_prepare(ir_graph *irg)
235 {
236         const arch_env_t   *arch_env = be_get_irg_arch_env(irg);
237         beabi_helper_env_t *env      = XMALLOCZ(beabi_helper_env_t);
238
239         env->irg = irg;
240         prepare_rsm(&env->prolog, arch_env);
241         prepare_rsm(&env->epilog, arch_env);
242
243         return env;
244 }
245
246 void be_abihelper_finish(beabi_helper_env_t *env)
247 {
248         const arch_env_t *arch_env = be_get_irg_arch_env(env->irg);
249
250         free_rsm(&env->prolog, arch_env);
251         if (env->epilog.reg_index_map != NULL) {
252                 free_rsm(&env->epilog, arch_env);
253         }
254         xfree(env);
255 }
256
257 void be_prolog_add_reg(beabi_helper_env_t *env, const arch_register_t *reg,
258                        arch_register_req_type_t flags)
259 {
260         rsm_add_reg(&env->prolog, reg, flags);
261 }
262
263 ir_node *be_prolog_create_start(beabi_helper_env_t *env, dbg_info *dbgi,
264                                 ir_node *block)
265 {
266         int      n_start_outs = ARR_LEN(env->prolog.regs);
267         ir_node *start        = be_new_Start(dbgi, block, n_start_outs);
268         int      o;
269
270         arch_irn_add_flags(start, arch_irn_flags_prolog);
271
272         assert(env->prolog.value_map == NULL);
273         env->prolog.value_map = NEW_ARR_F(ir_node*, n_start_outs);
274
275         for (o = 0; o < n_start_outs; ++o) {
276                 const reg_flag_t      *regflag = &env->prolog.regs[o];
277                 const arch_register_t *reg     = regflag->reg;
278                 ir_node               *proj;
279                 if (reg == NULL) {
280                         arch_set_out_register_req(start, o, arch_no_register_req);
281                         proj = new_r_Proj(start, mode_M, o);
282                 } else {
283                         be_set_constr_single_reg_out(start, o, regflag->reg,
284                                                      regflag->flags);
285                         arch_irn_set_register(start, o, regflag->reg);
286                         proj = new_r_Proj(start, reg->reg_class->mode, o);
287                 }
288                 env->prolog.value_map[o] = proj;
289         }
290
291         return start;
292 }
293
294 ir_node *be_prolog_get_reg_value(beabi_helper_env_t *env,
295                                  const arch_register_t *reg)
296 {
297         return rsm_get_reg_value(&env->prolog, reg);
298 }
299
300 ir_node *be_prolog_get_memory(beabi_helper_env_t *env)
301 {
302         return rsm_get_value(&env->prolog, 0);
303 }
304
305 void be_prolog_set_reg_value(beabi_helper_env_t *env,
306                              const arch_register_t *reg, ir_node *value)
307 {
308         rsm_set_reg_value(&env->prolog, reg, value);
309 }
310
311 void be_prolog_set_memory(beabi_helper_env_t *env, ir_node *value)
312 {
313         rsm_set_value(&env->prolog, 0, value);
314 }
315
316
317
318 void be_epilog_begin(beabi_helper_env_t *env)
319 {
320         const arch_env_t *arch_env = be_get_irg_arch_env(env->irg);
321         rsm_clear_regs(&env->epilog, arch_env);
322         env->epilog.value_map    = NEW_ARR_F(ir_node*, 1);
323         env->epilog.value_map[0] = NULL;
324 }
325
326 void be_epilog_add_reg(beabi_helper_env_t *env, const arch_register_t *reg,
327                        arch_register_req_type_t flags, ir_node *value)
328 {
329         int index = rsm_add_reg(&env->epilog, reg, flags);
330         rsm_set_value(&env->epilog, index, value);
331 }
332
333 void be_epilog_set_reg_value(beabi_helper_env_t *env,
334                              const arch_register_t *reg, ir_node *value)
335 {
336         rsm_set_reg_value(&env->epilog, reg, value);
337 }
338
339 void be_epilog_set_memory(beabi_helper_env_t *env, ir_node *value)
340 {
341         rsm_set_value(&env->epilog, 0, value);
342 }
343
344 ir_node *be_epilog_get_reg_value(beabi_helper_env_t *env,
345                                  const arch_register_t *reg)
346 {
347         return rsm_get_reg_value(&env->epilog, reg);
348 }
349
350 ir_node *be_epilog_get_memory(beabi_helper_env_t *env)
351 {
352         return rsm_get_value(&env->epilog, 0);
353 }
354
355 ir_node *be_epilog_create_return(beabi_helper_env_t *env, dbg_info *dbgi,
356                                  ir_node *block)
357 {
358         size_t    n_return_in = ARR_LEN(env->epilog.regs);
359         ir_node **in          = env->epilog.value_map;
360         int       n_res       = 1; /* TODO */
361         unsigned  pop         = 0; /* TODO */
362         size_t    i;
363         ir_node  *ret;
364
365         assert(ARR_LEN(env->epilog.value_map) == n_return_in);
366
367         ret = be_new_Return(dbgi, get_irn_irg(block), block, n_res, pop,
368                             n_return_in, in);
369         arch_irn_add_flags(ret, arch_irn_flags_epilog);
370         for (i = 0; i < n_return_in; ++i) {
371                 const reg_flag_t      *regflag = &env->epilog.regs[i];
372                 const arch_register_t *reg     = regflag->reg;
373                 if (reg != NULL) {
374                         be_set_constr_single_reg_in(ret, i, reg,
375                                                     arch_register_req_type_none);
376                 }
377         }
378
379         rsm_clear_regs(&env->epilog, be_get_irg_arch_env(env->irg));
380
381         return ret;
382 }
383
384 static void add_missing_keep_walker(ir_node *node, void *data)
385 {
386         int              n_outs, i;
387         unsigned        *found_projs;
388         const ir_edge_t *edge;
389         ir_mode         *mode = get_irn_mode(node);
390         ir_node         *last_keep;
391         (void) data;
392         if (mode != mode_T)
393                 return;
394
395         n_outs = arch_irn_get_n_outs(node);
396         if (n_outs <= 0)
397                 return;
398
399         rbitset_alloca(found_projs, n_outs);
400         foreach_out_edge(node, edge) {
401                 ir_node *succ = get_edge_src_irn(edge);
402                 ir_mode *mode = get_irn_mode(succ);
403                 int      pn;
404
405                 /* The node could be kept */
406                 if (is_End(succ) || is_Anchor(succ))
407                         continue;
408
409                 if (mode == mode_M || mode == mode_X)
410                         continue;
411
412                 pn = get_Proj_proj(succ);
413                 assert(pn < n_outs);
414                 rbitset_set(found_projs, pn);
415         }
416
417
418         /* are keeps missing? */
419         last_keep = NULL;
420         for (i = 0; i < n_outs; ++i) {
421                 ir_node                     *block;
422                 ir_node                     *in[1];
423                 const arch_register_req_t   *req;
424                 const arch_register_class_t *cls;
425
426                 if (rbitset_is_set(found_projs, i)) {
427                         continue;
428                 }
429
430                 req = arch_get_out_register_req(node, i);
431                 cls = req->cls;
432                 if (cls == NULL || (cls->flags & arch_register_class_flag_manual_ra)) {
433                         continue;
434                 }
435
436                 block = get_nodes_block(node);
437                 in[0] = new_r_Proj(node, arch_register_class_mode(cls), i);
438                 if (last_keep != NULL) {
439                         be_Keep_add_node(last_keep, cls, in[0]);
440                 } else {
441                         last_keep = be_new_Keep(block, 1, in);
442                         if (sched_is_scheduled(node)) {
443                                 sched_add_after(node, last_keep);
444                         }
445                 }
446         }
447 }
448
449 void be_add_missing_keeps(ir_graph *irg)
450 {
451         irg_walk_graph(irg, add_missing_keep_walker, NULL, NULL);
452 }
453
454
455 /**
456  * Link the node into its block list as a new head.
457  */
458 static void collect_node(ir_node *node)
459 {
460         ir_node *block = get_nodes_block(node);
461         ir_node *old   = (ir_node*)get_irn_link(block);
462
463         set_irn_link(node, old);
464         set_irn_link(block, node);
465 }
466
467 /**
468  * Post-walker: link all nodes that probably access the stack into lists of their block.
469  */
470 static void link_ops_in_block_walker(ir_node *node, void *data)
471 {
472         (void) data;
473
474         switch (get_irn_opcode(node)) {
475         case iro_Return:
476         case iro_Call:
477                 collect_node(node);
478                 break;
479         case iro_Alloc:
480                 /** all non-stack alloc nodes should be lowered before the backend */
481                 assert(get_Alloc_where(node) == stack_alloc);
482                 collect_node(node);
483                 break;
484         case iro_Free:
485                 assert(get_Free_where(node) == stack_alloc);
486                 collect_node(node);
487                 break;
488         case iro_Builtin:
489                 if (get_Builtin_kind(node) == ir_bk_return_address) {
490                         ir_node   *param = get_Builtin_param(node, 0);
491                         ir_tarval *tv    = get_Const_tarval(param); /* must be Const */
492                         long       value = get_tarval_long(tv);
493                         if (value > 0) {
494                                 /* not the return address of the current function:
495                                  * we need the stack pointer for the frame climbing */
496                                 collect_node(node);
497                         }
498                 }
499                 break;
500         default:
501                 break;
502         }
503 }
504
505 static ir_heights_t *heights;
506
507 /**
508  * Check if a node is somehow data dependent on another one.
509  * both nodes must be in the same basic block.
510  * @param n1 The first node.
511  * @param n2 The second node.
512  * @return 1, if n1 is data dependent (transitively) on n2, 0 if not.
513  */
514 static int dependent_on(const ir_node *n1, const ir_node *n2)
515 {
516         assert(get_nodes_block(n1) == get_nodes_block(n2));
517
518         return heights_reachable_in_block(heights, n1, n2);
519 }
520
521 /**
522  * Classical qsort() comparison function behavior:
523  *
524  * 0  if both elements are equal, no node depend on the other
525  * +1 if first depends on second (first is greater)
526  * -1 if second depends on first (second is greater)
527 */
528 static int cmp_call_dependency(const void *c1, const void *c2)
529 {
530         const ir_node *n1 = *(const ir_node **) c1;
531         const ir_node *n2 = *(const ir_node **) c2;
532
533         if (dependent_on(n1, n2))
534                 return 1;
535
536         if (dependent_on(n2, n1))
537                 return -1;
538
539         /* The nodes have no depth order, but we need a total order because qsort()
540          * is not stable. */
541         return get_irn_idx(n2) - get_irn_idx(n1);
542 }
543
544 /**
545  * Block-walker: sorts dependencies and remember them into a phase
546  */
547 static void process_ops_in_block(ir_node *block, void *data)
548 {
549         ir_phase *phase = (ir_phase*)data;
550         unsigned  n;
551         unsigned  n_nodes;
552         ir_node  *node;
553         ir_node **nodes;
554
555         n_nodes = 0;
556         for (node = (ir_node*)get_irn_link(block); node != NULL;
557              node = (ir_node*)get_irn_link(node)) {
558                 ++n_nodes;
559         }
560
561         if (n_nodes == 0)
562                 return;
563
564         nodes = XMALLOCN(ir_node*, n_nodes);
565         n = 0;
566         for (node = (ir_node*)get_irn_link(block); node != NULL;
567              node = (ir_node*)get_irn_link(node)) {
568                 nodes[n++] = node;
569         }
570         assert(n == n_nodes);
571
572         /* order nodes according to their data dependencies */
573         qsort(nodes, n_nodes, sizeof(nodes[0]), cmp_call_dependency);
574
575         /* remember the calculated dependency into a phase */
576         for (n = n_nodes-1; n > 0; --n) {
577                 ir_node *node = nodes[n];
578                 ir_node *pred = nodes[n-1];
579
580                 phase_set_irn_data(phase, node, pred);
581         }
582         xfree(nodes);
583 }
584
585 void be_collect_stacknodes(beabi_helper_env_t *env)
586 {
587         ir_graph *irg = env->irg;
588
589         /* collect all potential^stack accessing nodes */
590         irg_walk_graph(irg, firm_clear_link, link_ops_in_block_walker, NULL);
591
592         assert(env->stack_order == NULL);
593         env->stack_order = new_phase(irg, phase_irn_init_default);
594
595         /* use heights to create a total order for those nodes: this order is stored
596          * in the created phase */
597         heights = heights_new(irg);
598         irg_block_walk_graph(irg, NULL, process_ops_in_block, env->stack_order);
599         heights_free(heights);
600 }
601
602 ir_node *be_get_stack_pred(const beabi_helper_env_t *env, const ir_node *node)
603 {
604         return (ir_node*)phase_get_irn_data(env->stack_order, node);
605 }