amd64: small changes w.r.t. stack alignment.
[libfirm] / ir / be / becopyopt.c
index 7b7affc..b7afd30 100644 (file)
@@ -50,7 +50,7 @@
 #include "bearch.h"
 #include "benode.h"
 #include "beutil.h"
-#include "beifg_t.h"
+#include "beifg.h"
 #include "beintlive_t.h"
 #include "becopyopt_t.h"
 #include "becopystat.h"
@@ -136,6 +136,7 @@ void be_register_copyopt(const char *name, co_algo_info *copyopt)
        be_add_module_to_list(&copyopts, name, copyopt);
 }
 
+BE_REGISTER_MODULE_CONSTRUCTOR(be_init_copyopt);
 void be_init_copyopt(void)
 {
        lc_opt_entry_t *be_grp = lc_opt_get_grp(firm_opt_get_root(), "be");
@@ -148,14 +149,13 @@ void be_init_copyopt(void)
                                       &copyopts, (void**) &selected_copyopt);
 }
 
-BE_REGISTER_MODULE_CONSTRUCTOR(be_init_copyopt);
-
 static int void_algo(copy_opt_t *co)
 {
        (void) co;
        return 0;
 }
 
+BE_REGISTER_MODULE_CONSTRUCTOR(be_init_copynone);
 void be_init_copynone(void)
 {
        static co_algo_info copyheur = {
@@ -165,8 +165,6 @@ void be_init_copynone(void)
        be_register_copyopt("none", &copyheur);
 }
 
-BE_REGISTER_MODULE_CONSTRUCTOR(be_init_copynone);
-
 #undef QUICK_AND_DIRTY_HACK
 
 static int nodes_interfere(const be_chordal_env_t *env, const ir_node *a, const ir_node *b)
@@ -215,7 +213,8 @@ copy_opt_t *new_copy_opt(be_chordal_env_t *chordal_env, cost_fct_t get_costs)
        return co;
 }
 
-void free_copy_opt(copy_opt_t *co) {
+void free_copy_opt(copy_opt_t *co)
+{
        xfree(co->name);
        free(co);
 }
@@ -246,7 +245,8 @@ static int co_is_optimizable_root(ir_node *irn)
        return 0;
 }
 
-int co_get_costs_loop_depth(const copy_opt_t *co, ir_node *root, ir_node* arg, int pos) {
+int co_get_costs_loop_depth(const copy_opt_t *co, ir_node *root, ir_node* arg, int pos)
+{
        int cost = 0;
        ir_loop *loop;
        ir_node *root_block = get_nodes_block(root);
@@ -267,7 +267,8 @@ int co_get_costs_loop_depth(const copy_opt_t *co, ir_node *root, ir_node* arg, i
        return 1+cost;
 }
 
-int co_get_costs_exec_freq(const copy_opt_t *co, ir_node *root, ir_node* arg, int pos) {
+int co_get_costs_exec_freq(const copy_opt_t *co, ir_node *root, ir_node* arg, int pos)
+{
        int res;
        ir_node *root_bl = get_nodes_block(root);
        ir_node *copy_bl = is_Phi(root) ? get_Block_cfgpred_block(root_bl, pos) : root_bl;
@@ -279,7 +280,8 @@ int co_get_costs_exec_freq(const copy_opt_t *co, ir_node *root, ir_node* arg, in
 }
 
 
-int co_get_costs_all_one(const copy_opt_t *co, ir_node *root, ir_node *arg, int pos) {
+int co_get_costs_all_one(const copy_opt_t *co, ir_node *root, ir_node *arg, int pos)
+{
        (void) co;
        (void) root;
        (void) arg;
@@ -302,13 +304,14 @@ int co_get_costs_all_one(const copy_opt_t *co, ir_node *root, ir_node *arg, int
  * Determines a maximum weighted independent set with respect to
  * the interference and conflict edges of all nodes in a qnode.
  */
-static int ou_max_ind_set_costs(unit_t *ou) {
+static int ou_max_ind_set_costs(unit_t *ou)
+{
        be_chordal_env_t *chordal_env = ou->co->cenv;
        ir_node **safe, **unsafe;
        int i, o, safe_count, safe_costs, unsafe_count, *unsafe_costs;
        bitset_t *curr;
-       bitset_pos_t pos;
-       int max, curr_weight, best_weight = 0;
+       unsigned  pos;
+       int curr_weight, best_weight = 0;
 
        /* assign the nodes into two groups.
         * safe: node has no interference, hence it is in every max stable set.
@@ -320,9 +323,9 @@ static int ou_max_ind_set_costs(unit_t *ou) {
        unsafe       = ALLOCAN(ir_node*, ou->node_count - 1);
        unsafe_costs = ALLOCAN(int,      ou->node_count - 1);
        unsafe_count = 0;
-       for(i=1; i<ou->node_count; ++i) {
+       for (i=1; i<ou->node_count; ++i) {
                int is_safe = 1;
-               for(o=1; o<ou->node_count; ++o) {
+               for (o=1; o<ou->node_count; ++o) {
                        if (i==o)
                                continue;
                        if (nodes_interfere(chordal_env, ou->nodes[i], ou->nodes[o])) {
@@ -360,7 +363,7 @@ static int ou_max_ind_set_costs(unit_t *ou) {
                /* Exact Algorithm: Brute force */
                curr = bitset_alloca(unsafe_count);
                bitset_set_all(curr);
-               while ((max = bitset_popcnt(curr)) != 0) {
+               while (bitset_popcount(curr) != 0) {
                        /* check if curr is a stable set */
                        for (i=bitset_next_set(curr, 0); i!=-1; i=bitset_next_set(curr, i+1))
                                for (o=bitset_next_set(curr, i+1); o!=-1; o=bitset_next_set(curr, o+1)) /* !!!!! difference to qnode_max_ind_set(): NOT (curr, i) */
@@ -388,10 +391,13 @@ static int ou_max_ind_set_costs(unit_t *ou) {
 
 static void co_collect_units(ir_node *irn, void *env)
 {
-       const arch_register_req_t *req = arch_get_register_req_out(irn);
+       const arch_register_req_t *req;
        copy_opt_t                *co  = env;
        unit_t *unit;
 
+       if (get_irn_mode(irn) == mode_T)
+               return;
+       req = arch_get_register_req_out(irn);
        if (req->cls != co->cls)
                return;
        if (!co_is_optimizable_root(irn))
@@ -511,7 +517,7 @@ static void co_collect_units(ir_node *irn, void *env)
                struct list_head *tmp;
 
                /* Determine the maximum costs this unit can cause: all_nodes_cost */
-               for(i=1; i<unit->node_count; ++i) {
+               for (i=1; i<unit->node_count; ++i) {
                        unit->sort_key = MAX(unit->sort_key, unit->costs[i]);
                        unit->all_nodes_costs += unit->costs[i];
                }
@@ -530,7 +536,8 @@ static void co_collect_units(ir_node *irn, void *env)
 
 #ifdef QUICK_AND_DIRTY_HACK
 
-static int compare_ous(const void *k1, const void *k2) {
+static int compare_ous(const void *k1, const void *k2)
+{
        const unit_t *u1 = *((const unit_t **) k1);
        const unit_t *u2 = *((const unit_t **) k2);
        int i, o, u1_has_constr, u2_has_constr;
@@ -574,7 +581,8 @@ static int compare_ous(const void *k1, const void *k2) {
 /**
  * Sort the ou's according to constraints and their sort_key
  */
-static void co_sort_units(copy_opt_t *co) {
+static void co_sort_units(copy_opt_t *co)
+{
        int i, count = 0, costs;
        unit_t *ou, **ous;
 
@@ -610,7 +618,8 @@ static void co_sort_units(copy_opt_t *co) {
 }
 #endif
 
-void co_build_ou_structure(copy_opt_t *co) {
+void co_build_ou_structure(copy_opt_t *co)
+{
        DBG((dbg, LEVEL_1, "\tCollecting optimization units\n"));
        INIT_LIST_HEAD(&co->units);
        irg_walk_graph(co->irg, co_collect_units, NULL, co);
@@ -619,7 +628,8 @@ void co_build_ou_structure(copy_opt_t *co) {
 #endif
 }
 
-void co_free_ou_structure(copy_opt_t *co) {
+void co_free_ou_structure(copy_opt_t *co)
+{
        unit_t *curr, *tmp;
        ASSERT_OU_AVAIL(co);
        list_for_each_entry_safe(unit_t, curr, tmp, &co->units, units) {
@@ -632,7 +642,8 @@ void co_free_ou_structure(copy_opt_t *co) {
 
 /* co_solve_heuristic() is implemented in becopyheur.c */
 
-int co_get_max_copy_costs(const copy_opt_t *co) {
+int co_get_max_copy_costs(const copy_opt_t *co)
+{
        int i, res = 0;
        unit_t *curr;
 
@@ -646,7 +657,8 @@ int co_get_max_copy_costs(const copy_opt_t *co) {
        return res;
 }
 
-int co_get_inevit_copy_costs(const copy_opt_t *co) {
+int co_get_inevit_copy_costs(const copy_opt_t *co)
+{
        int res = 0;
        unit_t *curr;
 
@@ -657,7 +669,8 @@ int co_get_inevit_copy_costs(const copy_opt_t *co) {
        return res;
 }
 
-int co_get_copy_costs(const copy_opt_t *co) {
+int co_get_copy_costs(const copy_opt_t *co)
+{
        int i, res = 0;
        unit_t *curr;
 
@@ -678,7 +691,8 @@ int co_get_copy_costs(const copy_opt_t *co) {
        return res;
 }
 
-int co_get_lower_bound(const copy_opt_t *co) {
+int co_get_lower_bound(const copy_opt_t *co)
+{
        int res = 0;
        unit_t *curr;
 
@@ -702,7 +716,7 @@ void co_complete_stats(const copy_opt_t *co, co_complete_stats_t *stat)
                stat->aff_nodes += 1;
                bitset_add_irn(seen, an->irn);
                co_gs_foreach_neighb(an, neigh) {
-                       if(!bitset_contains_irn(seen, neigh->irn)) {
+                       if (!bitset_contains_irn(seen, neigh->irn)) {
                                stat->aff_edges += 1;
                                stat->max_costs += neigh->costs;
 
@@ -711,7 +725,7 @@ void co_complete_stats(const copy_opt_t *co, co_complete_stats_t *stat)
                                        stat->unsatisfied_edges += 1;
                                }
 
-                               if(nodes_interfere(co->cenv, an->irn, neigh->irn)) {
+                               if (nodes_interfere(co->cenv, an->irn, neigh->irn)) {
                                        stat->aff_int += 1;
                                        stat->inevit_costs += neigh->costs;
                                }
@@ -734,7 +748,8 @@ void co_complete_stats(const copy_opt_t *co, co_complete_stats_t *stat)
                   |_|                                      |___/
  ******************************************************************************/
 
-static int compare_affinity_node_t(const void *k1, const void *k2, size_t size) {
+static int compare_affinity_node_t(const void *k1, const void *k2, size_t size)
+{
        const affinity_node_t *n1 = k1;
        const affinity_node_t *n2 = k2;
        (void) size;
@@ -742,7 +757,8 @@ static int compare_affinity_node_t(const void *k1, const void *k2, size_t size)
        return (n1->irn != n2->irn);
 }
 
-static void add_edge(copy_opt_t *co, ir_node *n1, ir_node *n2, int costs) {
+static void add_edge(copy_opt_t *co, ir_node *n1, ir_node *n2, int costs)
+{
        affinity_node_t new_node, *node;
        neighb_t        *nbr;
        int             allocnew = 1;
@@ -773,19 +789,24 @@ static void add_edge(copy_opt_t *co, ir_node *n1, ir_node *n2, int costs) {
        nbr->costs += costs;
 }
 
-static inline void add_edges(copy_opt_t *co, ir_node *n1, ir_node *n2, int costs) {
+static inline void add_edges(copy_opt_t *co, ir_node *n1, ir_node *n2, int costs)
+{
        if (! be_ifg_connected(co->cenv->ifg, n1, n2)) {
                add_edge(co, n1, n2, costs);
                add_edge(co, n2, n1, costs);
        }
 }
 
-static void build_graph_walker(ir_node *irn, void *env) {
-       const arch_register_req_t *req = arch_get_register_req_out(irn);
+static void build_graph_walker(ir_node *irn, void *env)
+{
+       const arch_register_req_t *req;
        copy_opt_t                *co  = env;
        int pos, max;
        const arch_register_t *reg;
 
+       if (get_irn_mode(irn) == mode_T)
+               return;
+       req = arch_get_register_req_out(irn);
        if (req->cls != co->cls || arch_irn_is_ignore(irn))
                return;
 
@@ -817,14 +838,16 @@ static void build_graph_walker(ir_node *irn, void *env) {
        }
 }
 
-void co_build_graph_structure(copy_opt_t *co) {
+void co_build_graph_structure(copy_opt_t *co)
+{
        obstack_init(&co->obst);
        co->nodes = new_set(compare_affinity_node_t, 32);
 
        irg_walk_graph(co->irg, build_graph_walker, NULL, co);
 }
 
-void co_free_graph_structure(copy_opt_t *co) {
+void co_free_graph_structure(copy_opt_t *co)
+{
        ASSERT_GS_AVAIL(co);
 
        del_set(co->nodes);
@@ -834,7 +857,8 @@ void co_free_graph_structure(copy_opt_t *co) {
 
 /* co_solve_ilp1() co_solve_ilp2() are implemented in becopyilpX.c */
 
-int co_gs_is_optimizable(copy_opt_t *co, ir_node *irn) {
+int co_gs_is_optimizable(copy_opt_t *co, ir_node *irn)
+{
        affinity_node_t new_node, *n;
 
        ASSERT_GS_AVAIL(co);
@@ -858,7 +882,7 @@ static int co_dump_appel_disjoint_constraints(const copy_opt_t *co, ir_node *a,
 
        for (j = 0; j < 2; ++j) {
                const arch_register_req_t *req = arch_get_register_req_out(nodes[j]);
-               if(arch_register_req_is(req, limited))
+               if (arch_register_req_is(req, limited))
                        rbitset_copy_to_bitset(req->limited, constr[j]);
                else
                        bitset_set_all(constr[j]);
@@ -875,12 +899,13 @@ void co_dump_appel_graph(const copy_opt_t *co, FILE *f)
        int      *node_map  = XMALLOCN(int, get_irg_last_idx(co->irg) + 1);
 
        ir_node *irn;
-       void *it, *nit;
+       nodes_iter_t it;
+       neighbours_iter_t nit;
        int n, n_regs;
        unsigned i;
 
        n_regs = 0;
-       for(i = 0; i < co->cls->n_regs; ++i) {
+       for (i = 0; i < co->cls->n_regs; ++i) {
                const arch_register_t *reg = &co->cls->regs[i];
                color_map[i] = arch_register_type_is(reg, ignore) ? -1 : n_regs++;
        }
@@ -890,11 +915,8 @@ void co_dump_appel_graph(const copy_opt_t *co, FILE *f)
         * the values below n are the pre-colored register nodes
         */
 
-       it  = be_ifg_nodes_iter_alloca(ifg);
-       nit = be_ifg_neighbours_iter_alloca(ifg);
-
        n = n_regs;
-       be_ifg_foreach_node(ifg, it, irn) {
+       be_ifg_foreach_node(ifg, &it, irn) {
                if (arch_irn_is_ignore(irn))
                        continue;
                node_map[get_irn_idx(irn)] = n++;
@@ -902,36 +924,36 @@ void co_dump_appel_graph(const copy_opt_t *co, FILE *f)
 
        fprintf(f, "%d %d\n", n, n_regs);
 
-       be_ifg_foreach_node(ifg, it, irn) {
+       be_ifg_foreach_node(ifg, &it, irn) {
                if (!arch_irn_is_ignore(irn)) {
                        int idx                        = node_map[get_irn_idx(irn)];
                        affinity_node_t           *a   = get_affinity_info(co, irn);
                        const arch_register_req_t *req = arch_get_register_req_out(irn);
                        ir_node                   *adj;
 
-                       if(arch_register_req_is(req, limited)) {
-                               for(i = 0; i < co->cls->n_regs; ++i) {
-                                       if(!rbitset_is_set(req->limited, i) && color_map[i] >= 0)
+                       if (arch_register_req_is(req, limited)) {
+                               for (i = 0; i < co->cls->n_regs; ++i) {
+                                       if (!rbitset_is_set(req->limited, i) && color_map[i] >= 0)
                                                fprintf(f, "%d %d -1\n", color_map[i], idx);
                                }
                        }
 
-                       be_ifg_foreach_neighbour(ifg, nit, irn, adj) {
+                       be_ifg_foreach_neighbour(ifg, &nit, irn, adj) {
                                if (!arch_irn_is_ignore(adj) &&
                                                !co_dump_appel_disjoint_constraints(co, irn, adj)) {
                                        int adj_idx = node_map[get_irn_idx(adj)];
-                                       if(idx < adj_idx)
+                                       if (idx < adj_idx)
                                                fprintf(f, "%d %d -1\n", idx, adj_idx);
                                }
                        }
 
-                       if(a) {
+                       if (a) {
                                neighb_t *n;
 
                                co_gs_foreach_neighb(a, n) {
                                        if (!arch_irn_is_ignore(n->irn)) {
                                                int n_idx = node_map[get_irn_idx(n->irn)];
-                                               if(idx < n_idx)
+                                               if (idx < n_idx)
                                                        fprintf(f, "%d %d %d\n", idx, n_idx, (int) n->costs);
                                        }
                                }
@@ -1014,10 +1036,10 @@ static void ifg_dump_node_attr(FILE *f, void *self, ir_node *irn)
        const arch_register_req_t *req     = arch_get_register_req_out(irn);
        int                        limited = arch_register_req_is(req, limited);
 
-       if(env->flags & CO_IFG_DUMP_LABELS) {
+       if (env->flags & CO_IFG_DUMP_LABELS) {
                ir_fprintf(f, "label=\"%+F", irn);
 
-               if((env->flags & CO_IFG_DUMP_CONSTR) && limited) {
+               if ((env->flags & CO_IFG_DUMP_CONSTR) && limited) {
                        bitset_t *bs = bitset_alloca(env->co->cls->n_regs);
                        rbitset_copy_to_bitset(req->limited, bs);
                        ir_fprintf(f, "\\n%B", bs);
@@ -1027,10 +1049,10 @@ static void ifg_dump_node_attr(FILE *f, void *self, ir_node *irn)
                fprintf(f, "label=\"\" shape=point " );
        }
 
-       if(env->flags & CO_IFG_DUMP_SHAPE)
+       if (env->flags & CO_IFG_DUMP_SHAPE)
                fprintf(f, "shape=%s ", limited ? "diamond" : "ellipse");
 
-       if(env->flags & CO_IFG_DUMP_COLORS)
+       if (env->flags & CO_IFG_DUMP_COLORS)
                fprintf(f, "style=filled color=%s ", get_dot_color_name(reg->index));
 }
 
@@ -1048,12 +1070,12 @@ static void ifg_dump_at_end(FILE *file, void *self)
                        const arch_register_t *nr = arch_get_irn_register(n->irn);
                        unsigned nidx = get_irn_idx(n->irn);
 
-                       if(aidx < nidx) {
+                       if (aidx < nidx) {
                                const char *color = nr == ar ? "blue" : "red";
-                               fprintf(file, "\tn%d -- n%d [weight=0.01 ", aidx, nidx);
-                               if(env->flags & CO_IFG_DUMP_LABELS)
+                               fprintf(file, "\tn%u -- n%u [weight=0.01 ", aidx, nidx);
+                               if (env->flags & CO_IFG_DUMP_LABELS)
                                        fprintf(file, "label=\"%d\" ", n->costs);
-                               if(env->flags & CO_IFG_DUMP_COLORS)
+                               if (env->flags & CO_IFG_DUMP_COLORS)
                                        fprintf(file, "color=%s ", color);
                                else
                                        fprintf(file, "style=dotted");
@@ -1117,7 +1139,7 @@ static FILE *my_open(const be_chordal_env_t *env, const char *prefix, const char
        ir_snprintf(buf, sizeof(buf), "%s%s_%F_%s%s", prefix, tu_name, env->irg, env->cls->name, suffix);
        xfree(tu_name);
        result = fopen(buf, "wt");
-       if(result == NULL) {
+       if (result == NULL) {
                panic("Couldn't open '%s' for writing.", buf);
        }
 
@@ -1134,7 +1156,7 @@ void co_driver(be_chordal_env_t *cenv)
        assert(selected_copyopt);
 
        /* skip copymin if algo is 'none' */
-       if(selected_copyopt->copyopt == void_algo)
+       if (selected_copyopt->copyopt == void_algo)
                return;
 
        be_liveness_assure_chk(be_get_birg_liveness(cenv->birg));
@@ -1196,7 +1218,7 @@ void co_driver(be_chordal_env_t *cenv)
                ir_printf("%30F ", cenv->irg);
                printf("%10s %10" ULL_FMT "%10" ULL_FMT "%10" ULL_FMT, cenv->cls->name, after.max_costs, before.costs, after.inevit_costs);
 
-               if(optimizable_costs > 0)
+               if (optimizable_costs > 0)
                        printf("%10" ULL_FMT " %5.2f\n", after.costs, (evitable * 100.0) / optimizable_costs);
                else
                        printf("%10" ULL_FMT " %5s\n", after.costs, "-");
@@ -1205,7 +1227,7 @@ void co_driver(be_chordal_env_t *cenv)
        /* Dump the interference graph in Appel's format. */
        if (dump_flags & DUMP_APPEL) {
                FILE *f = my_open(cenv, "", ".apl");
-               fprintf(f, "# %lld %lld\n", after.costs, after.unsatisfied_edges);
+               fprintf(f, "# %llu %llu\n", after.costs, after.unsatisfied_edges);
                co_dump_appel_graph(co, f);
                fclose(f);
        }