fixed enable mask
[libfirm] / ir / ir / iropt.c
index a516ec5..a2f6792 100644 (file)
@@ -26,6 +26,7 @@
 # include "iropt_dbg.h"
 # include "irflag_t.h"
 # include "firmstat.h"
+# include "irarch.h"
 
 /* Make types visible to allow most efficient access */
 # include "entity_t.h"
@@ -72,6 +73,9 @@ static tarval *computed_value_SymConst(ir_node *n)
   return tarval_bad;
 }
 
+/**
+ * return the value of an Add
+ */
 static tarval *computed_value_Add(ir_node *n)
 {
   ir_node *a = get_Add_left(n);
@@ -88,6 +92,10 @@ static tarval *computed_value_Add(ir_node *n)
   return tarval_bad;
 }
 
+/**
+ * return the value of a Sub
+ * Special case: a - a
+ */
 static tarval *computed_value_Sub(ir_node *n)
 {
   ir_node *a = get_Sub_left(n);
@@ -110,6 +118,9 @@ static tarval *computed_value_Sub(ir_node *n)
   return tarval_bad;
 }
 
+/**
+ * return the value of an unary Minus
+ */
 static tarval *computed_value_Minus(ir_node *n)
 {
   ir_node *a = get_Minus_op(n);
@@ -121,6 +132,9 @@ static tarval *computed_value_Minus(ir_node *n)
   return tarval_bad;
 }
 
+/**
+ * return the value of a Mul
+ */
 static tarval *computed_value_Mul(ir_node *n)
 {
   ir_node *a = get_Mul_left(n);
@@ -147,6 +161,9 @@ static tarval *computed_value_Mul(ir_node *n)
   return tarval_bad;
 }
 
+/**
+ * return the value of a floating point Quot
+ */
 static tarval *computed_value_Quot(ir_node *n)
 {
   ir_node *a = get_Quot_left(n);
@@ -163,39 +180,64 @@ static tarval *computed_value_Quot(ir_node *n)
   return tarval_bad;
 }
 
-static tarval *computed_value_Div(ir_node *n)
+/**
+ * calculate the value of an integer Div of two nodes
+ * Special case: 0 / b
+ */
+static tarval *do_computed_value_Div(ir_node *a, ir_node *b)
 {
-  ir_node *a = get_Div_left(n);
-  ir_node *b = get_Div_right(n);
-
   tarval *ta = value_of(a);
   tarval *tb = value_of(b);
 
-  /* This was missing in original implementation. Why? */
-  if ((ta != tarval_bad) && (tb != tarval_bad) && (get_irn_mode(a) == get_irn_mode(b))) {
-    if (tb != get_mode_null(get_tarval_mode(tb)))   /* div by zero: return tarval_bad */
+  /* Compute c1 / c2 or 0 / a, a != 0 */
+  if ((ta != tarval_bad) && (tb != get_mode_null(get_irn_mode(b)))) {
+    if (tb != tarval_bad)   /* div by zero: return tarval_bad */
       return tarval_div(ta, tb);
+    else if (ta == get_mode_null(get_tarval_mode(ta)))  /* 0 / b == 0 */
+      return ta;
   }
   return tarval_bad;
 }
 
-static tarval *computed_value_Mod(ir_node *n)
+/**
+ * return the value of an integer Div
+ */
+static tarval *computed_value_Div(ir_node *n)
 {
-  ir_node *a = get_Mod_left(n);
-  ir_node *b = get_Mod_right(n);
+  return do_computed_value_Div(get_Div_left(n), get_Div_right(n));
+}
 
+/**
+ * calculate the value of an integer Mod of two nodes
+ * Special case: a % 1
+ */
+static tarval *do_computed_value_Mod(ir_node *a, ir_node *b)
+{
   tarval *ta = value_of(a);
   tarval *tb = value_of(b);
 
-  /* This was missing in original implementation. Why? */
-  if ((ta != tarval_bad) && (tb != tarval_bad) && (get_irn_mode(a) == get_irn_mode(b))) {
-    if (tb != get_mode_null(get_tarval_mode(tb)))   /* div by zero: return tarval_bad */
+  /* Compute c1 % c2 or a % 1 */
+  if (tb != tarval_bad) {
+    if ((ta != tarval_bad) && (tb != get_mode_null(get_tarval_mode(tb))))   /* div by zero: return tarval_bad */
       return tarval_mod(ta, tb);
+    else if (tb == get_mode_one(get_tarval_mode(tb)))    /* x mod 1 == 0 */
+      return get_mode_null(get_irn_mode(a));
   }
 
   return tarval_bad;
 }
 
+/**
+ * return the value of an integer Mod
+ */
+static tarval *computed_value_Mod(ir_node *n)
+{
+  return do_computed_value_Mod(get_Mod_left(n), get_Mod_right(n));
+}
+
+/**
+ * return the value of an Abs
+ */
 static tarval *computed_value_Abs(ir_node *n)
 {
   ir_node *a = get_Abs_op(n);
@@ -207,6 +249,10 @@ static tarval *computed_value_Abs(ir_node *n)
   return tarval_bad;
 }
 
+/**
+ * return the value of an And
+ * Special case: a & 0, 0 & b
+ */
 static tarval *computed_value_And(ir_node *n)
 {
   ir_node *a = get_And_left(n);
@@ -228,6 +274,10 @@ static tarval *computed_value_And(ir_node *n)
   return tarval_bad;
 }
 
+/**
+ * return the value of an Or
+ * Special case: a | 1...1, 1...1 | b
+ */
 static tarval *computed_value_Or(ir_node *n)
 {
   ir_node *a = get_Or_left(n);
@@ -248,6 +298,9 @@ static tarval *computed_value_Or(ir_node *n)
   return tarval_bad;
 }
 
+/**
+ * return the value of an Eor
+ */
 static tarval *computed_value_Eor(ir_node *n)
 {
   ir_node *a = get_Eor_left(n);
@@ -262,6 +315,9 @@ static tarval *computed_value_Eor(ir_node *n)
   return tarval_bad;
 }
 
+/**
+ * return the value of a Not
+ */
 static tarval *computed_value_Not(ir_node *n)
 {
   ir_node *a = get_Not_op(n);
@@ -273,6 +329,9 @@ static tarval *computed_value_Not(ir_node *n)
   return tarval_bad;
 }
 
+/**
+ * return the value of a Shl
+ */
 static tarval *computed_value_Shl(ir_node *n)
 {
   ir_node *a = get_Shl_left(n);
@@ -287,6 +346,9 @@ static tarval *computed_value_Shl(ir_node *n)
   return tarval_bad;
 }
 
+/**
+ * return the value of a Shr
+ */
 static tarval *computed_value_Shr(ir_node *n)
 {
   ir_node *a = get_Shr_left(n);
@@ -301,6 +363,9 @@ static tarval *computed_value_Shr(ir_node *n)
   return tarval_bad;
 }
 
+/**
+ * return the value of a Shrs
+ */
 static tarval *computed_value_Shrs(ir_node *n)
 {
   ir_node *a = get_Shrs_left(n);
@@ -315,6 +380,9 @@ static tarval *computed_value_Shrs(ir_node *n)
   return tarval_bad;
 }
 
+/**
+ * return the value of a Rot
+ */
 static tarval *computed_value_Rot(ir_node *n)
 {
   ir_node *a = get_Rot_left(n);
@@ -329,6 +397,9 @@ static tarval *computed_value_Rot(ir_node *n)
   return tarval_bad;
 }
 
+/**
+ * return the value of a Conv
+ */
 static tarval *computed_value_Conv(ir_node *n)
 {
   ir_node *a = get_Conv_op(n);
@@ -340,10 +411,14 @@ static tarval *computed_value_Conv(ir_node *n)
   return tarval_bad;
 }
 
+/**
+ * return the value of a Proj, handle Proj(Cmp), Proj(Div), Proj(Mod), Proj(DivMod)
+ */
 static tarval *computed_value_Proj(ir_node *n)
 {
-  ir_node *a = get_Proj_pred(n), *b;
+  ir_node *a = get_Proj_pred(n);
   ir_node *aa, *ab;
+  long proj_nr;
 
   /* Optimize Cmp nodes.
      This performs a first step of unreachable code elimination.
@@ -363,12 +438,13 @@ static tarval *computed_value_Proj(ir_node *n)
   case iro_Cmp:
     aa = get_Cmp_left(a);
     ab = get_Cmp_right(a);
+    proj_nr = get_Proj_proj(n);
 
     if (aa == ab) { /* 1.: */
       /* This is a trick with the bits used for encoding the Cmp
          Proj numbers, the following statement is not the same:
-      return new_tarval_from_long ((get_Proj_proj(n) == Eq), mode_b) */
-      return new_tarval_from_long ((get_Proj_proj(n) & Eq), mode_b);
+      return new_tarval_from_long (proj_nr == Eq, mode_b) */
+      return new_tarval_from_long (proj_nr & Eq, mode_b);
     } else {
       tarval *taa = computed_value (aa);
       tarval *tab = computed_value (ab);
@@ -377,7 +453,7 @@ static tarval *computed_value_Proj(ir_node *n)
         /* strange checks... */
         pnc_number flags = tarval_cmp (taa, tab);
         if (flags != False) {
-          return new_tarval_from_long (get_Proj_proj(n) & flags, mode_b);
+          return new_tarval_from_long (proj_nr & flags, mode_b);
         }
       } else {  /* check for 3.: */
         ir_node *aaa = skip_Id(skip_Proj(aa));
@@ -404,54 +480,29 @@ static tarval *computed_value_Proj(ir_node *n)
                 && (mode_is_reference(get_irn_mode(ab)))
                 && (get_irn_op(aba) == op_Alloc)))
           /* 3.: */
-          return new_tarval_from_long (get_Proj_proj(n) & Ne, mode_b);
+          return new_tarval_from_long (proj_nr & Ne, mode_b);
       }
     }
     break;
 
   case iro_DivMod:
-  {
-    tarval *tb = value_of(b = get_DivMod_right(a));
-    tarval *ta = value_of(a = get_DivMod_left(a));
-
-    if ((ta != tarval_bad)  && (tb != tarval_bad) && (get_irn_mode(a) == get_irn_mode(b))) {
-      if (tb == get_mode_null(get_tarval_mode(tb)))  /* div by zero: return tarval_bad */
-        return tarval_bad;
-      if (get_Proj_proj(n)== pn_DivMod_res_div)
-        return tarval_div(ta, tb);
-      else if (get_Proj_proj(n)== pn_DivMod_res_mod)
-        return tarval_mod(ta, tb);
-    }
+    /* compute either the Div or the Mod part */
+    proj_nr = get_Proj_proj(n);
+    if (proj_nr == pn_DivMod_res_div)
+      return do_computed_value_Div(get_DivMod_left(a), get_DivMod_right(a));
+    else if (proj_nr == pn_DivMod_res_mod)
+      return do_computed_value_Mod(get_DivMod_left(a), get_DivMod_right(a));
     break;
-  }
 
   case iro_Div:
-  {
-    tarval *tb = value_of(b = get_Div_right(a));
-    tarval *ta = value_of(a = get_Div_left(a));
-
-    if ((ta != tarval_bad)  && (tb != tarval_bad) && (get_irn_mode(a) == get_irn_mode(b))) {
-      if (tb == get_mode_null(get_tarval_mode(tb)))  /* div by zero: return tarval_bad */
-        return tarval_bad;
-      if (get_Proj_proj(n)== pn_Div_res)
-        return tarval_div(ta, tb);
-    }
+    if (get_Proj_proj(n) == pn_Div_res)
+      return computed_value(a);
     break;
-  }
 
   case iro_Mod:
-  {
-    tarval *tb = value_of(b = get_Mod_right(a));
-    tarval *ta = value_of(a = get_Mod_left(a));
-
-    if ((ta != tarval_bad)  && (tb != tarval_bad) && (get_irn_mode(a) == get_irn_mode(b))) {
-      if (tb == get_mode_null(get_tarval_mode(tb)))  /* div by zero: return tarval_bad */
-        return tarval_bad;
-      if (get_Proj_proj(n)== pn_Mod_res)
-        return tarval_mod(ta, tb);
-    }
+    if (get_Proj_proj(n) == pn_Mod_res)
+      return computed_value(a);
     break;
-  }
 
   default:
     return tarval_bad;
@@ -549,9 +600,11 @@ static ir_node *equivalent_node_Block(ir_node *n)
      ir_node *predblock = get_nodes_block(get_Block_cfgpred(n, 0));
      if (predblock == oldn) {
        /* Jmp jumps into the block it is in -- deal self cycle. */
-       n = new_Bad();                                      DBG_OPT_DEAD;
+       n = new_Bad();
+       DBG_OPT_DEAD(oldn, n);
      } else if (get_opt_control_flow_straightening()) {
-       n = predblock;                                      DBG_OPT_STG;
+       n = predblock;
+       DBG_OPT_STG(oldn, n);
      }
    }
    else if ((get_Block_n_cfgpreds(n) == 1) &&
@@ -559,7 +612,8 @@ static ir_node *equivalent_node_Block(ir_node *n)
      ir_node *predblock = get_nodes_block(get_Block_cfgpred(n, 0));
      if (predblock == oldn) {
        /* Jmp jumps into the block it is in -- deal self cycle. */
-       n = new_Bad();                                      DBG_OPT_DEAD;
+       n = new_Bad();
+       DBG_OPT_DEAD(oldn, n);
      }
    }
    else if ((get_Block_n_cfgpreds(n) == 2) &&
@@ -576,7 +630,8 @@ static ir_node *equivalent_node_Block(ir_node *n)
         (get_irn_mode(get_Cond_selector(get_Proj_pred(a))) == mode_b)) {
       /* Also a single entry Block following a single exit Block.  Phis have
          twice the same operand and will be optimized away. */
-      n = get_nodes_block(a);                                         DBG_OPT_IFSIM;
+      n = get_nodes_block(a);
+      DBG_OPT_IFSIM(oldn, a, b, n);
     }
   } else if (get_opt_unreachable_code() &&
              (n != current_ir_graph->start_block) &&
@@ -628,7 +683,9 @@ static ir_node *equivalent_node_Or(ir_node *n)
 
   /* remove a v a */
   if (a == b) {
-    n = a;                                                             DBG_OPT_ALGSIM1;
+    n = a;
+
+    DBG_OPT_ALGSIM1(oldn, a, b, n);
   }
 
   return n;
@@ -660,7 +717,9 @@ static ir_node *equivalent_node_neutral_zero(ir_node *n)
   /* If this predecessors constant value is zero, the operation is
      unnecessary. Remove it: */
   if (classify_tarval (tv) == TV_CLASSIFY_NULL) {
-    n = on;                                                             DBG_OPT_ALGSIM1;
+    n = on;
+
+    DBG_OPT_ALGSIM1(oldn, a, b, n);
   }
 
   return n;
@@ -681,7 +740,9 @@ static ir_node *equivalent_node_left_zero(ir_node *n)
   ir_node *b = get_binop_right(n);
 
   if (classify_tarval(computed_value(b)) == TV_CLASSIFY_NULL) {
-    n = a;                                                              DBG_OPT_ALGSIM1;
+    n = a;
+
+    DBG_OPT_ALGSIM1(oldn, a, b, n);
   }
 
   return n;
@@ -703,7 +764,8 @@ static ir_node *equivalent_node_symmetric_unop(ir_node *n)
 
   /* optimize symmetric unop */
   if (get_irn_op(pred) == get_irn_op(n)) {
-    n = get_unop_op(pred);                                             DBG_OPT_ALGSIM2;
+    n = get_unop_op(pred);
+    DBG_OPT_ALGSIM2(oldn, pred, n);
   }
   return n;
 }
@@ -727,9 +789,11 @@ static ir_node *equivalent_node_Mul(ir_node *n)
 
   /* Mul is commutative and has again an other neutral element. */
   if (classify_tarval (computed_value (a)) == TV_CLASSIFY_ONE) {
-    n = b;                                                              DBG_OPT_ALGSIM1;
+    n = b;
+    DBG_OPT_ALGSIM1(oldn, a, b, n);
   } else if (classify_tarval (computed_value (b)) == TV_CLASSIFY_ONE) {
-    n = a;                                                              DBG_OPT_ALGSIM1;
+    n = a;
+    DBG_OPT_ALGSIM1(oldn, a, b, n);
   }
   return n;
 }
@@ -754,6 +818,29 @@ static ir_node *equivalent_node_Div(ir_node *n)
   return n;
 }
 
+/**
+ * Optimize a / 1 = a.
+ */
+static ir_node *equivalent_node_DivMod(ir_node *n)
+{
+  ir_node *a = get_DivMod_left(n);
+  ir_node *b = get_DivMod_right(n);
+
+  /* Div is not commutative. */
+  if (classify_tarval(computed_value(b)) == TV_CLASSIFY_ONE) { /* div(x, 1) == x */
+    /* Turn DivMod into a tuple (mem, bad, a, 0) */
+    ir_node *mem = get_Div_mem(n);
+    ir_mode *mode = get_irn_mode(b);
+
+    turn_into_tuple(n, 4);
+    set_Tuple_pred(n, pn_DivMod_M,        mem);
+    set_Tuple_pred(n, pn_DivMod_X_except, new_Bad());        /* no exception */
+    set_Tuple_pred(n, pn_DivMod_res_div,  a);
+    set_Tuple_pred(n, pn_DivMod_res_mod,  new_Const(mode, get_mode_null(mode)));
+  }
+  return n;
+}
+
 /**
  * Optimize a & 0b1...1 = 0b1...1 & a =  a & a = a.
  */
@@ -768,10 +855,11 @@ static ir_node *equivalent_node_And(ir_node *n)
     n = a;    /* And has it's own neutral element */
   } else if (classify_tarval(computed_value(a)) == TV_CLASSIFY_ALL_ONE) {
     n = b;
+    DBG_OPT_ALGSIM1(oldn, a, b, n);
   } else if (classify_tarval(computed_value(b)) == TV_CLASSIFY_ALL_ONE) {
     n = a;
+    DBG_OPT_ALGSIM1(oldn, a, b, n);
   }
-  if (n != oldn)                                                        DBG_OPT_ALGSIM1;
   return n;
 }
 
@@ -788,7 +876,8 @@ static ir_node *equivalent_node_Conv(ir_node *n)
   ir_mode *a_mode = get_irn_mode(a);
 
   if (n_mode == a_mode) { /* No Conv necessary */
-    n = a;                                                              DBG_OPT_ALGSIM3;
+    n = a;
+    DBG_OPT_ALGSIM3(oldn, a, n);
   } else if (get_irn_op(a) == op_Conv) { /* Conv(Conv(b)) */
     ir_mode *b_mode;
 
@@ -798,11 +887,13 @@ static ir_node *equivalent_node_Conv(ir_node *n)
 
     if (n_mode == b_mode) {
       if (n_mode == mode_b) {
-        n = b; /* Convb(Conv*(xxxb(...))) == xxxb(...) */               DBG_OPT_ALGSIM1;
+        n = b; /* Convb(Conv*(xxxb(...))) == xxxb(...) */
+       DBG_OPT_ALGSIM1(oldn, a, b, n);
       }
       else if (mode_is_int(n_mode) || mode_is_character(n_mode)) {
         if (smaller_mode(b_mode, a_mode)){
-          n = b;        /* ConvS(ConvL(xxxS(...))) == xxxS(...) */      DBG_OPT_ALGSIM1;
+          n = b;        /* ConvS(ConvL(xxxS(...))) == xxxS(...) */
+         DBG_OPT_ALGSIM1(oldn, a, b, n);
         }
       }
     }
@@ -894,7 +985,8 @@ static ir_node *equivalent_node_Phi(ir_node *n)
 
   /* Fold, if no multiple distinct non-self-referencing inputs */
   if (i >= n_preds) {
-    n = first_val;                                     DBG_OPT_PHI;
+    n = first_val;
+    DBG_OPT_PHI(oldn, first_val, n);
   } else {
     /* skip the remaining Ids (done in get_Phi_pred). */
     /* superfluous, since we walk all to propagate Block's Bads.
@@ -915,7 +1007,8 @@ static ir_node *equivalent_node_Proj(ir_node *n)
   if ( get_irn_op(a) == op_Tuple) {
     /* Remove the Tuple/Proj combination. */
     if ( get_Proj_proj(n) <= get_Tuple_n_preds(a) ) {
-      n = get_Tuple_pred(a, get_Proj_proj(n));                     DBG_OPT_TUPLE;
+      n = get_Tuple_pred(a, get_Proj_proj(n));
+      DBG_OPT_TUPLE(oldn, a, n);
     } else {
       assert(0); /* This should not happen! */
       n = new_Bad();
@@ -935,7 +1028,8 @@ static ir_node *equivalent_node_Id(ir_node *n)
 {
   ir_node *oldn = n;
 
-  n = follow_Id(n);                                                 DBG_OPT_ID;
+  n = follow_Id(n);
+  DBG_OPT_ID(oldn, n);
   return n;
 }
 
@@ -980,6 +1074,7 @@ static ir_op *firm_set_default_equivalent_node(ir_op *op)
   CASE(Minus);
   CASE(Mul);
   CASE(Div);
+  CASE(DivMod);
   CASE(And);
   CASE(Conv);
   CASE(Phi);
@@ -1026,20 +1121,31 @@ optimize_preds(ir_node *n) {
   } /* end switch */
 }
 
+static ir_node *transform_node_Mul(ir_node *n)
+{
+  return arch_dep_replace_mul_with_shifts(n);
+}
+
 static ir_node *transform_node_Div(ir_node *n)
 {
   tarval *tv = computed_value(n);
+  ir_node *value = n;
 
   /* BEWARE: it is NOT possible to optimize a/a to 1, as this may cause a exception */
 
-  if (tv != tarval_bad) {
+  if (tv != tarval_bad)
+    value = new_Const(get_tarval_mode(tv), tv);
+  else /* Try architecture dependand optimization */
+    value = arch_dep_replace_div_with_shifts(n);
+
+  if (value != n) {
     /* Turn Div into a tuple (mem, bad, value) */
     ir_node *mem = get_Div_mem(n);
 
     turn_into_tuple(n, 3);
     set_Tuple_pred(n, pn_Div_M, mem);
     set_Tuple_pred(n, pn_Div_X_except, new_Bad());
-    set_Tuple_pred(n, pn_Div_res, new_Const(get_tarval_mode(tv), tv));
+    set_Tuple_pred(n, pn_Div_res, value);
   }
   return n;
 }
@@ -1047,16 +1153,23 @@ static ir_node *transform_node_Div(ir_node *n)
 static ir_node *transform_node_Mod(ir_node *n)
 {
   tarval *tv = computed_value(n);
+  ir_node *value = n;
 
   /* BEWARE: it is NOT possible to optimize a%a to 0, as this may cause a exception */
 
-  if (tv != tarval_bad) {
+  if (tv != tarval_bad)
+    value = new_Const(get_tarval_mode(tv), tv);
+  else /* Try architecture dependand optimization */
+    value = arch_dep_replace_mod_with_shifts(n);
+
+  if (value != n) {
     /* Turn Mod into a tuple (mem, bad, value) */
     ir_node *mem = get_Mod_mem(n);
+
     turn_into_tuple(n, 3);
     set_Tuple_pred(n, pn_Mod_M, mem);
     set_Tuple_pred(n, pn_Mod_X_except, new_Bad());
-    set_Tuple_pred(n, pn_Mod_res, new_Const(get_tarval_mode(tv), tv));
+    set_Tuple_pred(n, pn_Mod_res, value);
   }
   return n;
 }
@@ -1091,10 +1204,16 @@ static ir_node *transform_node_DivMod(ir_node *n)
       b = new_Const (mode, resb);
       evaluated = 1;
     }
+    else { /* Try architecture dependand optimization */
+      arch_dep_replace_divmod_with_shifts(&a, &b, n);
+      evaluated = a != NULL;
+    }
   } else if (ta == get_mode_null(mode)) {
+    /* 0 / non-Const = 0 */
     b = a;
     evaluated = 1;
   }
+
   if (evaluated) { /* replace by tuple */
     ir_node *mem = get_DivMod_mem(n);
     turn_into_tuple(n, 4);
@@ -1183,7 +1302,7 @@ static ir_node *transform_node_Eor(ir_node *n)
 }
 
 /**
- * Transfor a boolean Not.
+ * Transform a boolean Not.
  */
 static ir_node *transform_node_Not(ir_node *n)
 {
@@ -1204,6 +1323,9 @@ static ir_node *transform_node_Not(ir_node *n)
  * Transform a Div/Mod/DivMod with a non-zero constant. Must be
  * done here instead of equivalent node because in creates new
  * nodes.
+ * Removes the exceptions and routes the memory to the initial mem.
+ *
+ * Further, it optimizes jump tables by removing all impossible cases.
  */
 static ir_node *transform_node_Proj(ir_node *proj)
 {
@@ -1224,11 +1346,12 @@ static ir_node *transform_node_Proj(ir_node *proj)
         /* we found an exception handler, remove it */
         return new_Bad();
       }
-      else if (proj_nr == pn_Div_M) {
+      else {
        /* the memory Proj can be removed */
         ir_node *res = get_Div_mem(n);
         set_Div_mem(n, get_irg_initial_mem(current_ir_graph));
-       return res;
+       if (proj_nr == pn_Div_M)
+          return res;
       }
     }
     break;
@@ -1243,11 +1366,12 @@ static ir_node *transform_node_Proj(ir_node *proj)
         /* we found an exception handler, remove it */
         return new_Bad();
       }
-      else if (proj_nr == pn_Mod_M) {
+      else {
        /* the memory Proj can be removed */
         ir_node *res = get_Mod_mem(n);
         set_Mod_mem(n, get_irg_initial_mem(current_ir_graph));
-       return res;
+        if (proj_nr == pn_Mod_M)
+         return res;
       }
     }
     break;
@@ -1259,13 +1383,15 @@ static ir_node *transform_node_Proj(ir_node *proj)
       proj_nr = get_Proj_proj(proj);
 
       if (proj_nr == pn_DivMod_X_except) {
+        /* we found an exception handler, remove it */
         return new_Bad();
       }
-      else if (proj_nr == pn_DivMod_M) {
+      else {
        /* the memory Proj can be removed */
         ir_node *res = get_DivMod_mem(n);
         set_DivMod_mem(n, get_irg_initial_mem(current_ir_graph));
-       return res;
+        if (proj_nr == pn_DivMod_M)
+         return res;
       }
     }
     break;
@@ -1430,6 +1556,7 @@ static ir_op *firm_set_default_transform_node(ir_op *op)
     break
 
   switch (op->code) {
+  CASE(Mul);
   CASE(Div);
   CASE(Mod);
   CASE(DivMod);
@@ -1453,68 +1580,80 @@ static ir_op *firm_set_default_transform_node(ir_op *op)
     in a graph. */
 #define N_IR_NODES 512
 
+/** Compares the attributes of two Const nodes. */
 static int node_cmp_attr_Const(ir_node *a, ir_node *b)
 {
   return (get_Const_tarval(a) != get_Const_tarval(b))
       || (get_Const_type(a) != get_Const_type(b));
 }
 
+/** Compares the attributes of two Proj nodes. */
 static int node_cmp_attr_Proj(ir_node *a, ir_node *b)
 {
     return get_irn_proj_attr (a) != get_irn_proj_attr (b);
 }
 
+/** Compares the attributes of two Filter nodes. */
 static int node_cmp_attr_Filter(ir_node *a, ir_node *b)
 {
     return get_Filter_proj(a) != get_Filter_proj(b);
 }
 
+/** Compares the attributes of two Alloc nodes. */
 static int node_cmp_attr_Alloc(ir_node *a, ir_node *b)
 {
     return (get_irn_alloc_attr(a).where != get_irn_alloc_attr(b).where)
-      || (get_irn_alloc_attr(a).type != get_irn_alloc_attr(b).type);
+        || (get_irn_alloc_attr(a).type != get_irn_alloc_attr(b).type);
 }
 
+/** Compares the attributes of two Free nodes. */
 static int node_cmp_attr_Free(ir_node *a, ir_node *b)
 {
     return (get_irn_free_attr(a) != get_irn_free_attr(b));
 }
 
+/** Compares the attributes of two SymConst nodes. */
 static int node_cmp_attr_SymConst(ir_node *a, ir_node *b)
 {
     return (get_irn_symconst_attr(a).num != get_irn_symconst_attr(b).num)
       || (get_irn_symconst_attr(a).sym.type_p != get_irn_symconst_attr(b).sym.type_p);
 }
 
+/** Compares the attributes of two Call nodes. */
 static int node_cmp_attr_Call(ir_node *a, ir_node *b)
 {
     return (get_irn_call_attr(a) != get_irn_call_attr(b));
 }
 
+/** Compares the attributes of two FuncCall nodes. */
 static int node_cmp_attr_FuncCall(ir_node *a, ir_node *b)
 {
     return (get_irn_funccall_attr(a) != get_irn_funccall_attr(b));
 }
 
+/** Compares the attributes of two Sel nodes. */
 static int node_cmp_attr_Sel(ir_node *a, ir_node *b)
 {
-    return (get_irn_sel_attr(a).ent->kind != get_irn_sel_attr(b).ent->kind)
-      || (get_irn_sel_attr(a).ent->name != get_irn_sel_attr(b).ent->name)
-      || (get_irn_sel_attr(a).ent->owner != get_irn_sel_attr(b).ent->owner)
+    return (get_irn_sel_attr(a).ent->kind  != get_irn_sel_attr(b).ent->kind)
+      || (get_irn_sel_attr(a).ent->name    != get_irn_sel_attr(b).ent->name)
+      || (get_irn_sel_attr(a).ent->owner   != get_irn_sel_attr(b).ent->owner)
       || (get_irn_sel_attr(a).ent->ld_name != get_irn_sel_attr(b).ent->ld_name)
-      || (get_irn_sel_attr(a).ent->type != get_irn_sel_attr(b).ent->type);
+      || (get_irn_sel_attr(a).ent->type    != get_irn_sel_attr(b).ent->type);
 }
 
+/** Compares the attributes of two Phi nodes. */
 static int node_cmp_attr_Phi(ir_node *a, ir_node *b)
 {
     return get_irn_phi_attr (a) != get_irn_phi_attr (b);
 }
 
+/** Compares the attributes of two Cast nodes. */
 static int node_cmp_attr_Cast(ir_node *a, ir_node *b)
 {
     return get_Cast_type(a) != get_Cast_type(b);
 }
 
+/** Compares the attributes of two Load nodes. */
 static int node_cmp_attr_Load(ir_node *a, ir_node *b)
 {
   if (get_Load_volatility(a) == volatility_is_volatile ||
@@ -1525,6 +1664,7 @@ static int node_cmp_attr_Load(ir_node *a, ir_node *b)
   return get_Load_mode(a) != get_Load_mode(b);
 }
 
+/** Compares the attributes of two Store nodes. */
 static int node_cmp_attr_Store(ir_node *a, ir_node *b)
 {
   /* NEVER do CSE on volatile Stores */
@@ -1671,7 +1811,6 @@ identify (pset *value_table, ir_node *n)
 
   if (!value_table) return n;
 
-  /* TODO: use a generic commutative attribute */
   if (get_opt_reassociation()) {
     if (is_op_commutative(get_irn_op(n))) {
       ir_node *l = get_binop_left(n);
@@ -1688,6 +1827,8 @@ identify (pset *value_table, ir_node *n)
   o = pset_find (value_table, n, ir_node_hash (n));
   if (!o) return n;
 
+  DBG_OPT_CSE(n, o);
+
   return o;
 }
 
@@ -1712,23 +1853,39 @@ identify_cons (pset *value_table, ir_node *n) {
  * if it isn't there yet.
  */
 static ir_node *
-identify_remember (pset *value_table, ir_node *node)
+identify_remember (pset *value_table, ir_node *n)
 {
   ir_node *o = NULL;
 
-  if (!value_table) return node;
+  if (!value_table) return n;
+
+  if (get_opt_reassociation()) {
+    if (is_op_commutative(get_irn_op(n))) {
+      ir_node *l = get_binop_left(n);
+      ir_node *r = get_binop_right(n);
+
+      /* for commutative operators perform  a OP b == b OP a */
+      if (l > r) {
+        set_binop_left(n, r);
+        set_binop_right(n, l);
+      }
+    }
+  }
 
   /* lookup or insert in hash table with given hash key. */
-  o = pset_insert (value_table, node, ir_node_hash (node));
+  o = pset_insert (value_table, n, ir_node_hash (n));
 
-  if (o == node) return node;
+  if (o != n) {
+    DBG_OPT_CSE(n, o);
+  }
 
   return o;
 }
 
 void
 add_identities (pset *value_table, ir_node *node) {
-  identify_remember (value_table, node);
+  if (get_opt_cse() && (get_irn_opcode(node) != iro_Block))
+    identify_remember (value_table, node);
 }
 
 /**
@@ -1794,7 +1951,7 @@ optimize_node (ir_node *n)
   ir_node *oldn = n;
   opcode iro = get_irn_opcode(n);
 
-  /* Allways optimize Phi nodes: part of the construction. */
+  /* Always optimize Phi nodes: part of the construction. */
   if ((!get_opt_optimize()) && (iro != iro_Phi)) return n;
 
   /* constant expression evaluation / constant folding */
@@ -1809,15 +1966,19 @@ optimize_node (ir_node *n)
          * for DBG_OPT_ALGSIM0
          */
         int node_size = offsetof(ir_node, attr) +  n->op->attr_size;
-        ir_node *x = alloca(node_size);
+        oldn = alloca(node_size);
 
-        memcpy(x, n, node_size);
-        oldn = x;
+        memcpy(oldn, n, node_size);
+       CLONE_ARR_A(ir_node *, oldn->in, n->in);
+
+       /* ARG, copy the in array, we need it for statistics */
+       memcpy(oldn->in, n->in, ARR_LEN(n->in) * sizeof(n->in[0]));
 
         /* evaluation was successful -- replace the node. */
         obstack_free (current_ir_graph->obst, n);
         n = new_Const (get_tarval_mode (tv), tv);
-                                                        DBG_OPT_ALGSIM0;
+
+        DBG_OPT_ALGSIM0(oldn, n);
         return n;
       }
     }
@@ -1900,7 +2061,8 @@ optimize_in_place_2 (ir_node *n)
       if ((get_irn_mode(n) != mode_T) && (tv != tarval_bad)) {
         /* evaluation was successful -- replace the node. */
         n = new_Const (get_tarval_mode (tv), tv);
-                                                DBG_OPT_ALGSIM0;
+
+        DBG_OPT_ALGSIM0(oldn, n);
         return n;
       }
     }