fixed some bugs
[libfirm] / ir / be / ia32 / ia32_emitter.c
index 3557aa8..d795abd 100644 (file)
@@ -1,13 +1,21 @@
+#ifdef HAVE_CONFIG_H
+#include "config.h"
+#endif
+
 #include <limits.h>
 
+#include "xmalloc.h"
 #include "tv.h"
 #include "iredges.h"
 #include "debug.h"
 #include "irgwalk.h"
 #include "irprintf.h"
 #include "irop_t.h"
+#include "irargs_t.h"
+#include "irprog_t.h"
 
 #include "../besched.h"
+#include "../benode_t.h"
 
 #include "ia32_emitter.h"
 #include "gen_ia32_emitter.h"
 #include "ia32_new_nodes.h"
 #include "ia32_map_regs.h"
 
+#ifdef obstack_chunk_alloc
+# undef obstack_chunk_alloc
+# define obstack_chunk_alloc xmalloc
+#else
+# define obstack_chunk_alloc xmalloc
+# define obstack_chunk_free free
+#endif
+
+extern int obstack_printf(struct obstack *obst, char *fmt, ...);
+
 #define SNPRINTF_BUF_LEN 128
 
-static set *cur_reg_set = NULL;
+static const arch_env_t *arch_env = NULL;
 
+/**
+ * Emits registers and/or address mode of a binary operation.
+ */
+char *ia32_emit_binop(const ir_node *n) {
+       static char *buf = NULL;
 
-/*************************************************************
- *             _       _    __   _          _
- *            (_)     | |  / _| | |        | |
- *  _ __  _ __ _ _ __ | |_| |_  | |__   ___| |_ __   ___ _ __
- * | '_ \| '__| | '_ \| __|  _| | '_ \ / _ \ | '_ \ / _ \ '__|
- * | |_) | |  | | | | | |_| |   | | | |  __/ | |_) |  __/ |
- * | .__/|_|  |_|_| |_|\__|_|   |_| |_|\___|_| .__/ \___|_|
- * | |                                       | |
- * |_|                                       |_|
- *************************************************************/
+       /* verify that this function is never called on non-AM supporting operations */
+       assert(get_ia32_am_support(n) != ia32_am_None && "emit binop expects addressmode support");
+
+       if (! buf) {
+               buf = xcalloc(1, SNPRINTF_BUF_LEN);
+       }
+       else {
+               memset(buf, 0, SNPRINTF_BUF_LEN);
+       }
+
+       switch(get_ia32_op_type(n)) {
+               case ia32_Normal:
+                       if (get_ia32_cnst(n)) {
+                               lc_esnprintf(ia32_get_arg_env(), buf, SNPRINTF_BUF_LEN, "%3S, %s", n, get_ia32_cnst(n));
+                       }
+                       else {
+                               lc_esnprintf(ia32_get_arg_env(), buf, SNPRINTF_BUF_LEN, "%3S, %4S", n, n);
+                       }
+                       break;
+               case ia32_AddrModeS:
+                       lc_esnprintf(ia32_get_arg_env(), buf, SNPRINTF_BUF_LEN, "%4S, %s", n, ia32_emit_am(n));
+                       break;
+               case ia32_AddrModeD:
+                       if (get_ia32_cnst(n)) {
+                               lc_esnprintf(ia32_get_arg_env(), buf, SNPRINTF_BUF_LEN, "%s, %s", ia32_emit_am(n), get_ia32_cnst(n));
+                       }
+                       else {
+                               lc_esnprintf(ia32_get_arg_env(), buf, SNPRINTF_BUF_LEN, "%s, %3S", ia32_emit_am(n), n);
+                       }
+                       break;
+               default:
+                       assert(0 && "unsupported op type");
+       }
+
+       return buf;
+}
 
 /**
- * Return node's tarval as string.
+ * Emits registers and/or address mode of a unary operation.
  */
-const char *node_const_to_str(ir_node *n) {
-       char   *buf;
-       tarval *tv = get_ia32_Immop_tarval(n);
+char *ia32_emit_unop(const ir_node *n) {
+       static char *buf = NULL;
 
-       if (tv) {
-               buf = malloc(SNPRINTF_BUF_LEN);
-               tarval_snprintf(buf, SNPRINTF_BUF_LEN, tv);
-               return buf;
+       if (! buf) {
+               buf = xcalloc(1, SNPRINTF_BUF_LEN);
        }
-       else if (get_ia32_old_ir(n)) {
-               return get_sc_name(get_ia32_old_ir(n));
+       else {
+               memset(buf, 0, SNPRINTF_BUF_LEN);
        }
-       else
-               return "0";
+
+       switch(get_ia32_op_type(n)) {
+               case ia32_Normal:
+                       lc_esnprintf(ia32_get_arg_env(), buf, SNPRINTF_BUF_LEN, "%1D", n);
+                       break;
+               case ia32_am_Dest:
+                       snprintf(buf, SNPRINTF_BUF_LEN, ia32_emit_am(n));
+                       break;
+               default:
+                       assert(0 && "unsupported op type");
+       }
+
+       return buf;
 }
 
 /**
- * Returns node's offset as string.
+ * Emits adressmode.
  */
-char *node_offset_to_str(ir_node *n) {
-       char   *buf;
-       tarval *tv = get_ia32_offs(n);
+char *ia32_emit_am(const ir_node *n) {
+       ia32_am_flavour_t am_flav    = get_ia32_am_flavour(n);
+       int               had_output = 0;
+       char             *s;
+       int               size;
+       static struct obstack *obst  = NULL;
+       ir_mode *mode = get_ia32_ls_mode(n);
+
+       if (! is_ia32_Lea(n))
+               assert(mode && "AM node must have ls_mode attribute set.");
+
+       if (! obst) {
+               obst = xcalloc(1, sizeof(*obst));
+       }
+       else {
+               obstack_free(obst, NULL);
+       }
+
+       /* obstack_free with NULL results in an uninitialized obstack */
+       obstack_init(obst);
+
+       if (mode) {
+               switch (get_mode_size_bits(mode)) {
+                       case 8:
+                               obstack_printf(obst, "BYTE PTR ");
+                               break;
+                       case 16:
+                               obstack_printf(obst, "WORD PTR ");
+                               break;
+                       case 32:
+                               obstack_printf(obst, "DWORD PTR ");
+                               break;
+                       default:
+                               assert(0 && "unsupported mode size");
+               }
+       }
+
+       obstack_printf(obst, "[");
 
-       if (tv) {
-               buf = malloc(SNPRINTF_BUF_LEN);
-               tarval_snprintf(buf, SNPRINTF_BUF_LEN, tv);
-               return buf;
+       if (am_flav & ia32_B) {
+               lc_eoprintf(ia32_get_arg_env(), obst, "%1S", n);
+               had_output = 1;
        }
-       else
-               return "";
+
+       if (am_flav & ia32_I) {
+               if (had_output) {
+                       obstack_printf(obst, "+");
+               }
+
+               lc_eoprintf(ia32_get_arg_env(), obst, "%2S", n);
+
+               if (am_flav & ia32_S) {
+                       obstack_printf(obst, "*%d", 1 << get_ia32_am_scale(n));
+               }
+
+               had_output = 1;
+       }
+
+       if (am_flav & ia32_O) {
+               obstack_printf(obst, get_ia32_am_offs(n));
+       }
+
+       obstack_printf(obst, "] ");
+
+       size        = obstack_object_size(obst);
+       s           = obstack_finish(obst);
+       s[size - 1] = '\0';
+
+       return s;
 }
 
+/*************************************************************
+ *             _       _    __   _          _
+ *            (_)     | |  / _| | |        | |
+ *  _ __  _ __ _ _ __ | |_| |_  | |__   ___| |_ __   ___ _ __
+ * | '_ \| '__| | '_ \| __|  _| | '_ \ / _ \ | '_ \ / _ \ '__|
+ * | |_) | |  | | | | | |_| |   | | | |  __/ | |_) |  __/ |
+ * | .__/|_|  |_|_| |_|\__|_|   |_| |_|\___|_| .__/ \___|_|
+ * | |                                       | |
+ * |_|                                       |_|
+ *************************************************************/
+
 /* We always pass the ir_node which is a pointer. */
 static int ia32_get_arg_type(const lc_arg_occ_t *occ) {
        return lc_arg_type_ptr;
@@ -73,13 +199,11 @@ static int ia32_get_arg_type(const lc_arg_occ_t *occ) {
 
 
 /**
- * Returns the register at in position pos. If the IN node is not an
- * ia32 node, we check for phi and proj.
+ * Returns the register at in position pos.
  */
-static const arch_register_t *get_in_reg(ir_node *irn, int pos) {
+static const arch_register_t *get_in_reg(const ir_node *irn, int pos) {
        ir_node                *op;
        const arch_register_t  *reg = NULL;
-       const arch_register_t **slots;
 
        assert(get_irn_arity(irn) > pos && "Invalid IN position");
 
@@ -87,52 +211,71 @@ static const arch_register_t *get_in_reg(ir_node *irn, int pos) {
           in register we need. */
        op = get_irn_n(irn, pos);
 
-       if (is_Proj(op)) {
-               pos = (int)translate_proj_pos(op);
-               while(is_Proj(op))
-                       op = get_Proj_pred(op);
-       }
+       reg = arch_get_irn_register(arch_env, op);
+
+       assert(reg && "no in register found");
+       return reg;
+}
+
+/**
+ * Returns the register at out position pos.
+ */
+static const arch_register_t *get_out_reg(const ir_node *irn, int pos) {
+       ir_node                *proj;
+       const arch_register_t  *reg = NULL;
+
+       /* 1st case: irn is not of mode_T, so it has only                 */
+       /*           one OUT register -> good                             */
+       /* 2nd case: irn is of mode_T -> collect all Projs and ask the    */
+       /*           Proj with the corresponding projnum for the register */
 
-       if (is_ia32_irn(op)) {
-               /* The operator is an ia32 node: this node has only one out */
-               slots = get_ia32_slots(op);
-               reg   = slots[0];
+       if (get_irn_mode(irn) != mode_T) {
+               reg = arch_get_irn_register(arch_env, irn);
+       }
+       else if (is_ia32_irn(irn)) {
+               reg = get_ia32_out_reg(irn, pos);
        }
        else {
-               /* The operator is not an ia32 node: check for Phi or Proj */
-               if (is_Phi(op)) {
-                       /* Phi's getting register assigned */
-                       reg  = ia32_get_firm_reg(NULL, op, cur_reg_set);
-                       assert(reg && "No register assigned to Phi node");
-               }
-               else {
-                       assert(0 && "Unsupported node for IN register");
+               const ir_edge_t *edge;
+
+               foreach_out_edge(irn, edge) {
+                       proj = get_edge_src_irn(edge);
+                       assert(is_Proj(proj) && "non-Proj from mode_T node");
+                       if (get_Proj_proj(proj) == pos) {
+                               reg = arch_get_irn_register(arch_env, proj);
+                               break;
+                       }
                }
        }
 
+       assert(reg && "no out register found");
        return reg;
 }
 
-/**
- * Returns the number of the in register at position pos.
- */
-int get_ia32_in_regnr(ir_node *irn, int pos) {
-       const arch_register_t *reg;
-
-       reg = get_in_reg(irn, pos);
-       assert(reg && "no in register");
-       return reg->index;
-}
+enum io_direction {
+  IN_REG,
+  OUT_REG
+};
 
 /**
  * Returns the name of the in register at position pos.
  */
-const char *get_ia32_in_reg_name(ir_node *irn, int pos) {
+static const char *get_ia32_reg_name(ir_node *irn, int pos, enum io_direction in_out) {
        const arch_register_t *reg;
 
-       reg = get_in_reg(irn, pos);
-       assert(reg && "no in register");
-       return reg->name;
+       if (in_out == IN_REG) {
+               reg = get_in_reg(irn, pos);
+       }
+       else {
+               /* destination address mode nodes don't have outputs */
+               if (is_ia32_irn(irn) && get_ia32_op_type(irn) == ia32_AddrModeD) {
+                       return "MEM";
+               }
+
+               reg = get_out_reg(irn, pos);
+       }
+
+       return arch_register_get_name(reg);
 }
 
 /**
@@ -148,18 +291,13 @@ static int ia32_get_reg_name(lc_appendable_t *app,
        if (!X)
                return lc_arg_append(app, occ, "(null)", 6);
 
-       if (occ->conversion == 's') {
-               buf = get_ia32_in_reg_name(X, nr);
-       }
-       else { /* 'd' */
-               buf = get_ia32_out_reg_name(X, nr);
-       }
+       buf = get_ia32_reg_name(X, nr, occ->conversion == 'S' ? IN_REG : OUT_REG);
 
        return lc_arg_append(app, occ, buf, strlen(buf));
 }
 
 /**
- * Returns the tarval or offset of an ia32 as a string.
+ * Returns the tarval, offset or scale of an ia32 as a string.
  */
 static int ia32_const_to_str(lc_appendable_t *app,
     const lc_arg_occ_t *occ, const lc_arg_value_t *arg)
@@ -170,14 +308,14 @@ static int ia32_const_to_str(lc_appendable_t *app,
        if (!X)
                return lc_arg_append(app, occ, "(null)", 6);
 
-       if (occ->conversion == 'c') {
-               buf = node_const_to_str(X);
+       if (occ->conversion == 'C') {
+               buf = get_ia32_cnst(X);
        }
-       else { /* 'o' */
-               buf = node_offset_to_str(X);
+       else { /* 'O' */
+               buf = get_ia32_am_offs(X);
        }
 
-       return lc_arg_append(app, occ, buf, strlen(buf));
+       return buf ? lc_arg_append(app, occ, buf, strlen(buf)) : 0;
 }
 
 /**
@@ -191,10 +329,7 @@ static int ia32_get_mode_suffix(lc_appendable_t *app,
        if (!X)
                return lc_arg_append(app, occ, "(null)", 6);
 
-       if (get_mode_size_bits(get_irn_mode(X)) == 32)
-               return lc_appendable_chadd(app, 's');
-       else
-               return lc_appendable_chadd(app, 'd');
+       return lc_appendable_chadd(app, get_mode_size_bits(get_irn_mode(X)) == 32 ? 's' : 'd');
 }
 
 /**
@@ -202,51 +337,47 @@ static int ia32_get_mode_suffix(lc_appendable_t *app,
  * We use the firm environment with some additional handlers.
  */
 const lc_arg_env_t *ia32_get_arg_env(void) {
-  static lc_arg_env_t *env = NULL;
+       static lc_arg_env_t *env = NULL;
 
-  static const lc_arg_handler_t ia32_reg_handler   = { ia32_get_arg_type, ia32_get_reg_name };
-  static const lc_arg_handler_t ia32_const_handler = { ia32_get_arg_type, ia32_const_to_str };
-  static const lc_arg_handler_t ia32_mode_handler  = { ia32_get_arg_type, ia32_get_mode_suffix };
+       static const lc_arg_handler_t ia32_reg_handler   = { ia32_get_arg_type, ia32_get_reg_name };
+       static const lc_arg_handler_t ia32_const_handler = { ia32_get_arg_type, ia32_const_to_str };
+       static const lc_arg_handler_t ia32_mode_handler  = { ia32_get_arg_type, ia32_get_mode_suffix };
 
-  if(env == NULL) {
-    env = firm_get_arg_env();
+       if(env == NULL) {
+               /* extend the firm printer */
+               env = firm_get_arg_env();
 
-    lc_arg_register(env, "ia32:sreg", 's', &ia32_reg_handler);
-    lc_arg_register(env, "ia32:dreg", 'd', &ia32_reg_handler);
-    lc_arg_register(env, "ia32:cnst", 'c', &ia32_const_handler);
-    lc_arg_register(env, "ia32:offs", 'o', &ia32_const_handler);
-    lc_arg_register(env, "ia32:mode", 'm', &ia32_mode_handler);
-  }
+               lc_arg_register(env, "ia32:sreg", 'S', &ia32_reg_handler);
+               lc_arg_register(env, "ia32:dreg", 'D', &ia32_reg_handler);
+               lc_arg_register(env, "ia32:cnst", 'C', &ia32_const_handler);
+               lc_arg_register(env, "ia32:offs", 'O', &ia32_const_handler);
+               lc_arg_register(env, "ia32:mode", 'M', &ia32_mode_handler);
+       }
 
-  return env;
+       return env;
 }
 
-/**
- * For 2-address code we need to make sure the first src reg is equal to dest reg.
- */
-void equalize_dest_src(FILE *F, ir_node *n) {
-       if (get_ia32_in_regnr(n, 0) != get_ia32_out_regnr(n, 0)) {
-               if (get_irn_arity(n) > 1 && get_ia32_in_regnr(n, 1) == get_ia32_out_regnr(n, 0)) {
-                       if (! is_op_commutative(get_irn_op(n))) {
-                               /* we only need to echange for non-commutative ops */
-                               lc_efprintf(ia32_get_arg_env(), F, "\txchg %1s, %2s\t\t\t/* xchg src1 <-> src2 for 2 address code */\n", n, n);
-                       }
-               }
-               else {
-                       lc_efprintf(ia32_get_arg_env(), F, "\tmovl %1s, %1d\t\t\t/* src -> dest for 2 address code */\n", n, n);
-               }
-       }
-}
 
 /*
  * Add a number to a prefix. This number will not be used a second time.
  */
-char *get_unique_label(char *buf, size_t buflen, const char *prefix) {
+static char *get_unique_label(char *buf, size_t buflen, const char *prefix) {
        static unsigned long id = 0;
        snprintf(buf, buflen, "%s%lu", prefix, ++id);
        return buf;
 }
 
+
+/*************************************************
+ *                 _ _                         _
+ *                (_) |                       | |
+ *   ___ _ __ ___  _| |_    ___ ___  _ __   __| |
+ *  / _ \ '_ ` _ \| | __|  / __/ _ \| '_ \ / _` |
+ * |  __/ | | | | | | |_  | (_| (_) | | | | (_| |
+ *  \___|_| |_| |_|_|\__|  \___\___/|_| |_|\__,_|
+ *
+ *************************************************/
+
 /*
  * coding of conditions
  */
@@ -323,7 +454,7 @@ static char *get_cfop_target(const ir_node *irn, char *buf) {
 /**
  * Emits the jump sequence for a conditional jump (cmp + jmp_true + jmp_false)
  */
-static void finish_CondJmp(FILE *F, ir_node *irn) {
+static void finish_CondJmp(FILE *F, const ir_node *irn) {
        const ir_node   *proj;
        const ir_edge_t *edge;
        char buf[SNPRINTF_BUF_LEN];
@@ -354,39 +485,57 @@ static void finish_CondJmp(FILE *F, ir_node *irn) {
 /**
  * Emits code for conditional jump with two variables.
  */
-static void emit_ia32_CondJmp(ir_node *irn, emit_env_t *env) {
+static void emit_ia32_CondJmp(const ir_node *irn, emit_env_t *env) {
        FILE *F = env->out;
 
-       lc_efprintf(ia32_get_arg_env(), F, "\tcmp %2s, %1s\t\t\t/* CondJmp(%+F, %+F) */\n", irn, irn,
-                                                                                                                                       get_irn_n(irn, 0), get_irn_n(irn, 1));
+       lc_efprintf(ia32_get_arg_env(), F, "\tcmp %s\t\t\t/* CondJmp(%+F, %+F) */\n",
+               ia32_emit_binop(irn), get_irn_n(irn, 0), get_irn_n(irn, 1));
        finish_CondJmp(F, irn);
 }
 
 /**
  * Emits code for conditional jump with immediate.
  */
-void emit_ia32_CondJmp_i(ir_node *irn, emit_env_t *env) {
+void emit_ia32_CondJmp_i(const ir_node *irn, emit_env_t *env) {
        FILE *F = env->out;
 
-       lc_efprintf(ia32_get_arg_env(), F, "\tcmp %c, %1s\t\t\t/* CondJmp_i(%+F) */\n", irn, irn, get_irn_n(irn, 0));
+       lc_efprintf(ia32_get_arg_env(), F, "\tcmp %s\t\t\t/* CondJmp_i(%+F) */\n",
+               ia32_emit_binop(irn), get_irn_n(irn, 0));
        finish_CondJmp(F, irn);
 }
 
+
+
+/*********************************************************
+ *                 _ _       _
+ *                (_) |     (_)
+ *   ___ _ __ ___  _| |_     _ _   _ _ __ ___  _ __  ___
+ *  / _ \ '_ ` _ \| | __|   | | | | | '_ ` _ \| '_ \/ __|
+ * |  __/ | | | | | | |_    | | |_| | | | | | | |_) \__ \
+ *  \___|_| |_| |_|_|\__|   | |\__,_|_| |_| |_| .__/|___/
+ *                         _/ |               | |
+ *                        |__/                |_|
+ *********************************************************/
+
+/* jump table entry (target and corresponding number) */
 typedef struct _branch_t {
        ir_node *target;
        int      value;
 } branch_t;
 
+/* jump table for switch generation */
 typedef struct _jmp_tbl_t {
-       ir_node  *defProj;
-       int       min_value;
-       int       max_value;
-       int       num_branches;
-       char     *label;
-       branch_t *branches;
+       ir_node  *defProj;         /**< default target */
+       int       min_value;       /**< smallest switch case */
+       int       max_value;       /**< largest switch case */
+       int       num_branches;    /**< number of jumps */
+       char     *label;           /**< label of the jump table */
+       branch_t *branches;        /**< jump array */
 } jmp_tbl_t;
 
-/* Compare two variables of type branch_t */
+/**
+ * Compare two variables of type branch_t. Used to sort all switch cases
+ */
 static int ia32_cmp_branch_t(const void *a, const void *b) {
        branch_t *b1 = (branch_t *)a;
        branch_t *b2 = (branch_t *)b;
@@ -413,11 +562,11 @@ void emit_ia32_SwitchJmp(const ir_node *irn, emit_env_t *emit_env) {
        FILE               *F   = emit_env->out;
 
        /* fill the table structure */
-       tbl.label        = malloc(SNPRINTF_BUF_LEN);
+       tbl.label        = xmalloc(SNPRINTF_BUF_LEN);
        tbl.label        = get_unique_label(tbl.label, SNPRINTF_BUF_LEN, "JMPTBL_");
        tbl.defProj      = NULL;
        tbl.num_branches = get_irn_n_edges(irn);
-       tbl.branches     = calloc(tbl.num_branches, sizeof(*(tbl.branches)));
+       tbl.branches     = xcalloc(tbl.num_branches, sizeof(tbl.branches[0]));
        tbl.min_value    = INT_MAX;
        tbl.max_value    = INT_MIN;
 
@@ -446,7 +595,7 @@ void emit_ia32_SwitchJmp(const ir_node *irn, emit_env_t *emit_env) {
        }
 
        /* sort the branches by their number */
-       qsort(tbl.branches, tbl.num_branches, sizeof(*(tbl.branches)), ia32_cmp_branch_t);
+       qsort(tbl.branches, tbl.num_branches, sizeof(tbl.branches[0]), ia32_cmp_branch_t);
 
        /* two-complement's magic make this work without overflow */
        interval = tbl.max_value - tbl.min_value;
@@ -464,12 +613,11 @@ void emit_ia32_SwitchJmp(const ir_node *irn, emit_env_t *emit_env) {
        if (do_jmp_tbl) {
                /* emit the table */
                if (tbl.min_value != 0) {
-                       fprintf(F, "\tcmpl %lu, -%d", interval, tbl.min_value);
-                       lc_efprintf(env, F, "(%1s)\t\t/* first switch value is not 0 */\n", irn);
+                       lc_efprintf(env, F, "\tcmpl %lu, -%d(%1S)\t\t/* first switch value is not 0 */\n",
+                               interval, tbl.min_value, irn);
                }
                else {
-                       fprintf(F, "\tcmpl %lu, ", interval);
-                       lc_efprintf(env, F, "%1s\t\t\t/* compare for switch */\n", irn);
+                       lc_efprintf(env, F, "\tcmpl %lu, %1S\t\t\t/* compare for switch */\n", interval, irn);
                }
 
                fprintf(F, "\tja %s\t\t\t/* default jump if out of range  */\n", get_cfop_target(tbl.defProj, buf));
@@ -477,8 +625,7 @@ void emit_ia32_SwitchJmp(const ir_node *irn, emit_env_t *emit_env) {
                if (tbl.num_branches > 1) {
                        /* create table */
 
-                       fprintf(F, "\tjmp *%s", tbl.label);
-                       lc_efprintf(env, F, "(,%1s,4)\t\t/* get jump table entry as target */\n", irn);
+                       lc_efprintf(env, F, "\tjmp [%1S*4+%s]\t\t/* get jump table entry as target */\n", irn, tbl.label);
 
                        fprintf(F, "\t.section\t.rodata\t\t/* start jump table */\n");
                        fprintf(F, "\t.align 4\n");
@@ -503,15 +650,15 @@ void emit_ia32_SwitchJmp(const ir_node *irn, emit_env_t *emit_env) {
        }
        else { // no jump table
                for (i = 0; i < tbl.num_branches; ++i) {
-                       fprintf(F, "\tcmpl %d, ", tbl.branches[i].value);
-                       lc_efprintf(env, F, "%1s", irn);
-                       fprintf(F, "\t\t\t/* case %d */\n", tbl.branches[i].value);
+                       lc_efprintf(env, F, "\tcmpl %d, %1S\t\t\t/* case %d */\n", tbl.branches[i].value, irn, i);
                        fprintf(F, "\tje %s\n", get_cfop_target(tbl.branches[i].target, buf));
                }
 
                fprintf(F, "\tjmp %s\t\t\t/* default case */\n", get_cfop_target(tbl.defProj, buf));
        }
 
+       if (tbl.label)
+               free(tbl.label);
        if (tbl.branches)
                free(tbl.branches);
 }
@@ -519,20 +666,33 @@ void emit_ia32_SwitchJmp(const ir_node *irn, emit_env_t *emit_env) {
 /**
  * Emits code for a unconditional jump.
  */
-void emit_Jmp(ir_node *irn, emit_env_t *env) {
+void emit_Jmp(const ir_node *irn, emit_env_t *env) {
        FILE *F = env->out;
 
        char buf[SNPRINTF_BUF_LEN];
        ir_fprintf(F, "\tjmp %s\t\t\t/* Jmp(%+F) */\n", get_cfop_target(irn, buf), get_irn_link(irn));
 }
 
+
+
+/****************************
+ *                  _
+ *                 (_)
+ *  _ __  _ __ ___  _  ___
+ * | '_ \| '__/ _ \| |/ __|
+ * | |_) | | | (_) | |\__ \
+ * | .__/|_|  \___/| ||___/
+ * | |            _/ |
+ * |_|           |__/
+ ****************************/
+
 /**
  * Emits code for a proj -> node
  */
-void emit_Proj(ir_node *irn, emit_env_t *env) {
+void emit_Proj(const ir_node *irn, emit_env_t *env) {
        ir_node *pred = get_Proj_pred(irn);
 
-       if (get_irn_opcode(pred) == iro_Start) {
+       if (get_irn_op(pred) == op_Start) {
                switch(get_Proj_proj(irn)) {
                        case pn_Start_X_initial_exec:
                                emit_Jmp(irn, env);
@@ -543,98 +703,196 @@ void emit_Proj(ir_node *irn, emit_env_t *env) {
        }
 }
 
-/**
- * Main emitting function
- */
-void ia32_emit_node(ir_node *irn, void *env) {
-       emit_env_t *emit_env   = env;
-       firm_dbg_module_t *mod = emit_env->mod;
-       FILE              *F   = emit_env->out;
+/**********************************
+ *   _____                  ____
+ *  / ____|                |  _ \
+ * | |     ___  _ __  _   _| |_) |
+ * | |    / _ \| '_ \| | | |  _ <
+ * | |___| (_) | |_) | |_| | |_) |
+ *  \_____\___/| .__/ \__, |____/
+ *             | |     __/ |
+ *             |_|    |___/
+ **********************************/
+
+static void emit_CopyB_prolog(FILE *F, int rem, int size) {
+       fprintf(F, "\t/* memcopy %d bytes*/\n", size);
+       fprintf(F, "\tcld\t\t\t\t/* copy direction forward*/\n");
+
+       switch(rem) {
+               case 1:
+                       fprintf(F, "\tmovsb\t\t\t\t/* memcopy remainder 1 */\n");
+                       break;
+               case 2:
+                       fprintf(F, "\tmovsw\t\t\t\t/* memcopy remainder 2 */\n");
+                       break;
+               case 3:
+                       fprintf(F, "\tmovsb\t\t\t\t/* memcopy remainder 3 */\n");
+                       fprintf(F, "\tmovsw\t\t\t\t/* memcopy remainder 3 */\n");
+                       break;
+       }
+}
 
-       DBG((mod, LEVEL_1, "emitting code for %+F\n", irn));
+void emit_ia32_CopyB(const ir_node *irn, emit_env_t *emit_env) {
+       FILE   *F    = emit_env->out;
+       tarval *tv   = get_ia32_Immop_tarval(irn);
+       int     rem  = get_tarval_long(tv);
+       int     size = get_tarval_long(get_ia32_Immop_tarval(get_irn_n(irn, 2)));
 
-#define IA32_EMIT(a) if (is_ia32_##a(irn))               { emit_ia32_##a(irn, emit_env); return; }
-#define EMIT(a)      if (get_irn_opcode(irn) == iro_##a) { emit_##a(irn, emit_env); return; }
+       emit_CopyB_prolog(F, rem, size);
 
-       /* generated int emitter functions */
-       IA32_EMIT(Const);
+       fprintf(F, "\trep movsd\t\t\t\t/* memcopy */\n");
+}
 
-       IA32_EMIT(Add);
-       IA32_EMIT(Add_i);
-       IA32_EMIT(Sub);
-       IA32_EMIT(Sub_i);
-       IA32_EMIT(Minus);
-       IA32_EMIT(Inc);
-       IA32_EMIT(Dec);
+void emit_ia32_CopyB_i(const ir_node *irn, emit_env_t *emit_env) {
+       tarval *tv   = get_ia32_Immop_tarval(irn);
+       int     size = get_tarval_long(tv);
+       FILE   *F    = emit_env->out;
 
-       IA32_EMIT(Max);
-       IA32_EMIT(Min);
+       emit_CopyB_prolog(F, size & 0x3, size);
 
-       IA32_EMIT(And);
-       IA32_EMIT(And_i);
-       IA32_EMIT(Or);
-       IA32_EMIT(Or_i);
-       IA32_EMIT(Eor);
-       IA32_EMIT(Eor_i);
-       IA32_EMIT(Not);
+       size >>= 2;
+       while (size--) {
+               fprintf(F, "\tmovsd\t\t\t\t/* memcopy unrolled */\n");
+       }
+}
 
-       IA32_EMIT(Shl);
-       IA32_EMIT(Shl_i);
-       IA32_EMIT(Shr);
-       IA32_EMIT(Shr_i);
-       IA32_EMIT(Shrs);
-       IA32_EMIT(Shrs_i);
-       IA32_EMIT(RotL);
-       IA32_EMIT(RotL_i);
-       IA32_EMIT(RotR);
 
-       IA32_EMIT(Lea);
-       IA32_EMIT(Lea_i);
 
-       IA32_EMIT(Mul);
-       IA32_EMIT(Mul_i);
-       IA32_EMIT(Mulh);
-       IA32_EMIT(Mulh_i);
+/*******************************************
+ *  _                          _
+ * | |                        | |
+ * | |__   ___ _ __   ___   __| | ___  ___
+ * | '_ \ / _ \ '_ \ / _ \ / _` |/ _ \/ __|
+ * | |_) |  __/ | | | (_) | (_| |  __/\__ \
+ * |_.__/ \___|_| |_|\___/ \__,_|\___||___/
+ *
+ *******************************************/
 
-       IA32_EMIT(Cltd);
-       IA32_EMIT(DivMod);
+void emit_be_Call(const ir_node *irn, emit_env_t *emit_env) {
+       FILE *F = emit_env->out;
+       entity *ent = be_Call_get_entity(irn);
 
-       IA32_EMIT(Store);
-       IA32_EMIT(Load);
+       fprintf(F, "\tcall ");
 
-       /* generated floating point emitter */
-       IA32_EMIT(fConst);
+       if (ent) {
+               fprintf(F, "%s", get_entity_name(ent));
+       }
+       else {
+               lc_efprintf(ia32_get_arg_env(), F, "%1D", get_irn_n(irn, be_pos_Call_ptr));
+       }
 
-       IA32_EMIT(fAdd);
-       IA32_EMIT(fSub);
-       IA32_EMIT(fMinus);
+       ir_fprintf(F, "\t\t\t/* %+F (be_Call) */\n", irn);
+}
 
-       IA32_EMIT(fMul);
-       IA32_EMIT(fDiv);
+void emit_be_IncSP(const ir_node *irn, emit_env_t *emit_env) {
+       FILE          *F    = emit_env->out;
+       unsigned       offs = be_get_IncSP_offset(irn);
+       be_stack_dir_t dir  = be_get_IncSP_direction(irn);
 
-       IA32_EMIT(fMin);
-       IA32_EMIT(fMax);
+       if (offs) {
+               lc_efprintf(ia32_get_arg_env(), F, "\tadd %1S,%s%u\t\t\t/* %+F (IncSP) */\n", irn,
+                       (dir == be_stack_dir_along) ? " -" : " ", offs, irn);
+       }
+       else {
+               fprintf(F, "\t\t\t\t\t/* omitted IncSP with 0 */\n");
+       }
+}
+
+void emit_be_SetSP(const ir_node *irn, emit_env_t *emit_env) {
+       FILE *F = emit_env->out;
+
+       lc_efprintf(ia32_get_arg_env(), F, "\tmov %1D,%3S\t\t\t/* restore SP */\n", irn, irn);
+}
 
-       IA32_EMIT(fLoad);
-       IA32_EMIT(fStore);
+void emit_be_Copy(const ir_node *irn, emit_env_t *emit_env) {
+       FILE *F = emit_env->out;
+
+       lc_efprintf(ia32_get_arg_env(), F, "\tmov %1D,%1S\t\t\t/* %+F */\n", irn, irn, irn);
+}
+
+void emit_be_Perm(const ir_node *irn, emit_env_t *emit_env) {
+       FILE *F = emit_env->out;
+
+       lc_efprintf(ia32_get_arg_env(), F, "\txchg %1S, %2S\t\t\t/* %+F(%1A, %2A) */\n", irn, irn, irn);
+}
 
-       /* other emitter functions */
+/***********************************************************************************
+ *                  _          __                                             _
+ *                 (_)        / _|                                           | |
+ *  _ __ ___   __ _ _ _ __   | |_ _ __ __ _ _ __ ___   _____      _____  _ __| | __
+ * | '_ ` _ \ / _` | | '_ \  |  _| '__/ _` | '_ ` _ \ / _ \ \ /\ / / _ \| '__| |/ /
+ * | | | | | | (_| | | | | | | | | | | (_| | | | | | |  __/\ V  V / (_) | |  |   <
+ * |_| |_| |_|\__,_|_|_| |_| |_| |_|  \__,_|_| |_| |_|\___| \_/\_/ \___/|_|  |_|\_\
+ *
+ ***********************************************************************************/
+
+/**
+ * Enters the emitter functions for handled nodes into the generic
+ * pointer of an opcode.
+ */
+static void ia32_register_emitters(void) {
+
+#define IA32_EMIT(a) op_ia32_##a->ops.generic = (op_func)emit_ia32_##a
+#define EMIT(a)      op_##a->ops.generic = (op_func)emit_##a
+#define BE_EMIT(a)   op_be_##a->ops.generic = (op_func)emit_be_##a
+
+       /* first clear the generic function pointer for all ops */
+       clear_irp_opcodes_generic_func();
+
+       /* register all emitter functions defined in spec */
+       ia32_register_spec_emitters();
+
+       /* other ia32 emitter functions */
        IA32_EMIT(CondJmp);
-       IA32_EMIT(CondJmp_i);
        IA32_EMIT(SwitchJmp);
+       IA32_EMIT(CopyB);
+       IA32_EMIT(CopyB_i);
+
+       /* benode emitter */
+       BE_EMIT(Call);
+       BE_EMIT(IncSP);
+       BE_EMIT(SetSP);
+       BE_EMIT(Copy);
+       BE_EMIT(Perm);
 
+       /* firm emitter */
        EMIT(Jmp);
        EMIT(Proj);
 
-       ir_fprintf(F, "\t\t\t\t\t/* %+F */\n", irn);
+#undef IA32_EMIT
+#undef BE_EMIT
+#undef EMIT
+}
+
+/**
+ * Emits code for a node.
+ */
+static void ia32_emit_node(const ir_node *irn, void *env) {
+       emit_env_t        *emit_env = env;
+       firm_dbg_module_t *mod      = emit_env->mod;
+       FILE              *F        = emit_env->out;
+       ir_op             *op       = get_irn_op(irn);
+
+       DBG((mod, LEVEL_1, "emitting code for %+F\n", irn));
+
+       if (op->ops.generic) {
+               void (*emit)(const ir_node *, void *) = (void (*)(const ir_node *, void *))op->ops.generic;
+               (*emit)(irn, env);
+       }
+       else {
+               ir_fprintf(F, "\t\t\t\t\t/* %+F */\n", irn);
+       }
 }
 
 /**
  * Walks over the nodes in a block connected by scheduling edges
  * and emits code for each node.
  */
-void ia32_gen_block(ir_node *block, void *env) {
-       ir_node *irn;
+static void ia32_gen_block(ir_node *block, void *env) {
+       const ir_node *irn;
+
+       if (! is_Block(block))
+               return;
 
        fprintf(((emit_env_t *)env)->out, "BLOCK_%ld:\n", get_irn_node_nr(block));
        sched_foreach(block, irn) {
@@ -646,7 +904,7 @@ void ia32_gen_block(ir_node *block, void *env) {
 /**
  * Emits code for function start.
  */
-void ia32_emit_start(FILE *F, ir_graph *irg) {
+static void ia32_emit_func_prolog(FILE *F, ir_graph *irg) {
        const char *irg_name = get_entity_name(get_irg_entity(irg));
 
        fprintf(F, "\t.text\n");
@@ -658,7 +916,7 @@ void ia32_emit_start(FILE *F, ir_graph *irg) {
 /**
  * Emits code for function end
  */
-void ia32_emit_end(FILE *F, ir_graph *irg) {
+static void ia32_emit_func_epilog(FILE *F, ir_graph *irg) {
        const char *irg_name = get_entity_name(get_irg_entity(irg));
 
        fprintf(F, "\tret\n");
@@ -669,7 +927,7 @@ void ia32_emit_end(FILE *F, ir_graph *irg) {
  * Sets labels for control flow nodes (jump target)
  * TODO: Jump optimization
  */
-void ia32_gen_labels(ir_node *block, void *env) {
+static void ia32_gen_labels(ir_node *block, void *env) {
        ir_node *pred;
        int n = get_Block_n_cfgpreds(block);
 
@@ -680,19 +938,23 @@ void ia32_gen_labels(ir_node *block, void *env) {
 }
 
 /**
- * Main driver
+ * Main driver. Emits the code for one routine.
  */
-void ia32_gen_routine(FILE *F, ir_graph *irg, set *reg_set) {
+void ia32_gen_routine(FILE *F, ir_graph *irg, const ia32_code_gen_t *cg) {
        emit_env_t emit_env;
 
-       emit_env.mod     = firm_dbg_register("be.codegen.ia32");
-       emit_env.out     = F;
-       emit_env.reg_set = reg_set;
+       emit_env.mod      = firm_dbg_register("ir.be.codegen.ia32");
+       emit_env.out      = F;
+       emit_env.arch_env = cg->arch_env;
+       emit_env.cg       = cg;
+
+       /* set the global arch_env (needed by print hooks) */
+       arch_env = cg->arch_env;
 
-       cur_reg_set = reg_set;
+       ia32_register_emitters();
 
-       ia32_emit_start(F, irg);
+       ia32_emit_func_prolog(F, irg);
        irg_block_walk_graph(irg, ia32_gen_labels, NULL, &emit_env);
-       irg_block_walk_graph(irg, NULL, ia32_gen_block, &emit_env);
-       ia32_emit_end(F, irg);
+       irg_walk_blkwise_graph(irg, NULL, ia32_gen_block, &emit_env);
+       ia32_emit_func_epilog(F, irg);
 }