Implement binary emitter for fdivr.
[libfirm] / ir / be / ia32 / bearch_ia32.c
index 9926309..5076630 100644 (file)
 #include "instrument.h"
 
 #include "../beabi.h"
-#include "../beirg_t.h"
-#include "../benode_t.h"
+#include "../beirg.h"
+#include "../benode.h"
 #include "../belower.h"
-#include "../besched_t.h"
+#include "../besched.h"
 #include "be.h"
 #include "../be_t.h"
 #include "../beirgmod.h"
@@ -69,6 +69,7 @@
 #include "../bestate.h"
 #include "../beflags.h"
 #include "../betranshlp.h"
+#include "../belistsched.h"
 
 #include "bearch_ia32_t.h"
 
@@ -95,9 +96,6 @@ transformer_t be_transformer = TRANSFORMER_DEFAULT;
 
 DEBUG_ONLY(static firm_dbg_module_t *dbg = NULL;)
 
-/* TODO: ugly */
-static set *cur_reg_set = NULL;
-
 ir_mode         *mode_fpcw       = NULL;
 ia32_code_gen_t *ia32_current_cg = NULL;
 
@@ -125,7 +123,7 @@ static ia32_intrinsic_env_t intrinsic_env = {
 typedef ir_node *(*create_const_node_func) (dbg_info *dbg, ir_node *block);
 
 /**
- * Used to create a Pseudo-Register or Unknown node.
+ * Used to create per-graph unique pseudo nodes.
  */
 static inline ir_node *create_const(ia32_code_gen_t *cg, ir_node **place,
                                     create_const_node_func func,
@@ -145,37 +143,44 @@ static inline ir_node *create_const(ia32_code_gen_t *cg, ir_node **place,
 }
 
 /* Creates the unique per irg GP NoReg node. */
-ir_node *ia32_new_NoReg_gp(ia32_code_gen_t *cg) {
+ir_node *ia32_new_NoReg_gp(ia32_code_gen_t *cg)
+{
        return create_const(cg, &cg->noreg_gp, new_bd_ia32_NoReg_GP,
                            &ia32_gp_regs[REG_GP_NOREG]);
 }
 
-ir_node *ia32_new_NoReg_vfp(ia32_code_gen_t *cg) {
+ir_node *ia32_new_NoReg_vfp(ia32_code_gen_t *cg)
+{
        return create_const(cg, &cg->noreg_vfp, new_bd_ia32_NoReg_VFP,
                            &ia32_vfp_regs[REG_VFP_NOREG]);
 }
 
-ir_node *ia32_new_NoReg_xmm(ia32_code_gen_t *cg) {
+ir_node *ia32_new_NoReg_xmm(ia32_code_gen_t *cg)
+{
        return create_const(cg, &cg->noreg_xmm, new_bd_ia32_NoReg_XMM,
                            &ia32_xmm_regs[REG_XMM_NOREG]);
 }
 
-ir_node *ia32_new_Unknown_gp(ia32_code_gen_t *cg) {
+ir_node *ia32_new_Unknown_gp(ia32_code_gen_t *cg)
+{
        return create_const(cg, &cg->unknown_gp, new_bd_ia32_Unknown_GP,
                            &ia32_gp_regs[REG_GP_UKNWN]);
 }
 
-ir_node *ia32_new_Unknown_vfp(ia32_code_gen_t *cg) {
+ir_node *ia32_new_Unknown_vfp(ia32_code_gen_t *cg)
+{
        return create_const(cg, &cg->unknown_vfp, new_bd_ia32_Unknown_VFP,
                            &ia32_vfp_regs[REG_VFP_UKNWN]);
 }
 
-ir_node *ia32_new_Unknown_xmm(ia32_code_gen_t *cg) {
+ir_node *ia32_new_Unknown_xmm(ia32_code_gen_t *cg)
+{
        return create_const(cg, &cg->unknown_xmm, new_bd_ia32_Unknown_XMM,
                            &ia32_xmm_regs[REG_XMM_UKNWN]);
 }
 
-ir_node *ia32_new_Fpu_truncate(ia32_code_gen_t *cg) {
+ir_node *ia32_new_Fpu_truncate(ia32_code_gen_t *cg)
+{
        return create_const(cg, &cg->fpu_trunc_mode, new_bd_ia32_ChangeCW,
                         &ia32_fp_cw_regs[REG_FPCW]);
 }
@@ -210,61 +215,19 @@ static ir_node *ia32_get_admissible_noreg(ia32_code_gen_t *cg, ir_node *irn, int
  *           |___/
  **************************************************/
 
-/**
- * Return register requirements for an ia32 node.
- * If the node returns a tuple (mode_T) then the proj's
- * will be asked for this information.
- */
-static const arch_register_req_t *ia32_get_irn_reg_req(const ir_node *node,
-                                                                                                          int pos)
+static const arch_register_req_t *get_ia32_SwitchJmp_out_req(
+               const ir_node *node, int pos)
 {
-       ir_mode *mode = get_irn_mode(node);
-       long    node_pos;
-
-       if (mode == mode_X || is_Block(node)) {
-               return arch_no_register_req;
-       }
-
-       if (mode == mode_T && pos < 0) {
-               return arch_no_register_req;
-       }
-
-       node_pos = pos == -1 ? 0 : pos;
-       if (is_Proj(node)) {
-               if (mode == mode_M || pos >= 0) {
-                       return arch_no_register_req;
-               }
-
-               node_pos = (pos == -1) ? get_Proj_proj(node) : pos;
-               node     = skip_Proj_const(node);
-       }
-
-       if (is_ia32_irn(node)) {
-               const arch_register_req_t *req;
-               if (pos >= 0)
-                       req = get_ia32_in_req(node, pos);
-               else
-                       req = get_ia32_out_req(node, node_pos);
-
-               assert(req != NULL);
-
-               return req;
-       }
-
-       /* unknowns should be transformed already */
+       (void) node;
+       (void) pos;
        return arch_no_register_req;
 }
 
-static arch_irn_class_t ia32_classify(const ir_node *irn) {
+static arch_irn_class_t ia32_classify(const ir_node *irn)
+{
        arch_irn_class_t classification = 0;
 
-       irn = skip_Proj_const(irn);
-
-       if (is_cfop(irn))
-               classification |= arch_irn_class_branch;
-
-       if (! is_ia32_irn(irn))
-               return classification;
+       assert(is_ia32_irn(irn));
 
        if (is_ia32_is_reload(irn))
                classification |= arch_irn_class_reload;
@@ -287,11 +250,13 @@ typedef struct {
        ir_graph *irg;                   /**< The associated graph. */
 } ia32_abi_env_t;
 
-static ir_entity *ia32_get_frame_entity(const ir_node *irn) {
+static ir_entity *ia32_get_frame_entity(const ir_node *irn)
+{
        return is_ia32_irn(irn) ? get_ia32_frame_ent(irn) : NULL;
 }
 
-static void ia32_set_frame_entity(ir_node *irn, ir_entity *ent) {
+static void ia32_set_frame_entity(ir_node *irn, ir_entity *ent)
+{
        set_ia32_frame_ent(irn, ent);
 }
 
@@ -347,8 +312,7 @@ static const arch_register_t *ia32_abi_prologue(void *self, ir_node **mem, pmap
 
        ia32_curr_fp_ommitted = env->flags.try_omit_fp;
        if (! env->flags.try_omit_fp) {
-               ir_graph *irg     = env->irg;
-               ir_node  *bl      = get_irg_start_block(irg);
+               ir_node  *bl      = get_irg_start_block(env->irg);
                ir_node  *curr_sp = be_abi_reg_map_get(reg_map, arch_env->sp);
                ir_node  *curr_bp = be_abi_reg_map_get(reg_map, arch_env->bp);
                ir_node  *noreg   = ia32_new_NoReg_gp(cg);
@@ -360,8 +324,8 @@ static const arch_register_t *ia32_abi_prologue(void *self, ir_node **mem, pmap
 
                /* push ebp */
                push    = new_bd_ia32_Push(NULL, bl, noreg, noreg, *mem, curr_bp, curr_sp);
-               curr_sp = new_r_Proj(irg, bl, push, get_irn_mode(curr_sp), pn_ia32_Push_stack);
-               *mem    = new_r_Proj(irg, bl, push, mode_M, pn_ia32_Push_M);
+               curr_sp = new_r_Proj(bl, push, get_irn_mode(curr_sp), pn_ia32_Push_stack);
+               *mem    = new_r_Proj(bl, push, mode_M, pn_ia32_Push_M);
 
                /* the push must have SP out register */
                arch_set_irn_register(curr_sp, arch_env->sp);
@@ -370,12 +334,12 @@ static const arch_register_t *ia32_abi_prologue(void *self, ir_node **mem, pmap
                *stack_bias -= 4;
 
                /* move esp to ebp */
-               curr_bp = be_new_Copy(arch_env->bp->reg_class, irg, bl, curr_sp);
+               curr_bp = be_new_Copy(arch_env->bp->reg_class, bl, curr_sp);
                be_set_constr_single_reg_out(curr_bp, 0, arch_env->bp,
                                             arch_register_req_type_ignore);
 
                /* beware: the copy must be done before any other sp use */
-               curr_sp = be_new_CopyKeep_single(arch_env->sp->reg_class, irg, bl, curr_sp, curr_bp, get_irn_mode(curr_sp));
+               curr_sp = be_new_CopyKeep_single(arch_env->sp->reg_class, bl, curr_sp, curr_bp, get_irn_mode(curr_sp));
                be_set_constr_single_reg_out(curr_sp, 0, arch_env->sp,
                                                     arch_register_req_type_produces_sp);
 
@@ -404,11 +368,10 @@ static void ia32_abi_epilogue(void *self, ir_node *bl, ir_node **mem, pmap *reg_
        const arch_env_t *arch_env = env->aenv;
        ir_node          *curr_sp  = be_abi_reg_map_get(reg_map, arch_env->sp);
        ir_node          *curr_bp  = be_abi_reg_map_get(reg_map, arch_env->bp);
-       ir_graph         *irg      = env->irg;
 
        if (env->flags.try_omit_fp) {
                /* simply remove the stack frame here */
-               curr_sp = be_new_IncSP(arch_env->sp, irg, bl, curr_sp, BE_STACK_FRAME_SIZE_SHRINK, 0);
+               curr_sp = be_new_IncSP(arch_env->sp, bl, curr_sp, BE_STACK_FRAME_SIZE_SHRINK, 0);
        } else {
                ir_mode *mode_bp = arch_env->bp->reg_class->mode;
 
@@ -417,8 +380,8 @@ static void ia32_abi_epilogue(void *self, ir_node *bl, ir_node **mem, pmap *reg_
 
                        /* leave */
                        leave   = new_bd_ia32_Leave(NULL, bl, curr_bp);
-                       curr_bp = new_r_Proj(irg, bl, leave, mode_bp, pn_ia32_Leave_frame);
-                       curr_sp = new_r_Proj(irg, bl, leave, get_irn_mode(curr_sp), pn_ia32_Leave_stack);
+                       curr_bp = new_r_Proj(bl, leave, mode_bp, pn_ia32_Leave_frame);
+                       curr_sp = new_r_Proj(bl, leave, get_irn_mode(curr_sp), pn_ia32_Leave_stack);
                } else {
                        ir_node *pop;
 
@@ -427,17 +390,17 @@ static void ia32_abi_epilogue(void *self, ir_node *bl, ir_node **mem, pmap *reg_
                        kill_node(curr_sp);
 
                        /* copy ebp to esp */
-                       curr_sp = be_new_Copy(&ia32_reg_classes[CLASS_ia32_gp], irg, bl, curr_bp);
+                       curr_sp = be_new_Copy(&ia32_reg_classes[CLASS_ia32_gp], bl, curr_bp);
                        arch_set_irn_register(curr_sp, arch_env->sp);
                        be_set_constr_single_reg_out(curr_sp, 0, arch_env->sp,
                                                         arch_register_req_type_ignore);
 
                        /* pop ebp */
                        pop     = new_bd_ia32_PopEbp(NULL, bl, *mem, curr_sp);
-                       curr_bp = new_r_Proj(irg, bl, pop, mode_bp, pn_ia32_Pop_res);
-                       curr_sp = new_r_Proj(irg, bl, pop, get_irn_mode(curr_sp), pn_ia32_Pop_stack);
+                       curr_bp = new_r_Proj(bl, pop, mode_bp, pn_ia32_Pop_res);
+                       curr_sp = new_r_Proj(bl, pop, get_irn_mode(curr_sp), pn_ia32_Pop_stack);
 
-                       *mem = new_r_Proj(irg, bl, pop, mode_M, pn_ia32_Pop_M);
+                       *mem = new_r_Proj(bl, pop, mode_M, pn_ia32_Pop_M);
                }
                arch_set_irn_register(curr_sp, arch_env->sp);
                arch_set_irn_register(curr_bp, arch_env->bp);
@@ -468,14 +431,16 @@ static void *ia32_abi_init(const be_abi_call_t *call, const arch_env_t *aenv, ir
  * Destroy the callback object.
  * @param self The callback object.
  */
-static void ia32_abi_done(void *self) {
+static void ia32_abi_done(void *self)
+{
        free(self);
 }
 
 /**
  * Build the between type and entities if not already build.
  */
-static void ia32_build_between_type(void) {
+static void ia32_build_between_type(void)
+{
 #define IDENT(s) new_id_from_chars(s, sizeof(s)-1)
        if (! between_type) {
                ir_type *old_bp_type   = new_type_primitive(IDENT("bp"), mode_Iu);
@@ -516,7 +481,8 @@ static ir_type *ia32_abi_get_between_type(void *self)
 /**
  * Return the stack entity that contains the return address.
  */
-ir_entity *ia32_get_return_address_entity(void) {
+ir_entity *ia32_get_return_address_entity(void)
+{
        ia32_build_between_type();
        return ia32_curr_fp_ommitted ? omit_fp_ret_addr_ent : ret_addr_ent;
 }
@@ -524,7 +490,8 @@ ir_entity *ia32_get_return_address_entity(void) {
 /**
  * Return the stack entity that contains the frame address.
  */
-ir_entity *ia32_get_frame_address_entity(void) {
+ir_entity *ia32_get_frame_address_entity(void)
+{
        ia32_build_between_type();
        return ia32_curr_fp_ommitted ? NULL : old_bp_ent;
 }
@@ -588,7 +555,8 @@ static int ia32_get_op_estimated_cost(const ir_node *irn)
  * @param obstack   The obstack to use for allocation of the returned nodes array
  * @return          The inverse operation or NULL if operation invertible
  */
-static arch_inverse_t *ia32_get_inverse(const ir_node *irn, int i, arch_inverse_t *inverse, struct obstack *obst) {
+static arch_inverse_t *ia32_get_inverse(const ir_node *irn, int i, arch_inverse_t *inverse, struct obstack *obst)
+{
        ir_mode  *mode;
        ir_mode  *irn_mode;
        ir_node  *block, *noreg, *nomem;
@@ -834,10 +802,30 @@ static const be_abi_callbacks_t ia32_abi_callbacks = {
        ia32_abi_epilogue
 };
 
-/* fill register allocator interface */
-
+/* register allocator interface */
 static const arch_irn_ops_t ia32_irn_ops = {
-       ia32_get_irn_reg_req,
+       get_ia32_in_req,
+       ia32_classify,
+       ia32_get_frame_entity,
+       ia32_set_frame_entity,
+       ia32_set_frame_offset,
+       ia32_get_sp_bias,
+       ia32_get_inverse,
+       ia32_get_op_estimated_cost,
+       ia32_possible_memory_operand,
+       ia32_perform_memory_operand,
+};
+
+/* special register allocator interface for SwitchJmp
+   as it possibly has a WIDE range of Proj numbers.
+   We don't want to allocate output for register constraints for
+   all these. */
+static const arch_irn_ops_t ia32_SwitchJmp_irn_ops = {
+       /* Note: we also use SwitchJmp_out_req for the inputs too:
+          This is because the bearch API has a conceptual problem at the moment.
+          Querying for negative proj numbers which can happen for switchs
+          isn't possible and will result in inputs getting queried */
+       get_ia32_SwitchJmp_out_req,
        ia32_classify,
        ia32_get_frame_entity,
        ia32_set_frame_entity,
@@ -864,7 +852,8 @@ static ir_entity *mcount = NULL;
 
 #define ID(s) new_id_from_chars(s, sizeof(s) - 1)
 
-static void ia32_before_abi(void *self) {
+static void ia32_before_abi(void *self)
+{
        lower_mode_b_config_t lower_mode_b_config = {
                mode_Iu,  /* lowered mode */
                mode_Bu,  /* preferred mode for set */
@@ -893,27 +882,7 @@ static void ia32_before_abi(void *self) {
  */
 static void ia32_prepare_graph(void *self)
 {
-       ia32_code_gen_t *cg  = self;
-       ir_graph        *irg = cg->irg;
-
-       /* do local optimizations */
-       optimize_graph_df(irg);
-
-       /* we have to do cfopt+remove_critical_edges as we can't have Bad-blocks
-        * or critical edges in the backend */
-       optimize_cf(irg);
-       remove_critical_cf_edges(irg);
-
-       /* TODO: we often have dead code reachable through out-edges here. So for
-        * now we rebuild edges (as we need correct user count for code selection)
-        */
-#if 1
-       edges_deactivate(cg->irg);
-       edges_activate(cg->irg);
-#endif
-
-       if (cg->dump)
-               be_dump(cg->irg, "-pre_transform", dump_ir_block_graph_sched);
+       ia32_code_gen_t *cg = self;
 
        switch (be_transformer) {
        case TRANSFORMER_DEFAULT:
@@ -951,7 +920,6 @@ static void ia32_prepare_graph(void *self)
 
 ir_node *turn_back_am(ir_node *node)
 {
-       ir_graph *irg   = current_ir_graph;
        dbg_info *dbgi  = get_irn_dbg_info(node);
        ir_node  *block = get_nodes_block(node);
        ir_node  *base  = get_irn_n(node, n_ia32_base);
@@ -960,7 +928,7 @@ ir_node *turn_back_am(ir_node *node)
        ir_node  *noreg;
 
        ir_node  *load     = new_bd_ia32_Load(dbgi, block, base, index, mem);
-       ir_node  *load_res = new_rd_Proj(dbgi, irg, block, load, mode_Iu, pn_ia32_Load_res);
+       ir_node  *load_res = new_rd_Proj(dbgi, block, load, mode_Iu, pn_ia32_Load_res);
 
        ia32_copy_am_attrs(load, node);
        if (is_ia32_is_reload(node))
@@ -1048,7 +1016,8 @@ static ir_node *flags_remat(ir_node *node, ir_node *after)
 /**
  * Called before the register allocator.
  */
-static void ia32_before_ra(void *self) {
+static void ia32_before_ra(void *self)
+{
        ia32_code_gen_t *cg = self;
 
        /* setup fpu rounding modes */
@@ -1065,7 +1034,8 @@ static void ia32_before_ra(void *self) {
 /**
  * Transforms a be_Reload into a ia32 Load.
  */
-static void transform_to_Load(ia32_code_gen_t *cg, ir_node *node) {
+static void transform_to_Load(ia32_code_gen_t *cg, ir_node *node)
+{
        ir_graph *irg        = get_irn_irg(node);
        dbg_info *dbg        = get_irn_dbg_info(node);
        ir_node *block       = get_nodes_block(node);
@@ -1104,7 +1074,7 @@ static void transform_to_Load(ia32_code_gen_t *cg, ir_node *node) {
 
        DBG_OPT_RELOAD2LD(node, new_op);
 
-       proj = new_rd_Proj(dbg, irg, block, new_op, mode, pn_ia32_Load_res);
+       proj = new_rd_Proj(dbg, block, new_op, mode, pn_ia32_Load_res);
 
        if (sched_point) {
                sched_add_after(sched_point, new_op);
@@ -1123,7 +1093,8 @@ static void transform_to_Load(ia32_code_gen_t *cg, ir_node *node) {
 /**
  * Transforms a be_Spill node into a ia32 Store.
  */
-static void transform_to_Store(ia32_code_gen_t *cg, ir_node *node) {
+static void transform_to_Store(ia32_code_gen_t *cg, ir_node *node)
+{
        ir_graph *irg  = get_irn_irg(node);
        dbg_info *dbg  = get_irn_dbg_info(node);
        ir_node *block = get_nodes_block(node);
@@ -1183,7 +1154,8 @@ static void transform_to_Store(ia32_code_gen_t *cg, ir_node *node) {
        exchange(node, store);
 }
 
-static ir_node *create_push(ia32_code_gen_t *cg, ir_node *node, ir_node *schedpoint, ir_node *sp, ir_node *mem, ir_entity *ent) {
+static ir_node *create_push(ia32_code_gen_t *cg, ir_node *node, ir_node *schedpoint, ir_node *sp, ir_node *mem, ir_entity *ent)
+{
        dbg_info *dbg = get_irn_dbg_info(node);
        ir_node *block = get_nodes_block(node);
        ir_node *noreg = ia32_new_NoReg_gp(cg);
@@ -1202,11 +1174,12 @@ static ir_node *create_push(ia32_code_gen_t *cg, ir_node *node, ir_node *schedpo
        return push;
 }
 
-static ir_node *create_pop(ia32_code_gen_t *cg, ir_node *node, ir_node *schedpoint, ir_node *sp, ir_entity *ent) {
+static ir_node *create_pop(ia32_code_gen_t *cg, ir_node *node, ir_node *schedpoint, ir_node *sp, ir_entity *ent)
+{
        dbg_info *dbg = get_irn_dbg_info(node);
        ir_node *block = get_nodes_block(node);
        ir_node *noreg = ia32_new_NoReg_gp(cg);
-       ir_graph *irg = get_irn_irg(node);
+       ir_graph *irg  = get_irn_irg(node);
        ir_node *frame = get_irg_frame(irg);
 
        ir_node *pop = new_bd_ia32_PopMem(dbg, block, frame, noreg, new_NoMem(), sp);
@@ -1224,14 +1197,13 @@ static ir_node *create_pop(ia32_code_gen_t *cg, ir_node *node, ir_node *schedpoi
 
 static ir_node* create_spproj(ir_node *node, ir_node *pred, int pos)
 {
-       ir_graph *irg = get_irn_irg(node);
        dbg_info *dbg = get_irn_dbg_info(node);
        ir_node *block = get_nodes_block(node);
        ir_mode *spmode = mode_Iu;
        const arch_register_t *spreg = &ia32_gp_regs[REG_ESP];
        ir_node *sp;
 
-       sp = new_rd_Proj(dbg, irg, block, pred, spmode, pos);
+       sp = new_rd_Proj(dbg, block, pred, spmode, pos);
        arch_set_irn_register(sp, spreg);
 
        return sp;
@@ -1244,7 +1216,6 @@ static ir_node* create_spproj(ir_node *node, ir_node *pred, int pos)
  */
 static void transform_MemPerm(ia32_code_gen_t *cg, ir_node *node)
 {
-       ir_graph        *irg   = get_irn_irg(node);
        ir_node         *block = get_nodes_block(node);
        ir_node         *sp    = be_abi_get_ignore_irn(cg->birg->abi, &ia32_gp_regs[REG_ESP]);
        int              arity = be_get_MemPerm_entity_arity(node);
@@ -1310,7 +1281,7 @@ static void transform_MemPerm(ia32_code_gen_t *cg, ir_node *node)
        }
 
        in[0] = sp;
-       keep  = be_new_Keep(&ia32_reg_classes[CLASS_ia32_gp], irg, block, 1, in);
+       keep  = be_new_Keep(block, 1, in);
        sched_add_before(node, keep);
 
        /* exchange memprojs */
@@ -1335,7 +1306,8 @@ static void transform_MemPerm(ia32_code_gen_t *cg, ir_node *node)
 /**
  * Block-Walker: Calls the transform functions Spill and Reload.
  */
-static void ia32_after_ra_walker(ir_node *block, void *env) {
+static void ia32_after_ra_walker(ir_node *block, void *env)
+{
        ir_node *node, *prev;
        ia32_code_gen_t *cg = env;
 
@@ -1431,7 +1403,8 @@ need_stackent:
  * We transform Spill and Reload here. This needs to be done before
  * stack biasing otherwise we would miss the corrected offset for these nodes.
  */
-static void ia32_after_ra(void *self) {
+static void ia32_after_ra(void *self)
+{
        ia32_code_gen_t *cg = self;
        ir_graph *irg = cg->irg;
        be_fec_env_t *fec_env = be_new_frame_entity_coalescer(cg->birg);
@@ -1449,7 +1422,8 @@ static void ia32_after_ra(void *self) {
  * virtual with real x87 instructions, creating a block schedule and peephole
  * optimisations.
  */
-static void ia32_finish(void *self) {
+static void ia32_finish(void *self)
+{
        ia32_code_gen_t *cg = self;
        ir_graph        *irg = cg->irg;
 
@@ -1472,13 +1446,16 @@ static void ia32_finish(void *self) {
  * Emits the code, closes the output file and frees
  * the code generator interface.
  */
-static void ia32_codegen(void *self) {
+static void ia32_codegen(void *self)
+{
        ia32_code_gen_t *cg = self;
        ir_graph        *irg = cg->irg;
 
-       ia32_gen_routine(cg, irg);
-
-       cur_reg_set = NULL;
+       if (ia32_cg_config.emit_machcode) {
+               ia32_gen_binary_routine(cg, irg);
+       } else {
+               ia32_gen_routine(cg, irg);
+       }
 
        /* remove it from the isa */
        cg->isa->cg = NULL;
@@ -1487,14 +1464,14 @@ static void ia32_codegen(void *self) {
        ia32_current_cg = NULL;
 
        /* de-allocate code generator */
-       del_set(cg->reg_set);
        free(cg);
 }
 
 /**
  * Returns the node representing the PIC base.
  */
-static ir_node *ia32_get_pic_base(void *self) {
+static ir_node *ia32_get_pic_base(void *self)
+{
        ir_node         *block;
        ia32_code_gen_t *cg      = self;
        ir_node         *get_eip = cg->get_eip;
@@ -1526,13 +1503,13 @@ static const arch_code_generator_if_t ia32_code_gen_if = {
 /**
  * Initializes a IA32 code generator.
  */
-static void *ia32_cg_init(be_irg_t *birg) {
+static void *ia32_cg_init(be_irg_t *birg)
+{
        ia32_isa_t      *isa = (ia32_isa_t *)birg->main_env->arch_env;
        ia32_code_gen_t *cg  = XMALLOCZ(ia32_code_gen_t);
 
        cg->impl      = &ia32_code_gen_if;
        cg->irg       = birg->irg;
-       cg->reg_set   = new_set(ia32_cmp_irn_reg_assoc, 1024);
        cg->isa       = isa;
        cg->birg      = birg;
        cg->blk_sched = NULL;
@@ -1554,8 +1531,6 @@ static void *ia32_cg_init(be_irg_t *birg) {
        }
 #endif /* NDEBUG */
 
-       cur_reg_set = cg->reg_set;
-
        assert(ia32_current_cg == NULL);
        ia32_current_cg = cg;
 
@@ -1610,6 +1585,7 @@ static ia32_isa_t ia32_isa_template = {
                &ia32_isa_if,            /* isa interface implementation */
                &ia32_gp_regs[REG_ESP],  /* stack pointer register */
                &ia32_gp_regs[REG_EBP],  /* base pointer register */
+               &ia32_reg_classes[CLASS_ia32_gp],  /* static link pointer register class */
                -1,                      /* stack direction */
                2,                       /* power of two stack alignment, 2^2 == 4 */
                NULL,                    /* main environment */
@@ -1678,7 +1654,8 @@ static void init_asm_constraints(void)
 /**
  * Initializes the backend ISA.
  */
-static arch_env_t *ia32_init(FILE *file_handle) {
+static arch_env_t *ia32_init(FILE *file_handle)
+{
        static int inited = 0;
        ia32_isa_t *isa;
        int        i, n;
@@ -1698,6 +1675,8 @@ static arch_env_t *ia32_init(FILE *file_handle) {
 
        ia32_register_init();
        ia32_create_opcodes(&ia32_irn_ops);
+       /* special handling for SwitchJmp */
+       op_ia32_SwitchJmp->ops.be_ops = &ia32_SwitchJmp_irn_ops;
 
        be_emit_init(file_handle);
        isa->regs_16bit     = pmap_create();
@@ -1746,7 +1725,8 @@ static arch_env_t *ia32_init(FILE *file_handle) {
 /**
  * Closes the output file and frees the ISA structure.
  */
-static void ia32_done(void *self) {
+static void ia32_done(void *self)
+{
        ia32_isa_t *isa = self;
 
        /* emit now all global declarations */
@@ -1776,18 +1756,16 @@ static void ia32_done(void *self) {
  *  - the virtual floating point registers
  *  - the SSE vector register set
  */
-static unsigned ia32_get_n_reg_class(const void *self) {
-       (void) self;
+static unsigned ia32_get_n_reg_class(void)
+{
        return N_CLASSES;
 }
 
 /**
  * Return the register class for index i.
  */
-static const arch_register_class_t *ia32_get_reg_class(const void *self,
-                                                       unsigned i)
+static const arch_register_class_t *ia32_get_reg_class(unsigned i)
 {
-       (void) self;
        assert(i < N_CLASSES);
        return &ia32_reg_classes[i];
 }
@@ -1798,11 +1776,8 @@ static const arch_register_class_t *ia32_get_reg_class(const void *self,
  * @param mode The mode in question.
  * @return A register class which can hold values of the given mode.
  */
-const arch_register_class_t *ia32_get_reg_class_for_mode(const void *self,
-               const ir_mode *mode)
+const arch_register_class_t *ia32_get_reg_class_for_mode(const ir_mode *mode)
 {
-       (void) self;
-
        if (mode_is_float(mode)) {
                return ia32_cg_config.use_sse2 ? &ia32_reg_classes[CLASS_ia32_xmm] : &ia32_reg_classes[CLASS_ia32_vfp];
        }
@@ -1810,6 +1785,88 @@ const arch_register_class_t *ia32_get_reg_class_for_mode(const void *self,
                return &ia32_reg_classes[CLASS_ia32_gp];
 }
 
+/**
+ * Returns the register for parameter nr.
+ */
+static const arch_register_t *ia32_get_RegParam_reg(unsigned cc, unsigned nr,
+                                                    const ir_mode *mode)
+{
+       static const arch_register_t *gpreg_param_reg_fastcall[] = {
+               &ia32_gp_regs[REG_ECX],
+               &ia32_gp_regs[REG_EDX],
+               NULL
+       };
+       static const unsigned MAXNUM_GPREG_ARGS = 3;
+
+       static const arch_register_t *gpreg_param_reg_regparam[] = {
+               &ia32_gp_regs[REG_EAX],
+               &ia32_gp_regs[REG_EDX],
+               &ia32_gp_regs[REG_ECX]
+       };
+
+       static const arch_register_t *gpreg_param_reg_this[] = {
+               &ia32_gp_regs[REG_ECX],
+               NULL,
+               NULL
+       };
+
+       static const arch_register_t *fpreg_sse_param_reg_std[] = {
+               &ia32_xmm_regs[REG_XMM0],
+               &ia32_xmm_regs[REG_XMM1],
+               &ia32_xmm_regs[REG_XMM2],
+               &ia32_xmm_regs[REG_XMM3],
+               &ia32_xmm_regs[REG_XMM4],
+               &ia32_xmm_regs[REG_XMM5],
+               &ia32_xmm_regs[REG_XMM6],
+               &ia32_xmm_regs[REG_XMM7]
+       };
+
+       static const arch_register_t *fpreg_sse_param_reg_this[] = {
+               NULL,  /* in case of a "this" pointer, the first parameter must not be a float */
+       };
+       static const unsigned MAXNUM_SSE_ARGS = 8;
+
+       if ((cc & cc_this_call) && nr == 0)
+               return gpreg_param_reg_this[0];
+
+       if (! (cc & cc_reg_param))
+               return NULL;
+
+       if (mode_is_float(mode)) {
+               if (!ia32_cg_config.use_sse2 || (cc & cc_fpreg_param) == 0)
+                       return NULL;
+               if (nr >= MAXNUM_SSE_ARGS)
+                       return NULL;
+
+               if (cc & cc_this_call) {
+                       return fpreg_sse_param_reg_this[nr];
+               }
+               return fpreg_sse_param_reg_std[nr];
+       } else if (mode_is_int(mode) || mode_is_reference(mode)) {
+               unsigned num_regparam;
+
+               if (get_mode_size_bits(mode) > 32)
+                       return NULL;
+
+               if (nr >= MAXNUM_GPREG_ARGS)
+                       return NULL;
+
+               if (cc & cc_this_call) {
+                       return gpreg_param_reg_this[nr];
+               }
+               num_regparam = cc & ~cc_bits;
+               if (num_regparam == 0) {
+                       /* default fastcall */
+                       return gpreg_param_reg_fastcall[nr];
+               }
+               if (nr < num_regparam)
+                       return gpreg_param_reg_regparam[nr];
+               return NULL;
+       }
+
+       panic("unknown argument mode");
+}
+
 /**
  * Get the ABI restrictions for procedure calls.
  * @param self        The this pointer.
@@ -1833,25 +1890,25 @@ static void ia32_get_call_abi(const void *self, ir_type *method_type,
        call_flags.bits.store_args_sequential = 0;
        /* call_flags.bits.try_omit_fp                 not changed: can handle both settings */
        call_flags.bits.fp_free               = 0;  /* the frame pointer is fixed in IA32 */
-       call_flags.bits.call_has_imm          = 0;  /* No call immediates, we handle this by ourselves */
+       call_flags.bits.call_has_imm          = 0;  /* No call immediate, we handle this by ourselves */
 
        /* set parameter passing style */
        be_abi_call_set_flags(abi, call_flags, &ia32_abi_callbacks);
 
+       cc = get_method_calling_convention(method_type);
        if (get_method_variadicity(method_type) == variadicity_variadic) {
                /* pass all parameters of a variadic function on the stack */
-               cc = cc_cdecl_set;
+               cc = cc_cdecl_set | (cc & cc_this_call);
        } else {
-               cc = get_method_calling_convention(method_type);
                if (get_method_additional_properties(method_type) & mtp_property_private &&
                    ia32_cg_config.optimize_cc) {
-                       /* set the calling conventions to register parameter */
-                       cc = (cc & ~cc_bits) | cc_reg_param;
+                       /* set the fast calling conventions (allowing up to 3) */
+                       cc = SET_FASTCALL(cc) | 3;
                }
        }
 
        /* we have to pop the shadow parameter ourself for compound calls */
-       if( (get_method_calling_convention(method_type) & cc_compound_ret)
+       if ( (get_method_calling_convention(method_type) & cc_compound_ret)
                        && !(cc & cc_reg_param)) {
                pop_amount += get_mode_size_bytes(mode_P_data);
        }
@@ -1952,7 +2009,8 @@ static const arch_code_generator_if_t *ia32_get_code_generator_if(void *self)
 /**
  * Returns the estimated execution time of an ia32 irn.
  */
-static sched_timestep_t ia32_sched_exectime(void *env, const ir_node *irn) {
+static sched_timestep_t ia32_sched_exectime(void *env, const ir_node *irn)
+{
        (void) env;
        return is_ia32_irn(irn) ? ia32_get_op_estimated_cost(irn) : 1;
 }
@@ -1981,12 +2039,10 @@ static const ilp_sched_selector_t *ia32_get_ilp_sched_selector(const void *self)
 /**
  * Returns the necessary byte alignment for storing a register of given class.
  */
-static int ia32_get_reg_class_alignment(const void *self,
-                                        const arch_register_class_t *cls)
+static int ia32_get_reg_class_alignment(const arch_register_class_t *cls)
 {
        ir_mode *mode = arch_register_class_mode(cls);
        int bytes     = get_mode_size_bytes(mode);
-       (void) self;
 
        if (mode_is_float(mode) && bytes > 8)
                return 16;
@@ -1994,7 +2050,7 @@ static int ia32_get_reg_class_alignment(const void *self,
 }
 
 static const be_execution_unit_t ***ia32_get_allowed_execution_units(
-               const void *self, const ir_node *irn)
+               const ir_node *irn)
 {
        static const be_execution_unit_t *_allowed_units_BRANCH[] = {
                &ia32_execution_units_BRANCH[IA32_EXECUNIT_TP_BRANCH_BRANCH1],
@@ -2028,7 +2084,6 @@ static const be_execution_unit_t ***ia32_get_allowed_execution_units(
                NULL
        };
        const be_execution_unit_t ***ret;
-       (void) self;
 
        if (is_ia32_irn(irn)) {
                ret = get_ia32_exec_units(irn);
@@ -2051,7 +2106,8 @@ static const be_execution_unit_t ***ia32_get_allowed_execution_units(
 /**
  * Return the abstract ia32 machine.
  */
-static const be_machine_t *ia32_get_machine(const void *self) {
+static const be_machine_t *ia32_get_machine(const void *self)
+{
        const ia32_isa_t *isa = self;
        return isa->cpu;
 }
@@ -2066,8 +2122,8 @@ static ir_graph **ia32_get_irg_list(const void *self, ir_graph ***irg_list)
        return NULL;
 }
 
-static void ia32_mark_remat(const void *self, ir_node *node) {
-       (void) self;
+static void ia32_mark_remat(ir_node *node)
+{
        if (is_ia32_irn(node)) {
                set_ia32_is_remat(node);
        }
@@ -2076,7 +2132,8 @@ static void ia32_mark_remat(const void *self, ir_node *node) {
 /**
  * Check for Abs or -Abs.
  */
-static int psi_is_Abs_or_Nabs(ir_node *cmp, ir_node *sel, ir_node *t, ir_node *f) {
+static int psi_is_Abs_or_Nabs(ir_node *cmp, ir_node *sel, ir_node *t, ir_node *f)
+{
        ir_node *l, *r;
        pn_Cmp  pnc;
 
@@ -2105,7 +2162,8 @@ static int psi_is_Abs_or_Nabs(ir_node *cmp, ir_node *sel, ir_node *t, ir_node *f
 /**
  * Check for Abs only
  */
-static int psi_is_Abs(ir_node *cmp, ir_node *sel, ir_node *t, ir_node *f) {
+static int psi_is_Abs(ir_node *cmp, ir_node *sel, ir_node *t, ir_node *f)
+{
        ir_node *l, *r;
        pn_Cmp  pnc;
 
@@ -2226,8 +2284,21 @@ static int ia32_is_mux_allowed(ir_node *sel, ir_node *phi_list, int i, int j)
                                        ir_node *f = get_Phi_pred(phi, j);
 
                                        /* always support Mux(!float, C1, C2) */
-                                       if (is_Const(t) && is_Const(f) && !mode_is_float(get_irn_mode(cl)))
-                                               continue;
+                                       if (is_Const(t) && is_Const(f) && !mode_is_float(get_irn_mode(cl))) {
+                                               switch (be_transformer) {
+                                               case TRANSFORMER_DEFAULT:
+                                                       /* always support Mux(!float, C1, C2) */
+                                                       continue;
+#ifdef FIRM_GRGEN_BE
+                                               case TRANSFORMER_PBQP:
+                                               case TRANSFORMER_RAND:
+                                                       /* no support for Mux(*, C1, C2) */
+                                                       return 0;
+#endif
+                                               default:
+                                                       panic("invalid transformer");
+                                               }
+                                       }
                                        /* only abs or nabs supported */
                                        if (! psi_is_Abs_or_Nabs(cmp, sel, t, f))
                                                return 0;
@@ -2249,8 +2320,22 @@ static int ia32_is_mux_allowed(ir_node *sel, ir_node *phi_list, int i, int j)
 
                        if (mode_is_float(mode)) {
                                /* always support Mux(!float, C1, C2) */
-                               if (is_Const(t) && is_Const(f) && !mode_is_float(get_irn_mode(cl)))
-                                       continue;
+                               if (is_Const(t) && is_Const(f) &&
+                                               !mode_is_float(get_irn_mode(cl))) {
+                                       switch (be_transformer) {
+                                               case TRANSFORMER_DEFAULT:
+                                                       /* always support Mux(!float, C1, C2) */
+                                                       continue;
+#ifdef FIRM_GRGEN_BE
+                                               case TRANSFORMER_PBQP:
+                                               case TRANSFORMER_RAND:
+                                                       /* no support for Mux(*, C1, C2) */
+                                                       return 0;
+#endif
+                                               default:
+                                                       panic("invalid transformer");
+                                       }
+                               }
                                /* only abs or nabs supported */
                                if (! psi_is_Abs_or_Nabs(cmp, sel, t, f))
                                        return 0;
@@ -2305,9 +2390,8 @@ static int ia32_is_mux_allowed(ir_node *sel, ir_node *phi_list, int i, int j)
        return 0;
 }
 
-static asm_constraint_flags_t ia32_parse_asm_constraint(const void *self, const char **c)
+static asm_constraint_flags_t ia32_parse_asm_constraint(const char **c)
 {
-       (void) self;
        (void) c;
 
        /* we already added all our simple flags to the flags modifier list in
@@ -2315,10 +2399,8 @@ static asm_constraint_flags_t ia32_parse_asm_constraint(const void *self, const
        return ASM_CONSTRAINT_FLAG_INVALID;
 }
 
-static int ia32_is_valid_clobber(const void *self, const char *clobber)
+static int ia32_is_valid_clobber(const char *clobber)
 {
-       (void) self;
-
        return ia32_get_clobber_register(clobber) != NULL;
 }
 
@@ -2327,24 +2409,23 @@ static int ia32_is_valid_clobber(const void *self, const char *clobber)
  */
 static ir_node *ia32_create_trampoline_fkt(ir_node *block, ir_node *mem, ir_node *trampoline, ir_node *env, ir_node *callee)
 {
-       ir_graph *irg    = get_Block_irg(block);
        ir_node  *st, *p = trampoline;
        ir_mode *mode    = get_irn_mode(p);
 
        /* mov  ecx,<env> */
-       st  = new_r_Store(irg, block, mem, p, new_Const_long(mode_Bu, 0xb9), 0);
-       mem = new_r_Proj(irg, block, st, mode_M, pn_Store_M);
-       p   = new_r_Add(irg, block, p, new_Const_long(mode_Iu, 1), mode);
-       st  = new_r_Store(irg, block, mem, p, env, 0);
-       mem = new_r_Proj(irg, block, st, mode_M, pn_Store_M);
-       p   = new_r_Add(irg, block, p, new_Const_long(mode_Iu, 4), mode);
+       st  = new_r_Store(block, mem, p, new_Const_long(mode_Bu, 0xb9), 0);
+       mem = new_r_Proj(block, st, mode_M, pn_Store_M);
+       p   = new_r_Add(block, p, new_Const_long(mode_Iu, 1), mode);
+       st  = new_r_Store(block, mem, p, env, 0);
+       mem = new_r_Proj(block, st, mode_M, pn_Store_M);
+       p   = new_r_Add(block, p, new_Const_long(mode_Iu, 4), mode);
        /* jmp  <callee> */
-       st  = new_r_Store(irg, block, mem, p, new_Const_long(mode_Bu, 0xe9), 0);
-       mem = new_r_Proj(irg, block, st, mode_M, pn_Store_M);
-       p   = new_r_Add(irg, block, p, new_Const_long(mode_Iu, 1), mode);
-       st  = new_r_Store(irg, block, mem, p, callee, 0);
-       mem = new_r_Proj(irg, block, st, mode_M, pn_Store_M);
-       p   = new_r_Add(irg, block, p, new_Const_long(mode_Iu, 4), mode);
+       st  = new_r_Store(block, mem, p, new_Const_long(mode_Bu, 0xe9), 0);
+       mem = new_r_Proj(block, st, mode_M, pn_Store_M);
+       p   = new_r_Add(block, p, new_Const_long(mode_Iu, 1), mode);
+       st  = new_r_Store(block, mem, p, callee, 0);
+       mem = new_r_Proj(block, st, mode_M, pn_Store_M);
+       p   = new_r_Add(block, p, new_Const_long(mode_Iu, 4), mode);
 
        return mem;
 }
@@ -2352,7 +2433,8 @@ static ir_node *ia32_create_trampoline_fkt(ir_node *block, ir_node *mem, ir_node
 /**
  * Returns the libFirm configuration parameter for this backend.
  */
-static const backend_params *ia32_get_libfirm_params(void) {
+static const backend_params *ia32_get_libfirm_params(void)
+{
        static const ir_settings_if_conv_t ifconv = {
                4,                    /* maxdepth, doesn't matter for Mux-conversion */
                ia32_is_mux_allowed   /* allows or disallows Mux creation for given selector */
@@ -2378,6 +2460,7 @@ static const backend_params *ia32_get_libfirm_params(void) {
                12,    /* size of trampoline code */
                4,     /* alignment of trampoline code */
                ia32_create_trampoline_fkt,
+               4      /* alignment of stack parameter */
        };
 
        ia32_setup_cg_config();