do not free the graph after emitting it (this should only change the peak memory...
[libfirm] / ir / be / ia32 / bearch_ia32.c
index a160aba..aa0d861 100644 (file)
 #include "irtools.h"
 #include "iroptimize.h"
 #include "instrument.h"
+#include "iropt_t.h"
 
 #include "../beabi.h"
 #include "../beirg.h"
-#include "../benode_t.h"
+#include "../benode.h"
 #include "../belower.h"
 #include "../besched.h"
 #include "be.h"
@@ -96,9 +97,6 @@ transformer_t be_transformer = TRANSFORMER_DEFAULT;
 
 DEBUG_ONLY(static firm_dbg_module_t *dbg = NULL;)
 
-/* TODO: ugly */
-static set *cur_reg_set = NULL;
-
 ir_mode         *mode_fpcw       = NULL;
 ia32_code_gen_t *ia32_current_cg = NULL;
 
@@ -146,37 +144,44 @@ static inline ir_node *create_const(ia32_code_gen_t *cg, ir_node **place,
 }
 
 /* Creates the unique per irg GP NoReg node. */
-ir_node *ia32_new_NoReg_gp(ia32_code_gen_t *cg) {
+ir_node *ia32_new_NoReg_gp(ia32_code_gen_t *cg)
+{
        return create_const(cg, &cg->noreg_gp, new_bd_ia32_NoReg_GP,
                            &ia32_gp_regs[REG_GP_NOREG]);
 }
 
-ir_node *ia32_new_NoReg_vfp(ia32_code_gen_t *cg) {
+ir_node *ia32_new_NoReg_vfp(ia32_code_gen_t *cg)
+{
        return create_const(cg, &cg->noreg_vfp, new_bd_ia32_NoReg_VFP,
                            &ia32_vfp_regs[REG_VFP_NOREG]);
 }
 
-ir_node *ia32_new_NoReg_xmm(ia32_code_gen_t *cg) {
+ir_node *ia32_new_NoReg_xmm(ia32_code_gen_t *cg)
+{
        return create_const(cg, &cg->noreg_xmm, new_bd_ia32_NoReg_XMM,
                            &ia32_xmm_regs[REG_XMM_NOREG]);
 }
 
-ir_node *ia32_new_Unknown_gp(ia32_code_gen_t *cg) {
+ir_node *ia32_new_Unknown_gp(ia32_code_gen_t *cg)
+{
        return create_const(cg, &cg->unknown_gp, new_bd_ia32_Unknown_GP,
                            &ia32_gp_regs[REG_GP_UKNWN]);
 }
 
-ir_node *ia32_new_Unknown_vfp(ia32_code_gen_t *cg) {
+ir_node *ia32_new_Unknown_vfp(ia32_code_gen_t *cg)
+{
        return create_const(cg, &cg->unknown_vfp, new_bd_ia32_Unknown_VFP,
                            &ia32_vfp_regs[REG_VFP_UKNWN]);
 }
 
-ir_node *ia32_new_Unknown_xmm(ia32_code_gen_t *cg) {
+ir_node *ia32_new_Unknown_xmm(ia32_code_gen_t *cg)
+{
        return create_const(cg, &cg->unknown_xmm, new_bd_ia32_Unknown_XMM,
                            &ia32_xmm_regs[REG_XMM_UKNWN]);
 }
 
-ir_node *ia32_new_Fpu_truncate(ia32_code_gen_t *cg) {
+ir_node *ia32_new_Fpu_truncate(ia32_code_gen_t *cg)
+{
        return create_const(cg, &cg->fpu_trunc_mode, new_bd_ia32_ChangeCW,
                         &ia32_fp_cw_regs[REG_FPCW]);
 }
@@ -211,61 +216,19 @@ static ir_node *ia32_get_admissible_noreg(ia32_code_gen_t *cg, ir_node *irn, int
  *           |___/
  **************************************************/
 
-/**
- * Return register requirements for an ia32 node.
- * If the node returns a tuple (mode_T) then the proj's
- * will be asked for this information.
- */
-static const arch_register_req_t *ia32_get_irn_reg_req(const ir_node *node,
-                                                                                                          int pos)
+static const arch_register_req_t *get_ia32_SwitchJmp_out_req(
+               const ir_node *node, int pos)
 {
-       ir_mode *mode = get_irn_mode(node);
-       long    node_pos;
-
-       if (mode == mode_X || is_Block(node)) {
-               return arch_no_register_req;
-       }
-
-       if (mode == mode_T && pos < 0) {
-               return arch_no_register_req;
-       }
-
-       node_pos = pos == -1 ? 0 : pos;
-       if (is_Proj(node)) {
-               if (mode == mode_M || pos >= 0) {
-                       return arch_no_register_req;
-               }
-
-               node_pos = (pos == -1) ? get_Proj_proj(node) : pos;
-               node     = skip_Proj_const(node);
-       }
-
-       if (is_ia32_irn(node)) {
-               const arch_register_req_t *req;
-               if (pos >= 0)
-                       req = get_ia32_in_req(node, pos);
-               else
-                       req = get_ia32_out_req(node, node_pos);
-
-               assert(req != NULL);
-
-               return req;
-       }
-
-       /* unknowns should be transformed already */
+       (void) node;
+       (void) pos;
        return arch_no_register_req;
 }
 
-static arch_irn_class_t ia32_classify(const ir_node *irn) {
+static arch_irn_class_t ia32_classify(const ir_node *irn)
+{
        arch_irn_class_t classification = 0;
 
-       irn = skip_Proj_const(irn);
-
-       if (is_cfop(irn))
-               classification |= arch_irn_class_branch;
-
-       if (! is_ia32_irn(irn))
-               return classification;
+       assert(is_ia32_irn(irn));
 
        if (is_ia32_is_reload(irn))
                classification |= arch_irn_class_reload;
@@ -288,11 +251,13 @@ typedef struct {
        ir_graph *irg;                   /**< The associated graph. */
 } ia32_abi_env_t;
 
-static ir_entity *ia32_get_frame_entity(const ir_node *irn) {
+static ir_entity *ia32_get_frame_entity(const ir_node *irn)
+{
        return is_ia32_irn(irn) ? get_ia32_frame_ent(irn) : NULL;
 }
 
-static void ia32_set_frame_entity(ir_node *irn, ir_entity *ent) {
+static void ia32_set_frame_entity(ir_node *irn, ir_entity *ent)
+{
        set_ia32_frame_ent(irn, ent);
 }
 
@@ -467,18 +432,20 @@ static void *ia32_abi_init(const be_abi_call_t *call, const arch_env_t *aenv, ir
  * Destroy the callback object.
  * @param self The callback object.
  */
-static void ia32_abi_done(void *self) {
+static void ia32_abi_done(void *self)
+{
        free(self);
 }
 
 /**
  * Build the between type and entities if not already build.
  */
-static void ia32_build_between_type(void) {
+static void ia32_build_between_type(void)
+{
 #define IDENT(s) new_id_from_chars(s, sizeof(s)-1)
        if (! between_type) {
-               ir_type *old_bp_type   = new_type_primitive(IDENT("bp"), mode_Iu);
-               ir_type *ret_addr_type = new_type_primitive(IDENT("return_addr"), mode_Iu);
+               ir_type *old_bp_type   = new_type_primitive(mode_Iu);
+               ir_type *ret_addr_type = new_type_primitive(mode_Iu);
 
                between_type           = new_type_struct(IDENT("ia32_between_type"));
                old_bp_ent             = new_entity(between_type, IDENT("old_bp"), old_bp_type);
@@ -515,7 +482,8 @@ static ir_type *ia32_abi_get_between_type(void *self)
 /**
  * Return the stack entity that contains the return address.
  */
-ir_entity *ia32_get_return_address_entity(void) {
+ir_entity *ia32_get_return_address_entity(void)
+{
        ia32_build_between_type();
        return ia32_curr_fp_ommitted ? omit_fp_ret_addr_ent : ret_addr_ent;
 }
@@ -523,7 +491,8 @@ ir_entity *ia32_get_return_address_entity(void) {
 /**
  * Return the stack entity that contains the frame address.
  */
-ir_entity *ia32_get_frame_address_entity(void) {
+ir_entity *ia32_get_frame_address_entity(void)
+{
        ia32_build_between_type();
        return ia32_curr_fp_ommitted ? NULL : old_bp_ent;
 }
@@ -587,7 +556,8 @@ static int ia32_get_op_estimated_cost(const ir_node *irn)
  * @param obstack   The obstack to use for allocation of the returned nodes array
  * @return          The inverse operation or NULL if operation invertible
  */
-static arch_inverse_t *ia32_get_inverse(const ir_node *irn, int i, arch_inverse_t *inverse, struct obstack *obst) {
+static arch_inverse_t *ia32_get_inverse(const ir_node *irn, int i, arch_inverse_t *inverse, struct obstack *obst)
+{
        ir_mode  *mode;
        ir_mode  *irn_mode;
        ir_node  *block, *noreg, *nomem;
@@ -833,10 +803,30 @@ static const be_abi_callbacks_t ia32_abi_callbacks = {
        ia32_abi_epilogue
 };
 
-/* fill register allocator interface */
-
+/* register allocator interface */
 static const arch_irn_ops_t ia32_irn_ops = {
-       ia32_get_irn_reg_req,
+       get_ia32_in_req,
+       ia32_classify,
+       ia32_get_frame_entity,
+       ia32_set_frame_entity,
+       ia32_set_frame_offset,
+       ia32_get_sp_bias,
+       ia32_get_inverse,
+       ia32_get_op_estimated_cost,
+       ia32_possible_memory_operand,
+       ia32_perform_memory_operand,
+};
+
+/* special register allocator interface for SwitchJmp
+   as it possibly has a WIDE range of Proj numbers.
+   We don't want to allocate output for register constraints for
+   all these. */
+static const arch_irn_ops_t ia32_SwitchJmp_irn_ops = {
+       /* Note: we also use SwitchJmp_out_req for the inputs too:
+          This is because the bearch API has a conceptual problem at the moment.
+          Querying for negative proj numbers which can happen for switchs
+          isn't possible and will result in inputs getting queried */
+       get_ia32_SwitchJmp_out_req,
        ia32_classify,
        ia32_get_frame_entity,
        ia32_set_frame_entity,
@@ -863,7 +853,8 @@ static ir_entity *mcount = NULL;
 
 #define ID(s) new_id_from_chars(s, sizeof(s) - 1)
 
-static void ia32_before_abi(void *self) {
+static void ia32_before_abi(void *self)
+{
        lower_mode_b_config_t lower_mode_b_config = {
                mode_Iu,  /* lowered mode */
                mode_Bu,  /* preferred mode for set */
@@ -874,13 +865,14 @@ static void ia32_before_abi(void *self) {
        ir_lower_mode_b(cg->irg, &lower_mode_b_config);
        if (cg->dump)
                be_dump(cg->irg, "-lower_modeb", dump_ir_block_graph_sched);
+
        if (cg->gprof) {
                if (mcount == NULL) {
-                       ir_type *tp = new_type_method(ID("FKT.mcount"), 0, 0);
+                       ir_type *tp = new_type_method(0, 0);
                        mcount = new_entity(get_glob_type(), ID("mcount"), tp);
                        /* FIXME: enter the right ld_ident here */
                        set_entity_ld_ident(mcount, get_entity_ident(mcount));
-                       set_entity_visibility(mcount, visibility_external_allocated);
+                       set_entity_visibility(mcount, ir_visibility_external);
                }
                instrument_initcall(cg->irg, mcount);
        }
@@ -892,27 +884,7 @@ static void ia32_before_abi(void *self) {
  */
 static void ia32_prepare_graph(void *self)
 {
-       ia32_code_gen_t *cg  = self;
-       ir_graph        *irg = cg->irg;
-
-       /* do local optimizations */
-       optimize_graph_df(irg);
-
-       /* we have to do cfopt+remove_critical_edges as we can't have Bad-blocks
-        * or critical edges in the backend */
-       optimize_cf(irg);
-       remove_critical_cf_edges(irg);
-
-       /* TODO: we often have dead code reachable through out-edges here. So for
-        * now we rebuild edges (as we need correct user count for code selection)
-        */
-#if 1
-       edges_deactivate(cg->irg);
-       edges_activate(cg->irg);
-#endif
-
-       if (cg->dump)
-               be_dump(cg->irg, "-pre_transform", dump_ir_block_graph_sched);
+       ia32_code_gen_t *cg = self;
 
        switch (be_transformer) {
        case TRANSFORMER_DEFAULT:
@@ -1046,7 +1018,8 @@ static ir_node *flags_remat(ir_node *node, ir_node *after)
 /**
  * Called before the register allocator.
  */
-static void ia32_before_ra(void *self) {
+static void ia32_before_ra(void *self)
+{
        ia32_code_gen_t *cg = self;
 
        /* setup fpu rounding modes */
@@ -1063,7 +1036,8 @@ static void ia32_before_ra(void *self) {
 /**
  * Transforms a be_Reload into a ia32 Load.
  */
-static void transform_to_Load(ia32_code_gen_t *cg, ir_node *node) {
+static void transform_to_Load(ia32_code_gen_t *cg, ir_node *node)
+{
        ir_graph *irg        = get_irn_irg(node);
        dbg_info *dbg        = get_irn_dbg_info(node);
        ir_node *block       = get_nodes_block(node);
@@ -1121,7 +1095,8 @@ static void transform_to_Load(ia32_code_gen_t *cg, ir_node *node) {
 /**
  * Transforms a be_Spill node into a ia32 Store.
  */
-static void transform_to_Store(ia32_code_gen_t *cg, ir_node *node) {
+static void transform_to_Store(ia32_code_gen_t *cg, ir_node *node)
+{
        ir_graph *irg  = get_irn_irg(node);
        dbg_info *dbg  = get_irn_dbg_info(node);
        ir_node *block = get_nodes_block(node);
@@ -1181,7 +1156,8 @@ static void transform_to_Store(ia32_code_gen_t *cg, ir_node *node) {
        exchange(node, store);
 }
 
-static ir_node *create_push(ia32_code_gen_t *cg, ir_node *node, ir_node *schedpoint, ir_node *sp, ir_node *mem, ir_entity *ent) {
+static ir_node *create_push(ia32_code_gen_t *cg, ir_node *node, ir_node *schedpoint, ir_node *sp, ir_node *mem, ir_entity *ent)
+{
        dbg_info *dbg = get_irn_dbg_info(node);
        ir_node *block = get_nodes_block(node);
        ir_node *noreg = ia32_new_NoReg_gp(cg);
@@ -1200,7 +1176,8 @@ static ir_node *create_push(ia32_code_gen_t *cg, ir_node *node, ir_node *schedpo
        return push;
 }
 
-static ir_node *create_pop(ia32_code_gen_t *cg, ir_node *node, ir_node *schedpoint, ir_node *sp, ir_entity *ent) {
+static ir_node *create_pop(ia32_code_gen_t *cg, ir_node *node, ir_node *schedpoint, ir_node *sp, ir_entity *ent)
+{
        dbg_info *dbg = get_irn_dbg_info(node);
        ir_node *block = get_nodes_block(node);
        ir_node *noreg = ia32_new_NoReg_gp(cg);
@@ -1306,7 +1283,7 @@ static void transform_MemPerm(ia32_code_gen_t *cg, ir_node *node)
        }
 
        in[0] = sp;
-       keep  = be_new_Keep(&ia32_reg_classes[CLASS_ia32_gp], block, 1, in);
+       keep  = be_new_Keep(block, 1, in);
        sched_add_before(node, keep);
 
        /* exchange memprojs */
@@ -1331,7 +1308,8 @@ static void transform_MemPerm(ia32_code_gen_t *cg, ir_node *node)
 /**
  * Block-Walker: Calls the transform functions Spill and Reload.
  */
-static void ia32_after_ra_walker(ir_node *block, void *env) {
+static void ia32_after_ra_walker(ir_node *block, void *env)
+{
        ir_node *node, *prev;
        ia32_code_gen_t *cg = env;
 
@@ -1427,7 +1405,8 @@ need_stackent:
  * We transform Spill and Reload here. This needs to be done before
  * stack biasing otherwise we would miss the corrected offset for these nodes.
  */
-static void ia32_after_ra(void *self) {
+static void ia32_after_ra(void *self)
+{
        ia32_code_gen_t *cg = self;
        ir_graph *irg = cg->irg;
        be_fec_env_t *fec_env = be_new_frame_entity_coalescer(cg->birg);
@@ -1445,7 +1424,8 @@ static void ia32_after_ra(void *self) {
  * virtual with real x87 instructions, creating a block schedule and peephole
  * optimisations.
  */
-static void ia32_finish(void *self) {
+static void ia32_finish(void *self)
+{
        ia32_code_gen_t *cg = self;
        ir_graph        *irg = cg->irg;
 
@@ -1468,13 +1448,16 @@ static void ia32_finish(void *self) {
  * Emits the code, closes the output file and frees
  * the code generator interface.
  */
-static void ia32_codegen(void *self) {
+static void ia32_codegen(void *self)
+{
        ia32_code_gen_t *cg = self;
        ir_graph        *irg = cg->irg;
 
-       ia32_gen_routine(cg, irg);
-
-       cur_reg_set = NULL;
+       if (ia32_cg_config.emit_machcode) {
+               ia32_gen_binary_routine(cg, irg);
+       } else {
+               ia32_gen_routine(cg, irg);
+       }
 
        /* remove it from the isa */
        cg->isa->cg = NULL;
@@ -1483,14 +1466,14 @@ static void ia32_codegen(void *self) {
        ia32_current_cg = NULL;
 
        /* de-allocate code generator */
-       del_set(cg->reg_set);
        free(cg);
 }
 
 /**
  * Returns the node representing the PIC base.
  */
-static ir_node *ia32_get_pic_base(void *self) {
+static ir_node *ia32_get_pic_base(void *self)
+{
        ir_node         *block;
        ia32_code_gen_t *cg      = self;
        ir_node         *get_eip = cg->get_eip;
@@ -1522,13 +1505,13 @@ static const arch_code_generator_if_t ia32_code_gen_if = {
 /**
  * Initializes a IA32 code generator.
  */
-static void *ia32_cg_init(be_irg_t *birg) {
+static void *ia32_cg_init(be_irg_t *birg)
+{
        ia32_isa_t      *isa = (ia32_isa_t *)birg->main_env->arch_env;
        ia32_code_gen_t *cg  = XMALLOCZ(ia32_code_gen_t);
 
        cg->impl      = &ia32_code_gen_if;
        cg->irg       = birg->irg;
-       cg->reg_set   = new_set(ia32_cmp_irn_reg_assoc, 1024);
        cg->isa       = isa;
        cg->birg      = birg;
        cg->blk_sched = NULL;
@@ -1550,8 +1533,6 @@ static void *ia32_cg_init(be_irg_t *birg) {
        }
 #endif /* NDEBUG */
 
-       cur_reg_set = cg->reg_set;
-
        assert(ia32_current_cg == NULL);
        ia32_current_cg = cg;
 
@@ -1675,7 +1656,8 @@ static void init_asm_constraints(void)
 /**
  * Initializes the backend ISA.
  */
-static arch_env_t *ia32_init(FILE *file_handle) {
+static arch_env_t *ia32_init(FILE *file_handle)
+{
        static int inited = 0;
        ia32_isa_t *isa;
        int        i, n;
@@ -1695,6 +1677,8 @@ static arch_env_t *ia32_init(FILE *file_handle) {
 
        ia32_register_init();
        ia32_create_opcodes(&ia32_irn_ops);
+       /* special handling for SwitchJmp */
+       op_ia32_SwitchJmp->ops.be_ops = &ia32_SwitchJmp_irn_ops;
 
        be_emit_init(file_handle);
        isa->regs_16bit     = pmap_create();
@@ -1729,12 +1713,6 @@ static arch_env_t *ia32_init(FILE *file_handle) {
        be_emit_cstring(".Ltext0:\n");
        be_emit_write_line();
 
-       /* we mark referenced global entities, so we can only emit those which
-        * are actually referenced. (Note: you mustn't use the type visited flag
-        * elsewhere in the backend)
-        */
-       inc_master_type_visited();
-
        return &isa->arch_env;
 }
 
@@ -1743,11 +1721,12 @@ static arch_env_t *ia32_init(FILE *file_handle) {
 /**
  * Closes the output file and frees the ISA structure.
  */
-static void ia32_done(void *self) {
+static void ia32_done(void *self)
+{
        ia32_isa_t *isa = self;
 
        /* emit now all global declarations */
-       be_gas_emit_decls(isa->arch_env.main_env, 1);
+       be_gas_emit_decls(isa->arch_env.main_env);
 
        pmap_destroy(isa->regs_16bit);
        pmap_destroy(isa->regs_8bit);
@@ -1773,18 +1752,16 @@ static void ia32_done(void *self) {
  *  - the virtual floating point registers
  *  - the SSE vector register set
  */
-static unsigned ia32_get_n_reg_class(const void *self) {
-       (void) self;
+static unsigned ia32_get_n_reg_class(void)
+{
        return N_CLASSES;
 }
 
 /**
  * Return the register class for index i.
  */
-static const arch_register_class_t *ia32_get_reg_class(const void *self,
-                                                       unsigned i)
+static const arch_register_class_t *ia32_get_reg_class(unsigned i)
 {
-       (void) self;
        assert(i < N_CLASSES);
        return &ia32_reg_classes[i];
 }
@@ -1795,11 +1772,8 @@ static const arch_register_class_t *ia32_get_reg_class(const void *self,
  * @param mode The mode in question.
  * @return A register class which can hold values of the given mode.
  */
-const arch_register_class_t *ia32_get_reg_class_for_mode(const void *self,
-               const ir_mode *mode)
+const arch_register_class_t *ia32_get_reg_class_for_mode(const ir_mode *mode)
 {
-       (void) self;
-
        if (mode_is_float(mode)) {
                return ia32_cg_config.use_sse2 ? &ia32_reg_classes[CLASS_ia32_xmm] : &ia32_reg_classes[CLASS_ia32_vfp];
        }
@@ -1807,6 +1781,88 @@ const arch_register_class_t *ia32_get_reg_class_for_mode(const void *self,
                return &ia32_reg_classes[CLASS_ia32_gp];
 }
 
+/**
+ * Returns the register for parameter nr.
+ */
+static const arch_register_t *ia32_get_RegParam_reg(unsigned cc, unsigned nr,
+                                                    const ir_mode *mode)
+{
+       static const arch_register_t *gpreg_param_reg_fastcall[] = {
+               &ia32_gp_regs[REG_ECX],
+               &ia32_gp_regs[REG_EDX],
+               NULL
+       };
+       static const unsigned MAXNUM_GPREG_ARGS = 3;
+
+       static const arch_register_t *gpreg_param_reg_regparam[] = {
+               &ia32_gp_regs[REG_EAX],
+               &ia32_gp_regs[REG_EDX],
+               &ia32_gp_regs[REG_ECX]
+       };
+
+       static const arch_register_t *gpreg_param_reg_this[] = {
+               &ia32_gp_regs[REG_ECX],
+               NULL,
+               NULL
+       };
+
+       static const arch_register_t *fpreg_sse_param_reg_std[] = {
+               &ia32_xmm_regs[REG_XMM0],
+               &ia32_xmm_regs[REG_XMM1],
+               &ia32_xmm_regs[REG_XMM2],
+               &ia32_xmm_regs[REG_XMM3],
+               &ia32_xmm_regs[REG_XMM4],
+               &ia32_xmm_regs[REG_XMM5],
+               &ia32_xmm_regs[REG_XMM6],
+               &ia32_xmm_regs[REG_XMM7]
+       };
+
+       static const arch_register_t *fpreg_sse_param_reg_this[] = {
+               NULL,  /* in case of a "this" pointer, the first parameter must not be a float */
+       };
+       static const unsigned MAXNUM_SSE_ARGS = 8;
+
+       if ((cc & cc_this_call) && nr == 0)
+               return gpreg_param_reg_this[0];
+
+       if (! (cc & cc_reg_param))
+               return NULL;
+
+       if (mode_is_float(mode)) {
+               if (!ia32_cg_config.use_sse2 || (cc & cc_fpreg_param) == 0)
+                       return NULL;
+               if (nr >= MAXNUM_SSE_ARGS)
+                       return NULL;
+
+               if (cc & cc_this_call) {
+                       return fpreg_sse_param_reg_this[nr];
+               }
+               return fpreg_sse_param_reg_std[nr];
+       } else if (mode_is_int(mode) || mode_is_reference(mode)) {
+               unsigned num_regparam;
+
+               if (get_mode_size_bits(mode) > 32)
+                       return NULL;
+
+               if (nr >= MAXNUM_GPREG_ARGS)
+                       return NULL;
+
+               if (cc & cc_this_call) {
+                       return gpreg_param_reg_this[nr];
+               }
+               num_regparam = cc & ~cc_bits;
+               if (num_regparam == 0) {
+                       /* default fastcall */
+                       return gpreg_param_reg_fastcall[nr];
+               }
+               if (nr < num_regparam)
+                       return gpreg_param_reg_regparam[nr];
+               return NULL;
+       }
+
+       panic("unknown argument mode");
+}
+
 /**
  * Get the ABI restrictions for procedure calls.
  * @param self        The this pointer.
@@ -1949,7 +2005,8 @@ static const arch_code_generator_if_t *ia32_get_code_generator_if(void *self)
 /**
  * Returns the estimated execution time of an ia32 irn.
  */
-static sched_timestep_t ia32_sched_exectime(void *env, const ir_node *irn) {
+static sched_timestep_t ia32_sched_exectime(void *env, const ir_node *irn)
+{
        (void) env;
        return is_ia32_irn(irn) ? ia32_get_op_estimated_cost(irn) : 1;
 }
@@ -1978,12 +2035,10 @@ static const ilp_sched_selector_t *ia32_get_ilp_sched_selector(const void *self)
 /**
  * Returns the necessary byte alignment for storing a register of given class.
  */
-static int ia32_get_reg_class_alignment(const void *self,
-                                        const arch_register_class_t *cls)
+static int ia32_get_reg_class_alignment(const arch_register_class_t *cls)
 {
        ir_mode *mode = arch_register_class_mode(cls);
        int bytes     = get_mode_size_bytes(mode);
-       (void) self;
 
        if (mode_is_float(mode) && bytes > 8)
                return 16;
@@ -1991,7 +2046,7 @@ static int ia32_get_reg_class_alignment(const void *self,
 }
 
 static const be_execution_unit_t ***ia32_get_allowed_execution_units(
-               const void *self, const ir_node *irn)
+               const ir_node *irn)
 {
        static const be_execution_unit_t *_allowed_units_BRANCH[] = {
                &ia32_execution_units_BRANCH[IA32_EXECUNIT_TP_BRANCH_BRANCH1],
@@ -2025,7 +2080,6 @@ static const be_execution_unit_t ***ia32_get_allowed_execution_units(
                NULL
        };
        const be_execution_unit_t ***ret;
-       (void) self;
 
        if (is_ia32_irn(irn)) {
                ret = get_ia32_exec_units(irn);
@@ -2048,7 +2102,8 @@ static const be_execution_unit_t ***ia32_get_allowed_execution_units(
 /**
  * Return the abstract ia32 machine.
  */
-static const be_machine_t *ia32_get_machine(const void *self) {
+static const be_machine_t *ia32_get_machine(const void *self)
+{
        const ia32_isa_t *isa = self;
        return isa->cpu;
 }
@@ -2063,275 +2118,255 @@ static ir_graph **ia32_get_irg_list(const void *self, ir_graph ***irg_list)
        return NULL;
 }
 
-static void ia32_mark_remat(const void *self, ir_node *node) {
-       (void) self;
+static void ia32_mark_remat(ir_node *node)
+{
        if (is_ia32_irn(node)) {
                set_ia32_is_remat(node);
        }
 }
 
 /**
- * Check for Abs or -Abs.
+ * Check if Mux(sel, t, f) would represent an Abs (or -Abs).
  */
-static int psi_is_Abs_or_Nabs(ir_node *cmp, ir_node *sel, ir_node *t, ir_node *f) {
-       ir_node *l, *r;
+static bool mux_is_abs(ir_node *sel, ir_node *mux_true, ir_node *mux_false)
+{
+       ir_node *cmp_left;
+       ir_node *cmp_right;
+       ir_node *cmp;
        pn_Cmp  pnc;
 
-       if (cmp == NULL)
-               return 0;
+       if (!is_Proj(sel))
+               return false;
+       cmp = get_Proj_pred(sel);
+       if (!is_Cmp(cmp))
+               return false;
 
        /* must be <, <=, >=, > */
        pnc = get_Proj_proj(sel);
-       if (pnc != pn_Cmp_Ge && pnc != pn_Cmp_Gt &&
-               pnc != pn_Cmp_Le && pnc != pn_Cmp_Lt)
-               return 0;
+       switch (pnc) {
+       case pn_Cmp_Ge:
+       case pn_Cmp_Gt:
+       case pn_Cmp_Le:
+       case pn_Cmp_Lt:
+       case pn_Cmp_Uge:
+       case pn_Cmp_Ug:
+       case pn_Cmp_Ul:
+       case pn_Cmp_Ule:
+               break;
+       default:
+               return false;
+       }
 
-       l = get_Cmp_left(cmp);
-       r = get_Cmp_right(cmp);
+       if (!is_negated_value(mux_true, mux_false))
+               return false;
 
        /* must be x cmp 0 */
-       if ((l != t && l != f) || !is_Const(r) || !is_Const_null(r))
+       cmp_right = get_Cmp_right(cmp);
+       if (!is_Const(cmp_right) || !is_Const_null(cmp_right))
                return 0;
 
-       if ((!is_Minus(t) || get_Minus_op(t) != f) &&
-               (!is_Minus(f) || get_Minus_op(f) != t))
-               return 0;
-       return 1;
+       cmp_left = get_Cmp_left(cmp);
+       if (cmp_left != mux_true && cmp_left != mux_false)
+               return false;
+
+       return true;
 }
 
 /**
- * Check for Abs only
+ * Check if Mux(sel, mux_true, mux_false) would represent a Max or Min operation
  */
-static int psi_is_Abs(ir_node *cmp, ir_node *sel, ir_node *t, ir_node *f) {
-       ir_node *l, *r;
+static bool mux_is_float_min_max(ir_node *sel, ir_node *mux_true,
+                                 ir_node *mux_false)
+{
+       ir_node *cmp_l;
+       ir_node *cmp_r;
+       ir_node *cmp;
        pn_Cmp  pnc;
 
-       if (cmp == NULL)
-               return 0;
-
-       /* must be <, <=, >=, > */
+       if (!is_Proj(sel))
+               return false;
+       cmp = get_Proj_pred(sel);
+       if (!is_Cmp(cmp))
+               return false;
+
+       cmp_l = get_Cmp_left(cmp);
+       cmp_r = get_Cmp_right(cmp);
+       if (!mode_is_float(get_irn_mode(cmp_l)))
+               return false;
+
+       /* check for min/max. They're defined as (C-Semantik):
+        *  min(a, b) = a < b ? a : b
+        *  or min(a, b) = a <= b ? a : b
+        *  max(a, b) = a > b ? a : b
+        *  or max(a, b) = a >= b ? a : b
+        * (Note we only handle float min/max here)
+        */
        pnc = get_Proj_proj(sel);
-       if (pnc != pn_Cmp_Ge && pnc != pn_Cmp_Gt &&
-               pnc != pn_Cmp_Le && pnc != pn_Cmp_Lt)
-               return 0;
+       switch (pnc) {
+       case pn_Cmp_Ge:
+       case pn_Cmp_Gt:
+               /* this is a max */
+               if (cmp_l == mux_true && cmp_r == mux_false)
+                       return true;
+               break;
+       case pn_Cmp_Le:
+       case pn_Cmp_Lt:
+               /* this is a min */
+               if (cmp_l == mux_true && cmp_r == mux_false)
+                       return true;
+               break;
+       case pn_Cmp_Uge:
+       case pn_Cmp_Ug:
+               /* this is a min */
+               if (cmp_l == mux_false && cmp_r == mux_true)
+                       return true;
+               break;
+       case pn_Cmp_Ule:
+       case pn_Cmp_Ul:
+               /* this is a max */
+               if (cmp_l == mux_false && cmp_r == mux_true)
+                       return true;
+               break;
 
-       l = get_Cmp_left(cmp);
-       r = get_Cmp_right(cmp);
+       default:
+               break;
+       }
 
-       /* must be x cmp 0 */
-       if ((l != t && l != f) || !is_Const(r) || !is_Const_null(r))
-               return 0;
+       return false;
+}
 
-       if ((!is_Minus(t) || get_Minus_op(t) != f) &&
-               (!is_Minus(f) || get_Minus_op(f) != t))
-               return 0;
+static bool mux_is_set(ir_node *sel, ir_node *mux_true, ir_node *mux_false)
+{
+       ir_mode *mode = get_irn_mode(mux_true);
+       (void) sel;
 
-       if (pnc & pn_Cmp_Gt) {
-               /* x >= 0 ? -x : x is NABS */
-               if (is_Minus(t))
-                       return 0;
-       } else {
-               /* x < 0 ? x : -x is NABS */
-               if (is_Minus(f))
-                       return 0;
+       if (!mode_is_int(mode) && !mode_is_reference(mode)
+                       && mode != mode_b)
+               return false;
+
+       if (is_Const(mux_true) && is_Const(mux_false)) {
+               /* we can create a set plus up two 3 instructions for any combination of constants */
+               return true;
        }
-       return 1;
+
+       return false;
 }
 
+static bool mux_is_float_const_const(ir_node *sel, ir_node *mux_true,
+                                     ir_node *mux_false)
+{
+       (void) sel;
 
-/**
- * Allows or disallows the creation of Mux nodes for the given Phi nodes.
- *
- * @param sel        A selector of a Cond.
- * @param phi_list   List of Phi nodes about to be converted (linked via get_Phi_next() field)
- * @param i          First data predecessor involved in if conversion
- * @param j          Second data predecessor involved in if conversion
- *
- * @return 1 if allowed, 0 otherwise
- */
-static int ia32_is_mux_allowed(ir_node *sel, ir_node *phi_list, int i, int j)
+       if (!mode_is_float(get_irn_mode(mux_true)))
+               return false;
+
+       return is_Const(mux_true) && is_Const(mux_false);
+}
+
+static bool mux_is_doz(ir_node *sel, ir_node *mux_true, ir_node *mux_false)
 {
-       ir_node *phi;
        ir_node *cmp;
-       pn_Cmp  pn;
-       ir_node *cl, *cr;
-
-       /* we can't handle Muxs with 64bit compares yet */
-       if (is_Proj(sel)) {
-               cmp = get_Proj_pred(sel);
-               if (is_Cmp(cmp)) {
-                       ir_node *left     = get_Cmp_left(cmp);
-                       ir_mode *cmp_mode = get_irn_mode(left);
-                       if (!mode_is_float(cmp_mode) && get_mode_size_bits(cmp_mode) > 32) {
-                               /* 64bit Abs IS supported */
-                               for (phi = phi_list; phi; phi = get_Phi_next(phi)) {
-                                       ir_node *t = get_Phi_pred(phi, i);
-                                       ir_node *f = get_Phi_pred(phi, j);
-
-                                       if (! psi_is_Abs(cmp, sel, t, f))
-                                               return 0;
-                               }
-                               return 1;
-                       }
-               } else {
-                       /* we do not support nodes without Cmp yet */
-                       return 0;
-               }
-       } else {
-               /* we do not support nodes without Cmp yet */
-               return 0;
+       ir_node *cmp_left;
+       ir_node *cmp_right;
+       ir_mode *mode;
+       long     pn;
+
+       if (!is_Proj(sel))
+               return false;
+
+       cmp = get_Proj_pred(sel);
+       if (!is_Cmp(cmp))
+               return false;
+
+       mode = get_irn_mode(mux_true);
+       if (mode_is_signed(mode) || mode_is_float(mode))
+               return false;
+
+       pn        = get_Proj_proj(sel);
+       cmp_left  = get_Cmp_left(cmp);
+       cmp_right = get_Cmp_right(cmp);
+       if ((pn & pn_Cmp_Gt) &&
+               is_Const(mux_false) && is_Const_null(mux_false) && is_Sub(mux_true) &&
+               get_Sub_left(mux_true) == cmp_left &&
+               get_Sub_right(mux_true) == cmp_right) {
+               /* Mux(a >=u b, a - b, 0) unsigned Doz */
+               return true;
+       }
+       if ((pn & pn_Cmp_Lt) &&
+               is_Const(mux_true) && is_Const_null(mux_true) && is_Sub(mux_false) &&
+               get_Sub_left(mux_false) == cmp_left &&
+               get_Sub_right(mux_false) == cmp_right) {
+               /* Mux(a <=u b, 0, a - b) unsigned Doz */
+               return true;
        }
 
-       pn = get_Proj_proj(sel);
-       cl = get_Cmp_left(cmp);
-       cr = get_Cmp_right(cmp);
-
-       if (ia32_cg_config.use_cmov) {
-               if (ia32_cg_config.use_sse2) {
-                       /* check the Phi nodes: no 64bit and no floating point cmov */
-                       for (phi = phi_list; phi; phi = get_Phi_next(phi)) {
-                               ir_mode *mode = get_irn_mode(phi);
-
-                               if (mode_is_float(mode)) {
-                                       /* check for Min, Max */
-                                       ir_node *t = get_Phi_pred(phi, i);
-                                       ir_node *f = get_Phi_pred(phi, j);
-
-                                       /* SSE2 supports Min & Max */
-                                       if (pn == pn_Cmp_Lt || pn == pn_Cmp_Le || pn == pn_Cmp_Ge || pn == pn_Cmp_Gt) {
-                                               if (cl == t && cr == f) {
-                                                       /* Mux(a <=/>= b, a, b) => MIN, MAX */
-                                                       continue;
-                                               } else if (cl == f && cr == t) {
-                                                       /* Mux(a <=/>= b, b, a) => MAX, MIN */
-                                                       continue;
-                                               }
-                                       }
-                                       return 0;
-                               } else if (get_mode_size_bits(mode) > 32) {
-                                       /* no 64bit cmov */
-                                       return 0;
-                               }
-                       }
-               } else {
-                       /* check the Phi nodes: no 64bit and no floating point cmov */
-                       for (phi = phi_list; phi; phi = get_Phi_next(phi)) {
-                               ir_mode *mode = get_irn_mode(phi);
-
-                               if (mode_is_float(mode)) {
-                                       ir_node *t = get_Phi_pred(phi, i);
-                                       ir_node *f = get_Phi_pred(phi, j);
-
-                                       /* always support Mux(!float, C1, C2) */
-                                       if (is_Const(t) && is_Const(f) && !mode_is_float(get_irn_mode(cl))) {
-                                               switch (be_transformer) {
-                                               case TRANSFORMER_DEFAULT:
-                                                       /* always support Mux(!float, C1, C2) */
-                                                       continue;
-#ifdef FIRM_GRGEN_BE
-                                               case TRANSFORMER_PBQP:
-                                               case TRANSFORMER_RAND:
-                                                       /* no support for Mux(*, C1, C2) */
-                                                       return 0;
-#endif
-                                               default:
-                                                       panic("invalid transformer");
-                                               }
-                                       }
-                                       /* only abs or nabs supported */
-                                       if (! psi_is_Abs_or_Nabs(cmp, sel, t, f))
-                                               return 0;
-                               } else if (get_mode_size_bits(mode) > 32)
-                                       return 0;
-                       }
-               }
+       return false;
+}
 
-               return 1;
-       } else { /* No Cmov, only some special cases */
-
-               /* Now some supported cases here */
-               for (phi = phi_list; phi; phi = get_Phi_next(phi)) {
-                       ir_mode *mode = get_irn_mode(phi);
-                       ir_node *t, *f;
-
-                       t = get_Phi_pred(phi, i);
-                       f = get_Phi_pred(phi, j);
-
-                       if (mode_is_float(mode)) {
-                               /* always support Mux(!float, C1, C2) */
-                               if (is_Const(t) && is_Const(f) &&
-                                               !mode_is_float(get_irn_mode(cl))) {
-                                       switch (be_transformer) {
-                                               case TRANSFORMER_DEFAULT:
-                                                       /* always support Mux(!float, C1, C2) */
-                                                       continue;
+static int ia32_is_mux_allowed(ir_node *sel, ir_node *mux_false,
+                               ir_node *mux_true)
+{
+       ir_mode *mode;
+
+       /* we can handle Abs for all modes and compares */
+       if (mux_is_abs(sel, mux_true, mux_false))
+               return true;
+       /* we can handle Set for all modes and compares */
+       if (mux_is_set(sel, mux_true, mux_false))
+               return true;
+       /* SSE has own min/max operations */
+       if (ia32_cg_config.use_sse2
+                       && mux_is_float_min_max(sel, mux_true, mux_false))
+               return true;
+       /* we can handle Mux(?, Const[f], Const[f]) */
+       if (mux_is_float_const_const(sel, mux_true, mux_false)) {
 #ifdef FIRM_GRGEN_BE
-                                               case TRANSFORMER_PBQP:
-                                               case TRANSFORMER_RAND:
-                                                       /* no support for Mux(*, C1, C2) */
-                                                       return 0;
+               /* well, some code selectors can't handle it */
+               if (be_transformer != TRANSFORMER_PBQP
+                               || be_transformer != TRANSFORMER_RAND)
+                       return true;
+#else
+               return true;
 #endif
-                                               default:
-                                                       panic("invalid transformer");
-                                       }
-                               }
-                               /* only abs or nabs supported */
-                               if (! psi_is_Abs_or_Nabs(cmp, sel, t, f))
-                                       return 0;
-                       } else if (get_mode_size_bits(mode) > 32) {
-                               /* no 64bit yet */
-                               return 0;
-                       }
+       }
 
-                       if (is_Const(t) && is_Const(f)) {
-                               if ((is_Const_null(t) && is_Const_one(f)) || (is_Const_one(t) && is_Const_null(f))) {
-                                       /* always support Mux(x, C1, C2) */
-                                       continue;
-                               }
-                       } else if (pn == pn_Cmp_Lt || pn == pn_Cmp_Le || pn == pn_Cmp_Ge || pn == pn_Cmp_Gt) {
-#if 0
-                               if (cl == t && cr == f) {
-                                       /* Mux(a <=/>= b, a, b) => Min, Max */
-                                       continue;
-                               }
-                               if (cl == f && cr == t) {
-                                       /* Mux(a <=/>= b, b, a) => Max, Min */
-                                       continue;
-                               }
-#endif
-                               if ((pn & pn_Cmp_Gt) && !mode_is_signed(mode) &&
-                                   is_Const(f) && is_Const_null(f) && is_Sub(t) &&
-                                   get_Sub_left(t) == cl && get_Sub_right(t) == cr) {
-                                       /* Mux(a >=u b, a - b, 0) unsigned Doz */
-                                       continue;
-                               }
-                               if ((pn & pn_Cmp_Lt) && !mode_is_signed(mode) &&
-                                   is_Const(t) && is_Const_null(t) && is_Sub(f) &&
-                                   get_Sub_left(f) == cl && get_Sub_right(f) == cr) {
-                                       /* Mux(a <=u b, 0, a - b) unsigned Doz */
-                                       continue;
-                               }
-                               if (is_Const(cr) && is_Const_null(cr)) {
-                                       if (cl == t && is_Minus(f) && get_Minus_op(f) == cl) {
-                                               /* Mux(a <=/>= 0 ? a : -a) Nabs/Abs */
-                                               continue;
-                                       } else if (cl == f && is_Minus(t) && get_Minus_op(t) == cl) {
-                                               /* Mux(a <=/>= 0 ? -a : a) Abs/Nabs */
-                                               continue;
-                                       }
-                               }
-                       }
-                       return 0;
+       /* no support for 64bit inputs to cmov */
+       mode = get_irn_mode(mux_true);
+       if (get_mode_size_bits(mode) > 32)
+               return false;
+       /* we can't handle MuxF yet */
+       if (mode_is_float(mode))
+               return false;
+
+       if (mux_is_doz(sel, mux_true, mux_false))
+               return true;
+
+       /* Check Cmp before the node */
+       if (is_Proj(sel)) {
+               ir_node *cmp = get_Proj_pred(sel);
+               if (is_Cmp(cmp)) {
+                       ir_mode *cmp_mode = get_irn_mode(get_Cmp_left(cmp));
+
+                       /* we can't handle 64bit compares */
+                       if (get_mode_size_bits(cmp_mode) > 32)
+                               return false;
+
+                       /* we can't handle float compares */
+                       if (mode_is_float(cmp_mode))
+                               return false;
                }
-               /* all checks passed */
-               return 1;
        }
-       return 0;
+
+       /* did we disable cmov generation? */
+       if (!ia32_cg_config.use_cmov)
+               return false;
+
+       /* we can use a cmov */
+       return true;
 }
 
-static asm_constraint_flags_t ia32_parse_asm_constraint(const void *self, const char **c)
+static asm_constraint_flags_t ia32_parse_asm_constraint(const char **c)
 {
-       (void) self;
        (void) c;
 
        /* we already added all our simple flags to the flags modifier list in
@@ -2339,10 +2374,8 @@ static asm_constraint_flags_t ia32_parse_asm_constraint(const void *self, const
        return ASM_CONSTRAINT_FLAG_INVALID;
 }
 
-static int ia32_is_valid_clobber(const void *self, const char *clobber)
+static int ia32_is_valid_clobber(const char *clobber)
 {
-       (void) self;
-
        return ia32_get_clobber_register(clobber) != NULL;
 }
 
@@ -2375,7 +2408,8 @@ static ir_node *ia32_create_trampoline_fkt(ir_node *block, ir_node *mem, ir_node
 /**
  * Returns the libFirm configuration parameter for this backend.
  */
-static const backend_params *ia32_get_libfirm_params(void) {
+static const backend_params *ia32_get_libfirm_params(void)
+{
        static const ir_settings_if_conv_t ifconv = {
                4,                    /* maxdepth, doesn't matter for Mux-conversion */
                ia32_is_mux_allowed   /* allows or disallows Mux creation for given selector */
@@ -2418,15 +2452,14 @@ static const backend_params *ia32_get_libfirm_params(void) {
 }
 
 static const lc_opt_enum_int_items_t gas_items[] = {
-       { "elf",     GAS_FLAVOUR_ELF },
-       { "mingw",   GAS_FLAVOUR_MINGW  },
-       { "yasm",    GAS_FLAVOUR_YASM   },
-       { "macho",   GAS_FLAVOUR_MACH_O },
-       { NULL,      0 }
+       { "elf",   OBJECT_FILE_FORMAT_ELF    },
+       { "mingw", OBJECT_FILE_FORMAT_COFF   },
+       { "macho", OBJECT_FILE_FORMAT_MACH_O },
+       { NULL,    0 }
 };
 
 static lc_opt_enum_int_var_t gas_var = {
-       (int*) &be_gas_flavour, gas_items
+       (int*) &be_gas_object_file_format, gas_items
 };
 
 #ifdef FIRM_GRGEN_BE