be_abi_put_ignore_regs returns now number of ignore registers as unsigned
[libfirm] / ir / be / ia32 / bearch_ia32.c
index ecaa4eb..1c83647 100644 (file)
@@ -1,7 +1,27 @@
+/*
+ * Copyright (C) 1995-2007 University of Karlsruhe.  All right reserved.
+ *
+ * This file is part of libFirm.
+ *
+ * This file may be distributed and/or modified under the terms of the
+ * GNU General Public License version 2 as published by the Free Software
+ * Foundation and appearing in the file LICENSE.GPL included in the
+ * packaging of this file.
+ *
+ * Licensees holding valid libFirm Professional Edition licenses may use
+ * this file in accordance with the libFirm Commercial License.
+ * Agreement provided with the Software.
+ *
+ * This file is provided AS IS with NO WARRANTY OF ANY KIND, INCLUDING THE
+ * WARRANTY OF DESIGN, MERCHANTABILITY AND FITNESS FOR A PARTICULAR
+ * PURPOSE.
+ */
+
 /**
- * This is the main ia32 firm backend driver.
- * @author Christian Wuerdig
- * $Id$
+ * @file
+ * @brief       This is the main ia32 firm backend driver.
+ * @author      Christian Wuerdig
+ * @version     $Id$
  */
 #ifdef HAVE_CONFIG_H
 #include "config.h"
@@ -29,7 +49,7 @@
 #include "xmalloc.h"
 
 #include "../beabi.h"
-#include "../beirg.h"
+#include "../beirg_t.h"
 #include "../benode_t.h"
 #include "../belower.h"
 #include "../besched_t.h"
@@ -65,11 +85,13 @@ DEBUG_ONLY(static firm_dbg_module_t *dbg = NULL;)
 /* TODO: ugly */
 static set *cur_reg_set = NULL;
 
+ir_mode *mode_fpcw = NULL;
+
 typedef ir_node *(*create_const_node_func) (dbg_info *dbg, ir_graph *irg, ir_node *block);
 
 static INLINE ir_node *create_const(ia32_code_gen_t *cg, ir_node **place,
                                     create_const_node_func func,
-                                    arch_register_t* reg)
+                                    const arch_register_t* reg)
 {
        ir_node *block, *res;
 
@@ -81,11 +103,6 @@ static INLINE ir_node *create_const(ia32_code_gen_t *cg, ir_node **place,
        arch_set_irn_register(cg->arch_env, res, reg);
        *place = res;
 
-#if 0
-       /* keep the node so it isn't accidently removed when unused ... */
-       in[0] = res;
-       keep = be_new_Keep(arch_register_get_class(reg), cg->irg, block, 1, in);
-#endif
        add_irn_dep(get_irg_end(cg->irg), res);
        /* add_irn_dep(get_irg_start(cg->irg), res); */
 
@@ -272,7 +289,7 @@ static arch_irn_class_t ia32_classify(const void *self, const ir_node *irn) {
        if (is_ia32_Ld(irn))
                classification |= arch_irn_class_load;
 
-       if (is_ia32_St(irn) || is_ia32_Store8Bit(irn))
+       if (is_ia32_St(irn))
                classification |= arch_irn_class_store;
 
        if (is_ia32_need_stackent(irn))
@@ -397,6 +414,9 @@ static const arch_register_t *ia32_abi_prologue(void *self, ir_node **mem, pmap
                ir_node *noreg = ia32_new_NoReg_gp(cg);
                ir_node *push;
 
+               /* ALL nodes representing bp must be set to ignore. */
+               be_node_set_flags(get_Proj_pred(curr_bp), BE_OUT_POS(get_Proj_proj(curr_bp)), arch_irn_flags_ignore);
+
                /* push ebp */
                push    = new_rd_ia32_Push(NULL, env->irg, bl, noreg, noreg, curr_bp, curr_sp, *mem);
                curr_sp = new_r_Proj(env->irg, bl, push, get_irn_mode(curr_sp), pn_ia32_Push_stack);
@@ -864,7 +884,7 @@ static void ia32_prepare_graph(void *self) {
                be_dump(cg->irg, "-transformed", dump_ir_block_graph_sched);
 
        /* optimize address mode */
-       ia32_optimize_addressmode(cg);
+       ia32_optimize_graph(cg);
 
        if (cg->dump)
                be_dump(cg->irg, "-am", dump_ir_block_graph_sched);
@@ -1074,15 +1094,12 @@ static void transform_to_Store(ia32_code_gen_t *cg, ir_node *node) {
                        store = new_rd_ia32_xStore(dbg, irg, block, ptr, noreg, val, nomem);
                else
                        store = new_rd_ia32_vfst(dbg, irg, block, ptr, noreg, val, nomem);
-       }
-       else if (get_mode_size_bits(mode) == 128) {
+       } else if (get_mode_size_bits(mode) == 128) {
                // Spill 128 bit SSE registers
                store = new_rd_ia32_xxStore(dbg, irg, block, ptr, noreg, val, nomem);
-       }
-       else if (get_mode_size_bits(mode) == 8) {
+       } else if (get_mode_size_bits(mode) == 8) {
                store = new_rd_ia32_Store8Bit(dbg, irg, block, ptr, noreg, val, nomem);
-       }
-       else {
+       } else {
                store = new_rd_ia32_Store(dbg, irg, block, ptr, noreg, val, nomem);
        }
 
@@ -1178,19 +1195,24 @@ static void transform_MemPerm(ia32_code_gen_t *cg, ir_node *node) {
 
        // create pushs
        for(i = 0; i < arity; ++i) {
-               ir_entity *ent = be_get_MemPerm_in_entity(node, i);
-               ir_type *enttype = get_entity_type(ent);
+               ir_entity *inent = be_get_MemPerm_in_entity(node, i);
+               ir_entity *outent = be_get_MemPerm_out_entity(node, i);
+               ir_type *enttype = get_entity_type(inent);
                int entbits = get_type_size_bits(enttype);
+               int entbits2 = get_type_size_bits(get_entity_type(outent));
                ir_node *mem = get_irn_n(node, i + 1);
                ir_node *push;
 
+               /* work around cases where entities have different sizes */
+               if(entbits2 < entbits)
+                       entbits = entbits2;
                assert( (entbits == 32 || entbits == 64) && "spillslot on x86 should be 32 or 64 bit");
 
-               push = create_push(cg, node, node, sp, mem, ent);
+               push = create_push(cg, node, node, sp, mem, inent);
                sp = create_spproj(cg, node, push, pn_ia32_Push_stack, node);
                if(entbits == 64) {
                        // add another push after the first one
-                       push = create_push(cg, node, node, sp, mem, ent);
+                       push = create_push(cg, node, node, sp, mem, inent);
                        add_ia32_am_offs_int(push, 4);
                        sp = create_spproj(cg, node, push, pn_ia32_Push_stack, node);
                }
@@ -1200,21 +1222,25 @@ static void transform_MemPerm(ia32_code_gen_t *cg, ir_node *node) {
 
        // create pops
        for(i = arity - 1; i >= 0; --i) {
-               ir_entity *ent = be_get_MemPerm_out_entity(node, i);
-               ir_type *enttype = get_entity_type(ent);
+               ir_entity *inent = be_get_MemPerm_in_entity(node, i);
+               ir_entity *outent = be_get_MemPerm_out_entity(node, i);
+               ir_type *enttype = get_entity_type(outent);
                int entbits = get_type_size_bits(enttype);
-
+               int entbits2 = get_type_size_bits(get_entity_type(inent));
                ir_node *pop;
 
+               /* work around cases where entities have different sizes */
+               if(entbits2 < entbits)
+                       entbits = entbits2;
                assert( (entbits == 32 || entbits == 64) && "spillslot on x86 should be 32 or 64 bit");
 
-               pop = create_pop(cg, node, node, sp, ent);
+               pop = create_pop(cg, node, node, sp, outent);
                sp = create_spproj(cg, node, pop, pn_ia32_Pop_stack, node);
                if(entbits == 64) {
                        add_ia32_am_offs_int(pop, 4);
 
                        // add another pop after the first one
-                       pop = create_pop(cg, node, node, sp, ent);
+                       pop = create_pop(cg, node, node, sp, outent);
                        sp = create_spproj(cg, node, pop, pn_ia32_Pop_stack, node);
                }
 
@@ -1296,9 +1322,7 @@ static void ia32_collect_frame_entity_nodes(ir_node *node, void *data)
                        be_node_needs_frame_entity(env, node, mode, align);
                } else {
 #ifndef NDEBUG
-                       if(!is_ia32_Store(node)
-                                       && !is_ia32_xStore(node)
-                                       && !is_ia32_xStoreSimple(node)
+                       if(!is_ia32_St(node) && !is_ia32_xStoreSimple(node)
                                        && !is_ia32_vfist(node)
                                        && !is_ia32_GetST0(node)
                                        && !is_ia32_FnstCW(node)) {
@@ -1513,6 +1537,10 @@ static void *ia32_init(FILE *file_handle) {
        isa = xmalloc(sizeof(*isa));
        memcpy(isa, &ia32_isa_template, sizeof(*isa));
 
+       if(mode_fpcw == NULL) {
+               mode_fpcw = new_ir_mode("Fpcw", irms_int_number, 16, 0, irma_none, 0);
+       }
+
        ia32_register_init(isa);
        ia32_create_opcodes();
        ia32_register_copy_attr_func();
@@ -1537,16 +1565,6 @@ static void *ia32_init(FILE *file_handle) {
        ia32_build_16bit_reg_map(isa->regs_16bit);
        ia32_build_8bit_reg_map(isa->regs_8bit);
 
-       /* patch register names of x87 registers */
-       ia32_st_regs[0].name = "st";
-       ia32_st_regs[1].name = "st(1)";
-       ia32_st_regs[2].name = "st(2)";
-       ia32_st_regs[3].name = "st(3)";
-       ia32_st_regs[4].name = "st(4)";
-       ia32_st_regs[5].name = "st(5)";
-       ia32_st_regs[6].name = "st(6)";
-       ia32_st_regs[7].name = "st(7)";
-
 #ifndef NDEBUG
        isa->name_obst = xmalloc(sizeof(*isa->name_obst));
        obstack_init(isa->name_obst);