More missing config.h
[libfirm] / ir / be / ia32 / ia32_transform.c
index ee488d8..b2b79ca 100644 (file)
@@ -258,7 +258,6 @@ const char *ia32_get_old_node_name(ia32_code_gen_t *cg, ir_node *irn) {
 
        lc_eoprintf(firm_get_arg_env(), isa->name_obst, "%+F", irn);
        obstack_1grow(isa->name_obst, 0);
-       isa->name_obst_size += obstack_object_size(isa->name_obst);
        return obstack_finish(isa->name_obst);
 }
 #endif /* NDEBUG */
@@ -2226,7 +2225,8 @@ static ir_node *gen_Conv(ia32_transform_env_t *env) {
                set_ia32_tgt_mode(new_op, tgt_mode);
                set_ia32_src_mode(new_op, src_mode);
 
-               set_ia32_am_support(new_op, ia32_am_Source);
+               if(tgt_bits >= src_bits)
+                       set_ia32_am_support(new_op, ia32_am_Source);
 
                new_op = new_rd_Proj(dbg, irg, block, new_op, tgt_mode, pn);
 
@@ -2428,7 +2428,7 @@ static ir_node *gen_be_Call(ia32_transform_env_t *env) {
        if (mode_is_float(mode)) {
                /* store st(0) onto stack */
                ir_node *frame = get_irg_frame(env->irg);
-               ir_node *fstp  = new_rd_ia32_GetST0(env->dbg, env->irg, env->block, frame, call_mem);
+               ir_node *fstp  = new_rd_ia32_GetST0(env->dbg, env->irg, env->block, frame, get_irg_no_mem(env->irg));
                ir_node *mproj = new_r_Proj(env->irg, env->block, fstp, mode_M, pn_ia32_GetST0_M);
                entity  *ent   = frame_alloc_area(get_irg_frame_type(env->irg), get_mode_size_bytes(mode), 16, 0);
                ir_node *sse_load, *p, *bad, *keep;
@@ -2450,10 +2450,19 @@ static ir_node *gen_be_Call(ia32_transform_env_t *env) {
                set_ia32_frame_ent(sse_load, ent);
                set_ia32_am_flavour(sse_load, ia32_B);
                set_ia32_am_support(sse_load, ia32_am_Source);
+               mproj    = new_r_Proj(env->irg, env->block, sse_load, mode_M, pn_ia32_xLoad_M);
                sse_load = new_r_Proj(env->irg, env->block, sse_load, mode, pn_ia32_xLoad_res);
 
                /* reroute all users of the result proj to the sse load */
                edges_reroute(call_res, sse_load, env->irg);
+               edges_reroute_kind(call_res, sse_load,  EDGE_KIND_DEP, env->irg);
+
+               /* reroute all users of the old call memory to the sse load memory */
+               edges_reroute(call_mem, mproj, env->irg);
+               edges_reroute_kind(call_mem, mproj, EDGE_KIND_DEP, env->irg);
+
+               /* now, we can set the old call mem as input of GetST0 */
+               set_irn_n(fstp, 1, call_mem);
 
                /* now: create new Keep whith all former ins and one additional in - the result Proj */
 
@@ -2495,7 +2504,7 @@ static ir_node *gen_be_Call(ia32_transform_env_t *env) {
 static ir_node *gen_be_Return(ia32_transform_env_t *env) {
        ir_node *ret_val = get_irn_n(env->irn, be_pos_Return_val);
        ir_node *ret_mem = get_irn_n(env->irn, be_pos_Return_mem);
-       entity *ent      = get_irg_entity(get_irn_irg(ret_val));
+       entity  *ent     = get_irg_entity(get_irn_irg(ret_val));
        ir_type *tp      = get_entity_type(ent);
 
        if (be_Return_get_n_rets(env->irn) < 1 || ! ret_val || ! USE_SSE2(env->cg))
@@ -2828,6 +2837,7 @@ GEN_LOWERED_OP(Sub)
 GEN_LOWERED_OP(Mul)
 GEN_LOWERED_OP(Eor)
 GEN_LOWERED_x87_OP(vfdiv)
+GEN_LOWERED_x87_OP(vfprem)
 GEN_LOWERED_x87_OP(vfmul)
 GEN_LOWERED_x87_OP(vfsub)
 
@@ -2973,6 +2983,7 @@ static ir_node *gen_ia32_l_X87toSSE(ia32_transform_env_t *env) {
                set_ia32_ls_mode(res, get_ia32_ls_mode(env->irn));
                set_ia32_am_support(res, ia32_am_Dest);
                set_ia32_am_flavour(res, ia32_B);
+               set_ia32_op_type(res, ia32_AddrModeD);
                res = new_rd_Proj(env->dbg, env->irg, env->block, res, mode_M, pn_ia32_vfst_M);
 
                /* Load MEM -> SSE */
@@ -2982,6 +2993,7 @@ static ir_node *gen_ia32_l_X87toSSE(ia32_transform_env_t *env) {
                set_ia32_ls_mode(res, get_ia32_ls_mode(env->irn));
                set_ia32_am_support(res, ia32_am_Source);
                set_ia32_am_flavour(res, ia32_B);
+               set_ia32_op_type(res, ia32_AddrModeS);
                res = new_rd_Proj(env->dbg, env->irg, env->block, res, get_ia32_ls_mode(env->irn), pn_ia32_xLoad_res);
        }
        else {
@@ -3000,32 +3012,48 @@ static ir_node *gen_ia32_l_X87toSSE(ia32_transform_env_t *env) {
  * In case SSE Unit is used, the node is transformed into a xStore + vfld.
  */
 static ir_node *gen_ia32_l_SSEtoX87(ia32_transform_env_t *env) {
-       ia32_code_gen_t *cg  = env->cg;
-       ir_node         *res = NULL;
-       ir_node         *ptr = get_irn_n(env->irn, 0);
-       ir_node         *val = get_irn_n(env->irn, 1);
-       ir_node         *mem = get_irn_n(env->irn, 2);
+       ia32_code_gen_t *cg     = env->cg;
+       ir_node         *res    = NULL;
+       ir_node         *ptr    = get_irn_n(env->irn, 0);
+       ir_node         *val    = get_irn_n(env->irn, 1);
+       ir_node         *mem    = get_irn_n(env->irn, 2);
+       entity          *fent   = get_ia32_frame_ent(env->irn);
+       ir_mode         *lsmode = get_ia32_ls_mode(env->irn);
+       int             offs    = 0;
 
        if (USE_SSE2(cg)) {
                ir_node *noreg = ia32_new_NoReg_gp(cg);
 
                /* Store SSE -> MEM */
-               res = new_rd_ia32_xStore(env->dbg, env->irg, env->block, ptr, noreg, val, mem);
-               set_ia32_frame_ent(res, get_ia32_frame_ent(env->irn));
-               set_ia32_use_frame(res);
-               set_ia32_ls_mode(res, get_ia32_ls_mode(env->irn));
-               set_ia32_am_support(res, ia32_am_Dest);
-               set_ia32_am_flavour(res, ia32_B);
-               res = new_rd_Proj(env->dbg, env->irg, env->block, res, mode_M, pn_ia32_xStore_M);
+               if (is_ia32_xLoad(skip_Proj(val))) {
+                       ir_node *ld = skip_Proj(val);
+
+                       /* we can vfld the value directly into the fpu */
+                       fent = get_ia32_frame_ent(ld);
+                       ptr  = get_irn_n(ld, 0);
+                       offs = get_ia32_am_offs_int(ld);
+               }
+               else {
+                       res = new_rd_ia32_xStore(env->dbg, env->irg, env->block, ptr, noreg, val, mem);
+                       set_ia32_frame_ent(res, fent);
+                       set_ia32_use_frame(res);
+                       set_ia32_ls_mode(res, lsmode);
+                       set_ia32_am_support(res, ia32_am_Dest);
+                       set_ia32_am_flavour(res, ia32_B);
+                       set_ia32_op_type(res, ia32_AddrModeD);
+                       mem = new_rd_Proj(env->dbg, env->irg, env->block, res, mode_M, pn_ia32_xStore_M);
+               }
 
                /* Load MEM -> x87 */
                res = new_rd_ia32_vfld(env->dbg, env->irg, env->block, ptr, noreg, mem);
-               set_ia32_frame_ent(res, get_ia32_frame_ent(env->irn));
+               set_ia32_frame_ent(res, fent);
                set_ia32_use_frame(res);
-               set_ia32_ls_mode(res, get_ia32_ls_mode(env->irn));
+               set_ia32_ls_mode(res, lsmode);
+               add_ia32_am_offs_int(res, offs);
                set_ia32_am_support(res, ia32_am_Source);
                set_ia32_am_flavour(res, ia32_B);
-               res = new_rd_Proj(env->dbg, env->irg, env->block, res, get_ia32_ls_mode(env->irn), pn_ia32_vfld_res);
+               set_ia32_op_type(res, ia32_AddrModeS);
+               res = new_rd_Proj(env->dbg, env->irg, env->block, res, lsmode, pn_ia32_vfld_res);
        }
        else {
                /* SSE unit is not used -> skip this node. */
@@ -3117,6 +3145,7 @@ void ia32_register_transformers(void) {
        GEN(ia32_l_ShlD);
        GEN(ia32_l_ShrD);
        GEN(ia32_l_vfdiv);
+       GEN(ia32_l_vfprem);
        GEN(ia32_l_vfmul);
        GEN(ia32_l_vfsub);
        GEN(ia32_l_vfild);