remove #ifdef HAVE_CONFIG_Hs
[libfirm] / ir / be / ia32 / ia32_intrinsics.c
index 2670b72..026cd38 100644 (file)
@@ -1,5 +1,5 @@
 /*
- * Copyright (C) 1995-2007 University of Karlsruhe.  All right reserved.
+ * Copyright (C) 1995-2008 University of Karlsruhe.  All right reserved.
  *
  * This file is part of libFirm.
  *
@@ -24,9 +24,7 @@
  * @author      Michael Beck
  * @version     $Id$
  */
-#ifdef HAVE_CONFIG_H
 #include "config.h"
-#endif
 
 #include "irgmod.h"
 #include "irop.h"
@@ -35,6 +33,7 @@
 #include "irprog_t.h"
 #include "lowering.h"
 #include "array.h"
+#include "error.h"
 
 #include "ia32_new_nodes.h"
 #include "bearch_ia32_t.h"
@@ -43,8 +42,8 @@
 /** The array of all intrinsics that must be mapped. */
 static i_record *intrinsics;
 
-/** An array to cache all entities */
-static ir_entity *i_ents[iro_MaxOpcode];
+/** An array to cache all entities. */
+static ir_entity *i_ents[iro_Last + 1];
 
 /*
  * Maps all intrinsic calls that the backend support
@@ -66,19 +65,34 @@ void ia32_handle_intrinsics(void) {
  * Replace a call be a tuple of l_res, h_res.
  */
 static void resolve_call(ir_node *call, ir_node *l_res, ir_node *h_res, ir_graph *irg, ir_node *block) {
-       ir_node *res, *in[2];
+       ir_node *jmp, *res, *in[2];
+       ir_node *bad   = get_irg_bad(irg);
+       ir_node *nomem = get_irg_no_mem(irg);
+       int     old_cse;
 
        in[0] = l_res;
        in[1] = h_res;
        res = new_r_Tuple(irg, block, h_res == NULL ? 1 : 2, in);
 
        turn_into_tuple(call, pn_Call_max);
-       set_Tuple_pred(call, pn_Call_M_regular,        get_irg_no_mem(irg));
-       set_Tuple_pred(call, pn_Call_X_regular,        new_r_Jmp(irg, block));
-       set_Tuple_pred(call, pn_Call_X_except,         get_irg_bad(irg));
+       set_Tuple_pred(call, pn_Call_M_regular,        nomem);
+       /*
+        * Beware:
+        * We do not check here if this call really has exception and regular Proj's.
+        * new_r_Jmp might than be CSEd with the real exit jmp and then bad things happen
+        * (in movgen.c from 186.crafty for example).
+        * So be sure the newly created Jmp cannot CSE.
+        */
+       old_cse = get_opt_cse();
+       set_opt_cse(0);
+       jmp = new_r_Jmp(irg, block);
+       set_opt_cse(old_cse);
+
+       set_Tuple_pred(call, pn_Call_X_regular,        jmp);
+       set_Tuple_pred(call, pn_Call_X_except,         bad);
        set_Tuple_pred(call, pn_Call_T_result,         res);
-       set_Tuple_pred(call, pn_Call_M_except,         get_irg_no_mem(irg));
-       set_Tuple_pred(call, pn_Call_P_value_res_base, get_irg_bad(irg));
+       set_Tuple_pred(call, pn_Call_M_except,         nomem);
+       set_Tuple_pred(call, pn_Call_P_value_res_base, bad);
 }
 
 /**
@@ -221,13 +235,13 @@ static int map_Shl(ir_node *call, void *ctx) {
        in[0] = l1;
        in[1] = l2;
        l_res = new_r_Phi(irg, block, 2, in, l_mode);
-       set_irn_link(block, l_res);
+       set_Block_phis(block, l_res);
 
        in[0] = h1;
        in[1] = h2;
        h_res = new_r_Phi(irg, block, 2, in, h_mode);
-       set_irn_link(l_res, h_res);
-       set_irn_link(h_res, NULL);
+       set_Phi_next(l_res, h_res);
+       set_Phi_next(h_res, NULL);
 
        /* move it down */
        set_nodes_block(call, block);
@@ -299,7 +313,7 @@ static int map_Shr(ir_node *call, void *ctx) {
        /* the block for cnt >= 32 */
        n_block = new_rd_Block(dbg, irg, 1, &in[1]);
        l2      = new_rd_Conv(dbg, irg, n_block, h1, l_mode);
-       h2      = new_r_Const(irg, n_block, l_mode, get_mode_null(h_mode));
+       h2      = new_r_Const(irg, n_block, h_mode, get_mode_null(h_mode));
        in[1]   = new_r_Jmp(irg, n_block);
 
        set_irn_in(block, 2, in);
@@ -307,13 +321,13 @@ static int map_Shr(ir_node *call, void *ctx) {
        in[0] = l1;
        in[1] = l2;
        l_res = new_r_Phi(irg, block, 2, in, l_mode);
-       set_irn_link(block, l_res);
+       set_Block_phis(block, l_res);
 
        in[0] = h1;
        in[1] = h2;
        h_res = new_r_Phi(irg, block, 2, in, h_mode);
-       set_irn_link(l_res, h_res);
-       set_irn_link(h_res, NULL);
+       set_Phi_next(l_res, h_res);
+       set_Phi_next(h_res, NULL);
 
        /* move it down */
        set_nodes_block(call, block);
@@ -395,13 +409,13 @@ static int map_Shrs(ir_node *call, void *ctx) {
        in[0] = l1;
        in[1] = l2;
        l_res = new_r_Phi(irg, block, 2, in, l_mode);
-       set_irn_link(block, l_res);
+       set_Block_phis(block, l_res);
 
        in[0] = h1;
        in[1] = h2;
        h_res = new_r_Phi(irg, block, 2, in, h_mode);
-       set_irn_link(l_res, h_res);
-       set_irn_link(h_res, NULL);
+       set_Phi_next(l_res, h_res);
+       set_Phi_next(h_res, NULL);
 
        /* move it down */
        set_nodes_block(call, block);
@@ -412,6 +426,39 @@ static int map_Shrs(ir_node *call, void *ctx) {
        return 1;
 }
 
+static int is_sign_extend(ir_node *low, ir_node *high)
+{
+       if (is_Shrs(high)) {
+               ir_node *high_l;
+               ir_node *high_r;
+               tarval  *shift_count;
+
+               high_r = get_Shrs_right(high);
+               if (!is_Const(high_r)) return 0;
+
+               shift_count = get_Const_tarval(high_r);
+               if (!tarval_is_long(shift_count))       return 0;
+               if (get_tarval_long(shift_count) != 31) return 0;
+
+               high_l = get_Shrs_left(high);
+
+               if (is_Conv(low)    && get_Conv_op(low)    == high_l) return 1;
+               if (is_Conv(high_l) && get_Conv_op(high_l) == low)    return 1;
+       } else if (is_Const(low) && is_Const(high)) {
+               tarval *tl = get_Const_tarval(low);
+               tarval *th = get_Const_tarval(high);
+
+               if (tarval_is_long(th) && tarval_is_long(tl)) {
+                       long l = get_tarval_long(tl);
+                       long h = get_tarval_long(th);
+
+                       return (h == 0  && l >= 0) || (h == -1 && l <  0);
+               }
+       }
+
+       return 0;
+}
+
 /**
  * Map a Mul (a_l, a_h, b_l, b_h)
  */
@@ -441,44 +488,12 @@ static int map_Mul(ir_node *call, void *ctx) {
        */
 
        /* handle the often used case of 32x32=64 mul */
-       if (is_Shrs(a_h) && get_Shrs_left(a_h) == a_l) {
-               ir_node *c1 = get_Shrs_right(a_h);
-
-               if (is_Const(c1)) {
-                       tarval *tv = get_Const_tarval(c1);
-
-                       if (tarval_is_long(tv) && get_tarval_long(tv) == 31) {
-                               /* a is a sign extend */
-
-                               if (is_Shrs(b_h) && get_Shrs_left(b_h) == b_l && c1 == get_Shrs_right(b_h)) {
-                                       /* b is a sign extend: it's a 32 * 32 = 64 signed multiplication */
-                                       mul   = new_rd_ia32_l_IMul(dbg, irg, block, a_l, b_l);
-                                       h_res = new_rd_Proj(dbg, irg, block, mul, h_mode, pn_ia32_l_Mul_EDX);
-                                       l_res = new_rd_Proj(dbg, irg, block, mul, l_mode, pn_ia32_l_Mul_EAX);
-
-                                       goto end;
-                               }
-                               /* we rely here on Consts being on the right side */
-                               if (is_Const(b_h) && is_Const(b_l)) {
-                                       tarval *th = get_Const_tarval(b_h);
-                                       tarval *tl = get_Const_tarval(b_l);
-
-                                       if (tarval_is_long(th) && tarval_is_long(tl)) {
-                                               long h = get_tarval_long(th);
-                                               long l = get_tarval_long(tl);
-
-                                               if ((h == 0 && l >= 0) || (h == -1 && l < 0)) {
-                                                       /* b is a sign extended const */
-                                                       mul   = new_rd_ia32_l_IMul(dbg, irg, block, a_l, b_l);
-                                                       h_res = new_rd_Proj(dbg, irg, block, mul, h_mode, pn_ia32_l_Mul_EDX);
-                                                       l_res = new_rd_Proj(dbg, irg, block, mul, l_mode, pn_ia32_l_Mul_EAX);
-
-                                                       goto end;
-                                               }
-                                       }
-                               }
-                       }
-               }
+       if (is_sign_extend(a_l, a_h) && is_sign_extend(b_l, b_h)) {
+               mul   = new_rd_ia32_l_IMul(dbg, irg, block, a_l, b_l);
+               h_res = new_rd_Proj(dbg, irg, block, mul, h_mode, pn_ia32_l_Mul_EDX);
+               l_res = new_rd_Proj(dbg, irg, block, mul, l_mode, pn_ia32_l_Mul_EAX);
+
+               goto end;
        }
 
        mul   = new_rd_ia32_l_Mul(dbg, irg, block, a_l, b_l);
@@ -617,7 +632,7 @@ static int map_Div(ir_node *call, void *ctx) {
 static int map_Mod(ir_node *call, void *ctx) {
        ia32_intrinsic_env_t *env = ctx;
        ir_type   *method    = get_Call_type(call);
-       ir_mode   *h_mode    = get_type_mode(get_method_res_type(method, 0));
+       ir_mode   *h_mode    = get_type_mode(get_method_res_type(method, 1));
        ir_node   *ptr;
        ir_entity *ent;
        symconst_symbol sym;
@@ -651,20 +666,18 @@ static int map_Mod(ir_node *call, void *ctx) {
  * Maps a Conv.
  */
 static int map_Conv(ir_node *call, void *ctx) {
-       ia32_intrinsic_env_t *env = ctx;
-       ir_graph  *irg        = current_ir_graph;
-       dbg_info  *dbg        = get_irn_dbg_info(call);
-       ir_node   *block      = get_nodes_block(call);
-       ir_node   **params    = get_Call_param_arr(call);
-       ir_type   *method     = get_Call_type(call);
-       int       n           = get_Call_n_params(call);
-       int       gp_bytes    = get_mode_size_bytes(ia32_reg_classes[CLASS_ia32_gp].mode);
-       ir_entity *ent;
-       ir_node   *l_res, *h_res, *frame, *fres;
-       ir_node   *store_l, *store_h;
-       ir_node   *op_mem[2], *mem;
+       ir_graph  *irg     = current_ir_graph;
+       dbg_info  *dbg     = get_irn_dbg_info(call);
+       ir_node   *block   = get_nodes_block(call);
+       ir_node   **params = get_Call_param_arr(call);
+       ir_type   *method  = get_Call_type(call);
+       int       n        = get_Call_n_params(call);
+       ir_node   *l_res, *h_res;
+       (void) ctx;
 
        if (n == 1) {
+               ir_node *float_to_ll;
+
                /* We have a Conv float -> long long here */
                ir_node *a_f        = params[0];
                ir_mode *l_res_mode = get_type_mode(get_method_res_type(method, 0));
@@ -672,113 +685,33 @@ static int map_Conv(ir_node *call, void *ctx) {
 
                assert(mode_is_float(get_irn_mode(a_f)) && "unexpected Conv call");
 
-               /* allocate memory on frame to store args */
-               ent = env->irg == irg ? env->d_ll_conv : NULL;
-               if (! ent) {
-                       ent      = env->d_ll_conv = frame_alloc_area(get_irg_frame_type(irg), 2 * gp_bytes, 16, 0);
-                       env->irg = irg;
-               }
+               float_to_ll = new_rd_ia32_l_FloattoLL(dbg, irg, block, a_f);
 
-               /* Store arg */
-               frame = get_irg_frame(irg);
-
-               /*
-                       Now we create a node to move the value from a XMM register into
-                       x87 FPU because it is unknown here, which FPU is used.
-                       This node is killed in transformation phase when not needed.
-                       Otherwise it is split up into a movsd + fld
-               */
-               a_f = new_rd_ia32_l_SSEtoX87(dbg, irg, block, frame, a_f, get_irg_no_mem(irg), mode_D);
-               set_ia32_frame_ent(a_f, ent);
-               set_ia32_use_frame(a_f);
-               set_ia32_ls_mode(a_f, mode_D);
-
-               /* store from FPU as Int */
-               a_f = new_rd_ia32_l_vfist(dbg, irg, block, frame, a_f, get_irg_no_mem(irg));
-               set_ia32_frame_ent(a_f, ent);
-               set_ia32_use_frame(a_f);
-               set_ia32_ls_mode(a_f, mode_Ls);
-               mem = a_f;
-
-               /* load low part of the result */
-               l_res = new_rd_ia32_l_Load(dbg, irg, block, frame, mem);
-               set_ia32_frame_ent(l_res, ent);
-               set_ia32_use_frame(l_res);
-               set_ia32_ls_mode(l_res, l_res_mode);
-               l_res = new_r_Proj(irg, block, l_res, l_res_mode, pn_ia32_l_Load_res);
-
-               /* load hight part of the result */
-               h_res = new_rd_ia32_l_Load(dbg, irg, block, frame, mem);
-               set_ia32_frame_ent(h_res, ent);
-               add_ia32_am_offs_int(h_res, gp_bytes);
-               set_ia32_use_frame(h_res);
-               set_ia32_ls_mode(h_res, h_res_mode);
-               h_res = new_r_Proj(irg, block, h_res, h_res_mode, pn_ia32_l_Load_res);
+               l_res = new_r_Proj(irg, block, float_to_ll, l_res_mode,
+                                  pn_ia32_l_FloattoLL_res_low);
+               h_res = new_r_Proj(irg, block, float_to_ll, h_res_mode,
+                                  pn_ia32_l_FloattoLL_res_high);
 
                /* lower the call */
                resolve_call(call, l_res, h_res, irg, block);
-       }
-       else if (n == 2) {
+       } else if (n == 2) {
+               ir_node *ll_to_float;
+
                /* We have a Conv long long -> float here */
                ir_node *a_l       = params[BINOP_Left_Low];
                ir_node *a_h       = params[BINOP_Left_High];
-               ir_mode *mode_a_l  = get_irn_mode(a_l);
-               ir_mode *mode_a_h  = get_irn_mode(a_h);
                ir_mode *fres_mode = get_type_mode(get_method_res_type(method, 0));
 
-               assert(! mode_is_float(mode_a_l) && ! mode_is_float(mode_a_h) && "unexpected Conv call");
-
-               /* allocate memory on frame to store args */
-               ent = env->irg == irg ? env->ll_d_conv : NULL;
-               if (! ent) {
-                       ent = env->ll_d_conv = frame_alloc_area(get_irg_frame_type(irg), 2 * gp_bytes, 16, 0);
-                       env->irg = irg;
-               }
+               assert(! mode_is_float(get_irn_mode(a_l))
+                               && ! mode_is_float(get_irn_mode(a_h)));
 
-               /* Store arg */
-               frame = get_irg_frame(irg);
-
-               /* store first arg (low part) */
-               store_l   = new_rd_ia32_l_Store(dbg, irg, block, frame, a_l, get_irg_no_mem(irg));
-               set_ia32_frame_ent(store_l, ent);
-               set_ia32_use_frame(store_l);
-               set_ia32_ls_mode(store_l, get_irn_mode(a_l));
-               op_mem[0] = store_l;
-
-               /* store second arg (high part) */
-               store_h   = new_rd_ia32_l_Store(dbg, irg, block, frame, a_h, get_irg_no_mem(irg));
-               set_ia32_frame_ent(store_h, ent);
-               add_ia32_am_offs_int(store_h, gp_bytes);
-               set_ia32_use_frame(store_h);
-               set_ia32_ls_mode(store_h, get_irn_mode(a_h));
-               op_mem[1] = store_h;
-
-               mem = new_r_Sync(irg, block, 2, op_mem);
-
-               /* Load arg into x87 FPU (implicit convert) */
-               fres = new_rd_ia32_l_vfild(dbg, irg, block, frame, mem);
-               set_ia32_frame_ent(fres, ent);
-               set_ia32_use_frame(fres);
-               set_ia32_ls_mode(fres, mode_D);
-               mem  = new_r_Proj(irg, block, fres, mode_M, pn_ia32_l_vfild_M);
-               fres = new_r_Proj(irg, block, fres, fres_mode, pn_ia32_l_vfild_res);
-
-               /*
-                       Now we create a node to move the loaded value into a XMM
-                       register because it is unknown here, which FPU is used.
-                       This node is killed in transformation phase when not needed.
-                       Otherwise it is split up into a fst + movsd
-               */
-               fres = new_rd_ia32_l_X87toSSE(dbg, irg, block, frame, fres, mem, fres_mode);
-               set_ia32_frame_ent(fres, ent);
-               set_ia32_use_frame(fres);
-               set_ia32_ls_mode(fres, fres_mode);
+               ll_to_float = new_rd_ia32_l_LLtoFloat(dbg, irg, block, a_h, a_l,
+                                                     fres_mode);
 
                /* lower the call */
-               resolve_call(call, fres, NULL, irg, block);
-       }
-       else {
-               assert(0 && "unexpected Conv call");
+               resolve_call(call, ll_to_float, NULL, irg, block);
+       } else {
+               panic("unexpected Conv call %+F", call);
        }
 
        return 1;