added nolea option to switch of LEA optimization
[libfirm] / ir / be / ia32 / bearch_ia32_t.h
index e49dc24..08f9a34 100644 (file)
@@ -3,6 +3,7 @@
 
 #include "firm_config.h"
 
+#include "pmap.h"
 #include "debug.h"
 #include "bearch_ia32.h"
 #include "ia32_nodes_attr.h"
 /**
  * Bitmask for the backend optimization settings.
  */
-typedef struct _ia32_optimize_t {
-       unsigned incdec    : 1;   /**< optimize add/sub 1/-1 to inc/dec */
-       unsigned doam      : 1;   /**< do address mode optimizations */
-       unsigned placecnst : 1;   /**< place constants in the blocks where they are used */
-       unsigned immops    : 1;   /**< create operations with immediate operands */
-       unsigned extbb     : 1;   /**< do extended basic block scheduling */
+typedef enum _ia32_optimize_t {
+       IA32_OPT_INCDEC    = 1,   /**< optimize add/sub 1/-1 to inc/dec */
+       IA32_OPT_DOAM      = 2,   /**< do address mode optimizations */
+       IA32_OPT_LEA       = 4,   /**< optimize address caluclations into LEAs */
+       IA32_OPT_PLACECNST = 8,   /**< place constants in the blocks where they are used */
+       IA32_OPT_IMMOPS    = 16,  /**< create operations with immediate operands */
+       IA32_OPT_EXTBB     = 32,  /**< do extended basic block scheduling */
 } ia32_optimize_t;
 
-/** architectures */
+/**
+ * Architectures. Clustered for easier macro implementation,
+ * do not change.
+ */
 typedef enum cpu_support {
-  arch_i386,          /**< i386 */
-  arch_i486,          /**< i486 */
-  arch_pentium,       /**< Pentium */
-  arch_pentium_pro,   /**< Pentium Pro */
-  arch_pentium_mmx,   /**< Pentium MMX */
-  arch_pentium_2,     /**< Pentium II */
-  arch_pentium_3,     /**< Pentium III */
-  arch_pentium_4,     /**< Pentium IV */
-  arch_pentium_m,     /**< Pentium M */
-  arch_core,          /**< Core */
-  arch_k6,            /**< K6 */
-  arch_athlon,        /**< Athlon */
-  arch_athlon_64,     /**< Athlon64 */
-  arch_opteron,       /**< Opteron */
+       arch_i386,          /**< i386 */
+       arch_i486,          /**< i486 */
+       arch_pentium,       /**< Pentium */
+       arch_pentium_pro,   /**< Pentium Pro */
+       arch_pentium_mmx,   /**< Pentium MMX */
+       arch_pentium_2,     /**< Pentium II */
+       arch_pentium_3,     /**< Pentium III */
+       arch_pentium_4,     /**< Pentium IV */
+       arch_pentium_m,     /**< Pentium M */
+       arch_core,          /**< Core */
+       arch_k6,            /**< K6 */
+       arch_athlon,        /**< Athlon */
+       arch_athlon_64,     /**< Athlon64 */
+       arch_opteron,       /**< Opteron */
 } cpu_support;
 
+/** checks for l <= x <= h */
+#define _IN_RANGE(x, l, h)  ((unsigned)((x) - (l)) <= (unsigned)((h) - (l)))
+
+/** returns true if it's Intel architecture */
+#define ARCH_INTEL(x)       _IN_RANGE((x), arch_i386, arch_core)
+
+/** returns true if it's AMD architecture */
+#define ARCH_AMD(x)         _IN_RANGE((x), arch_k6, arch_opteron)
+
+#define IS_P6_ARCH(x)       (_IN_RANGE((x), arch_pentium_pro, arch_core) || \
+                             _IN_RANGE((x), arch_athlon, arch_opteron))
+
 /** floating point support */
 typedef enum fp_support {
-  fp_x87,   /**< use x87 instructions */
-  fp_sse2   /**< use SSE2 instructions */
+       fp_none,  /**< no floating point instructions are used */
+       fp_x87,   /**< use x87 instructions */
+       fp_sse2   /**< use SSE2 instructions */
 } fp_support;
 
+/** Sets the used flag to the current floating point architecture. */
+#define FP_USED(cg)  ((cg)->used_fp = (cg)->fp_kind)
+
+/** Returns non-zero if the current floating point architecture is SSE2. */
+#define USE_SSE2(cg) ((cg)->fp_kind == fp_sse2)
+
+/** Returns non-zero if the current floating point architecture is x87. */
+#define USE_x87(cg)  ((cg)->fp_kind == fp_x87)
+
+typedef struct _ia32_isa_t ia32_isa_t;
+
 /**
  * IA32 code generator
  */
 typedef struct _ia32_code_gen_t {
        const arch_code_generator_if_t *impl;          /**< implementation */
        ir_graph                       *irg;           /**< current irg */
-       FILE                           *out;           /**< output file */
        const arch_env_t               *arch_env;      /**< the arch env */
        set                            *reg_set;       /**< set to memorize registers for non-ia32 nodes (e.g. phi nodes) */
-       int                             emit_decls;    /**< flag indicating if decls were already emitted */
-       pmap                           *types;         /**< A map of modes to primitive types */
-       pmap                           *tv_ent;        /**< A map of entities that store tarvals */
+       ia32_isa_t                     *isa;           /**< for fast access to the isa object */
        const be_irg_t                 *birg;          /**< The be-irg (contains additional information about the irg) */
        ir_node                        **blk_sched;    /**< an array containing the scheduled blocks */
        ia32_optimize_t                 opt;           /**< contains optimization information */
+       entity                         *fp_to_gp;      /**< allocated entity for fp to gp conversion */
+       entity                         *gp_to_fp;      /**< allocated entity for gp to fp conversion */
        int                             arch;          /**< instruction architecture */
        int                             opt_arch;      /**< optimize for architecture */
        int                             fp_kind;       /**< floating point kind */
-       char                            used_x87;      /**< x87 floating point unit used in this graph */
+       char                            used_fp;       /**< which floating point unit used in this graph */
        DEBUG_ONLY(firm_dbg_module_t   *mod;)          /**< debugging module */
 } ia32_code_gen_t;
 
-typedef struct _ia32_isa_t {
-       const arch_isa_if_t   *impl;
-       const arch_register_t *sp;            /**< The stack pointer register. */
-       const arch_register_t *bp;            /**< The base pointer register. */
-       const int              stack_dir;     /**< -1 for decreasing, 1 for increasing. */
-       int                    num_codegens;  /**< The number of code generator objects created so far */
+/**
+ * IA32 ISA object
+ */
+struct _ia32_isa_t {
+  arch_isa_t            arch_isa;       /**< must be derived from arch_isa_t */
        pmap                  *regs_16bit;    /**< Contains the 16bits names of the gp registers */
        pmap                  *regs_8bit;     /**< Contains the 8bits names of the gp registers */
+       pmap                  *types;         /**< A map of modes to primitive types */
+       pmap                  *tv_ent;        /**< A map of entities that store const tarvals */
+       ia32_optimize_t        opt;           /**< contains optimization information */
        int                    arch;          /**< instruction architecture */
        int                    opt_arch;      /**< optimize for architecture */
        int                    fp_kind;       /**< floating point kind */
+       ia32_code_gen_t       *cg;            /**< the current code generator */
+       FILE                  *out;           /**< output file */
 #ifndef NDEBUG
        struct obstack        *name_obst;     /**< holds the original node names (for debugging) */
        unsigned long          name_obst_size;
 #endif /* NDEBUG */
-} ia32_isa_t;
+};
 
 typedef struct _ia32_irn_ops_t {
        const arch_irn_ops_if_t *impl;