implement/fix assembler clobbers
[libfirm] / ir / be / ia32 / ia32_spec.pl
1 # Creation: 2005/10/19
2 # $Id$
3 # This is the specification for the ia32 assembler Firm-operations
4
5 use File::Basename;
6
7 $new_emit_syntax = 1;
8 my $myname = $0;
9
10 # the cpu architecture (ia32, ia64, mips, sparc, ppc, ...)
11 $arch = "ia32";
12
13 # The node description is done as a perl hash initializer with the
14 # following structure:
15 #
16 # %nodes = (
17 #
18 # <op-name> => {
19 #   op_flags  => "N|L|C|X|I|F|Y|H|c|K",
20 #   irn_flags => "R|N|I|S"
21 #   arity     => "0|1|2|3 ... |variable|dynamic|any",
22 #   state     => "floats|pinned|mem_pinned|exc_pinned",
23 #   args      => [
24 #                    { type => "type 1", name => "name 1" },
25 #                    { type => "type 2", name => "name 2" },
26 #                    ...
27 #                  ],
28 #   comment   => "any comment for constructor",
29 #   reg_req   => { in => [ "reg_class|register" ], out => [ "reg_class|register|in_rX" ] },
30 #   cmp_attr  => "c source code for comparing node attributes",
31 #   emit      => "emit code with templates",
32 #   attr      => "attitional attribute arguments for constructor"
33 #   init_attr => "emit attribute initialization template"
34 #   rd_constructor => "c source code which constructs an ir_node"
35 #   attr_type => "name of the attribute struct",
36 # },
37 #
38 # ... # (all nodes you need to describe)
39 #
40 # ); # close the %nodes initializer
41
42 # op_flags: flags for the operation, OPTIONAL (default is "N")
43 # the op_flags correspond to the firm irop_flags:
44 #   N   irop_flag_none
45 #   L   irop_flag_labeled
46 #   C   irop_flag_commutative
47 #   X   irop_flag_cfopcode
48 #   I   irop_flag_ip_cfopcode
49 #   F   irop_flag_fragile
50 #   Y   irop_flag_forking
51 #   H   irop_flag_highlevel
52 #   c   irop_flag_constlike
53 #   K   irop_flag_keep
54 #
55 # irn_flags: special node flags, OPTIONAL (default is 0)
56 # following irn_flags are supported:
57 #   R   rematerializeable
58 #   N   not spillable
59 #   I   ignore for register allocation
60 #   S   modifies stack pointer
61 #
62 # state: state of the operation, OPTIONAL (default is "floats")
63 #
64 # arity: arity of the operation, MUST NOT BE OMITTED
65 #
66 # args:  the OPTIONAL arguments of the node constructor (debug, irg and block
67 #        are always the first 3 arguments and are always autmatically
68 #        created)
69 #        If this key is missing the following arguments will be created:
70 #        for i = 1 .. arity: ir_node *op_i
71 #        ir_mode *mode
72 #
73 # outs:  if a node defines more than one output, the names of the projections
74 #        nodes having outs having automatically the mode mode_T
75 #        One can also annotate some flags for each out, additional to irn_flags.
76 #        They are separated from name with a colon ':', and concatenated by pipe '|'
77 #        Only I and S are available at the moment (same meaning as in irn_flags).
78 #        example: [ "frame:I", "stack:I|S", "M" ]
79 #
80 # comment: OPTIONAL comment for the node constructor
81 #
82 # rd_constructor: for every operation there will be a
83 #      new_rd_<arch>_<op-name> function with the arguments from above
84 #      which creates the ir_node corresponding to the defined operation
85 #      you can either put the complete source code of this function here
86 #
87 #      This key is OPTIONAL. If omitted, the following constructor will
88 #      be created:
89 #      if (!op_<arch>_<op-name>) assert(0);
90 #      for i = 1 to arity
91 #         set in[i] = op_i
92 #      done
93 #      res = new_ir_node(db, irg, block, op_<arch>_<op-name>, mode, arity, in)
94 #      return res
95 #
96 # NOTE: rd_constructor and args are only optional if and only if arity is 0,1,2 or 3
97 #
98
99 # register types:
100 #   0 - no special type
101 #   1 - caller save (register must be saved by the caller of a function)
102 #   2 - callee save (register must be saved by the called function)
103 #   4 - ignore (do not assign this register)
104 #   8 - emitter can choose an arbitrary register of this class
105 #  16 - the register is a virtual one
106 #  32 - register represents a state
107 # NOTE: Last entry of each class is the largest Firm-Mode a register can hold
108 %reg_classes = (
109         gp => [
110                 { name => "edx", type => 1 },
111                 { name => "ecx", type => 1 },
112                 { name => "eax", type => 1 },
113                 { name => "ebx", type => 2 },
114                 { name => "esi", type => 2 },
115                 { name => "edi", type => 2 },
116                 { name => "ebp", type => 2 },
117                 { name => "esp", type => 4 },
118                 { name => "gp_NOREG", type => 4 | 8 | 16 }, # we need a dummy register for NoReg nodes
119                 { name => "gp_UKNWN", type => 4 | 8 | 16 },  # we need a dummy register for Unknown nodes
120                 { mode => "mode_Iu" }
121         ],
122         mmx => [
123                 { name => "mm0", type => 4 },
124                 { name => "mm1", type => 4 },
125                 { name => "mm2", type => 4 },
126                 { name => "mm3", type => 4 },
127                 { name => "mm4", type => 4 },
128                 { name => "mm5", type => 4 },
129                 { name => "mm6", type => 4 },
130                 { name => "mm7", type => 4 },
131                 { mode => "mode_E", flags => "manual_ra" }
132         ],
133         xmm => [
134                 { name => "xmm0", type => 1 },
135                 { name => "xmm1", type => 1 },
136                 { name => "xmm2", type => 1 },
137                 { name => "xmm3", type => 1 },
138                 { name => "xmm4", type => 1 },
139                 { name => "xmm5", type => 1 },
140                 { name => "xmm6", type => 1 },
141                 { name => "xmm7", type => 1 },
142                 { name => "xmm_NOREG", type => 4 | 16 },     # we need a dummy register for NoReg nodes
143                 { name => "xmm_UKNWN", type => 4 | 8 | 16},  # we need a dummy register for Unknown nodes
144                 { mode => "mode_E" }
145         ],
146         vfp => [
147                 { name => "vf0", type => 1 | 16 },
148                 { name => "vf1", type => 1 | 16 },
149                 { name => "vf2", type => 1 | 16 },
150                 { name => "vf3", type => 1 | 16 },
151                 { name => "vf4", type => 1 | 16 },
152                 { name => "vf5", type => 1 | 16 },
153                 { name => "vf6", type => 1 | 16 },
154                 { name => "vf7", type => 1 | 16 },
155                 { name => "vfp_NOREG", type => 4 | 8 | 16 }, # we need a dummy register for NoReg nodes
156                 { name => "vfp_UKNWN", type => 4 | 8 | 16 },  # we need a dummy register for Unknown nodes
157                 { mode => "mode_E" }
158         ],
159         st => [
160                 { name => "st0", realname => "st",    type => 4 },
161                 { name => "st1", realname => "st(1)", type => 4 },
162                 { name => "st2", realname => "st(2)", type => 4 },
163                 { name => "st3", realname => "st(3)", type => 4 },
164                 { name => "st4", realname => "st(4)", type => 4 },
165                 { name => "st5", realname => "st(5)", type => 4 },
166                 { name => "st6", realname => "st(6)", type => 4 },
167                 { name => "st7", realname => "st(7)", type => 4 },
168                 { mode => "mode_E", flags => "manual_ra" }
169         ],
170         fp_cw => [      # the floating point control word
171                 { name => "fpcw", type => 4|32 },
172                 { mode => "mode_fpcw", flags => "manual_ra|state" }
173         ],
174         flags => [
175                 { name => "eflags", type => 0 },
176                 { mode => "mode_Iu", flags => "manual_ra" }
177         ],
178 ); # %reg_classes
179
180 %cpu = (
181         GP     => [ 1, "GP_EAX", "GP_EBX", "GP_ECX", "GP_EDX", "GP_ESI", "GP_EDI", "GP_EBP" ],
182         SSE    => [ 1, "SSE_XMM0", "SSE_XMM1", "SSE_XMM2", "SSE_XMM3", "SSE_XMM4", "SSE_XMM5", "SSE_XMM6", "SSE_XMM7" ],
183         VFP    => [ 1, "VFP_VF0", "VFP_VF1", "VFP_VF2", "VFP_VF3", "VFP_VF4", "VFP_VF5", "VFP_VF6", "VFP_VF7" ],
184         BRANCH => [ 1, "BRANCH1", "BRANCH2" ],
185 ); # %cpu
186
187 %vliw = (
188         bundle_size       => 1,
189         bundels_per_cycle => 1
190 ); # vliw
191
192 %emit_templates = (
193         S0 => "${arch}_emit_source_register(node, 0);",
194         S1 => "${arch}_emit_source_register(node, 1);",
195         S2 => "${arch}_emit_source_register(node, 2);",
196         S3 => "${arch}_emit_source_register(node, 3);",
197         SB1 => "${arch}_emit_8bit_source_register_or_immediate(node, 1);",
198         SB2 => "${arch}_emit_8bit_source_register_or_immediate(node, 2);",
199         SB3 => "${arch}_emit_8bit_source_register_or_immediate(node, 3);",
200         SI3 => "${arch}_emit_source_register_or_immediate(node, 3);",
201         D0 => "${arch}_emit_dest_register(node, 0);",
202         D1 => "${arch}_emit_dest_register(node, 1);",
203         DB0 => "${arch}_emit_8bit_dest_register(node, 0);",
204         X0 => "${arch}_emit_x87_register(node, 0);",
205         X1 => "${arch}_emit_x87_register(node, 1);",
206         SE => "${arch}_emit_extend_suffix(get_ia32_ls_mode(node));",
207         ME => "if(get_mode_size_bits(get_ia32_ls_mode(node)) != 32)\n
208                    ia32_emit_mode_suffix(node);",
209         M  => "${arch}_emit_mode_suffix(node);",
210         XM => "${arch}_emit_x87_mode_suffix(node);",
211         XXM => "${arch}_emit_xmm_mode_suffix(node);",
212         XSD => "${arch}_emit_xmm_mode_suffix_s(node);",
213         AM => "${arch}_emit_am(node);",
214         unop3 => "${arch}_emit_unop(node, 3);",
215         unop4 => "${arch}_emit_unop(node, 4);",
216         unop5 => "${arch}_emit_unop(node, 5);",
217         DAM0  => "${arch}_emit_am_or_dest_register(node, 0);",
218         binop => "${arch}_emit_binop(node);",
219         x87_binop => "${arch}_emit_x87_binop(node);",
220         CMP0  => "${arch}_emit_cmp_suffix_node(node, 0);",
221         CMP3  => "${arch}_emit_cmp_suffix_node(node, 3);",
222 );
223
224 #--------------------------------------------------#
225 #                        _                         #
226 #                       (_)                        #
227 #  _ __   _____      __  _ _ __    ___  _ __  ___  #
228 # | '_ \ / _ \ \ /\ / / | | '__|  / _ \| '_ \/ __| #
229 # | | | |  __/\ V  V /  | | |    | (_) | |_) \__ \ #
230 # |_| |_|\___| \_/\_/   |_|_|     \___/| .__/|___/ #
231 #                                      | |         #
232 #                                      |_|         #
233 #--------------------------------------------------#
234
235 $default_op_attr_type = "ia32_op_attr_t";
236 $default_attr_type    = "ia32_attr_t";
237 $default_copy_attr    = "ia32_copy_attr";
238
239 sub ia32_custom_init_attr {
240         my $node = shift;
241         my $name = shift;
242         my $res = "";
243
244         if(defined($node->{modified_flags})) {
245                 $res .= "\tset_ia32_flags(res, get_ia32_flags(res) | arch_irn_flags_modify_flags);\n";
246         }
247         if(defined($node->{am})) {
248                 my $am = $node->{am};
249                 if($am eq "full,binary") {
250                         $res .= "\tset_ia32_am_support(res, ia32_am_Full, ia32_am_binary);";
251                 } elsif($am eq "full,unary") {
252                         $res .= "\tset_ia32_am_support(res, ia32_am_Full, ia32_am_unary);";
253                 } elsif($am eq "source,unary") {
254                         $res .= "\tset_ia32_am_support(res, ia32_am_Source, ia32_am_unary);";
255                 } elsif($am eq "source,binary") {
256                         $res .= "\tset_ia32_am_support(res, ia32_am_Source, ia32_am_binary);";
257                 } elsif($am eq "dest,unary") {
258                         $res .= "\tset_ia32_am_support(res, ia32_am_Dest, ia32_am_unary);";
259                 } elsif($am eq "dest,binary") {
260                         $res .= "\tset_ia32_am_support(res, ia32_am_Dest, ia32_am_binary);";
261                 } elsif($am eq "dest,ternary") {
262                         $res .= "\tset_ia32_am_support(res, ia32_am_Dest, ia32_am_ternary);";
263                 } elsif($am eq "source,ternary") {
264                         $res .= "\tset_ia32_am_support(res, ia32_am_Source, ia32_am_ternary);";
265                 } elsif($am eq "none") {
266                         # nothing to do
267                 } else {
268                         die("Invalid address mode '$am' specified on op $name");
269                 }
270                 if($am ne "none") {
271                         if($node->{state} ne "exc_pinned"
272                                         and $node->{state} ne "pinned") {
273                                 die("AM nodes must have pinned or AM pinned state ($name)");
274                         }
275                 }
276         }
277         return $res;
278 }
279 $custom_init_attr_func = \&ia32_custom_init_attr;
280
281 %init_attr = (
282         ia32_attr_t     => "\tinit_ia32_attributes(res, flags, in_reqs, out_reqs, exec_units, n_res);",
283         ia32_x87_attr_t =>
284                 "\tinit_ia32_attributes(res, flags, in_reqs, out_reqs, exec_units, n_res);\n".
285                 "\tinit_ia32_x87_attributes(res);",
286         ia32_asm_attr_t =>
287                 "\tinit_ia32_attributes(res, flags, in_reqs, out_reqs, exec_units, n_res);\n".
288                 "\tinit_ia32_x87_attributes(res);".
289                 "\tinit_ia32_asm_attributes(res);",
290         ia32_immediate_attr_t =>
291                 "\tinit_ia32_attributes(res, flags, in_reqs, out_reqs, exec_units, n_res);\n".
292                 "\tinit_ia32_immediate_attributes(res, symconst, symconst_sign, offset);",
293         ia32_copyb_attr_t =>
294                 "\tinit_ia32_attributes(res, flags, in_reqs, out_reqs, exec_units, n_res);\n".
295                 "\tinit_ia32_copyb_attributes(res, size);",
296         ia32_condcode_attr_t =>
297                 "\tinit_ia32_attributes(res, flags, in_reqs, out_reqs, exec_units, n_res);\n".
298                 "\tinit_ia32_condcode_attributes(res, pnc);",
299 );
300
301 %compare_attr = (
302         ia32_attr_t           => "ia32_compare_nodes_attr",
303         ia32_x87_attr_t       => "ia32_compare_x87_attr",
304         ia32_asm_attr_t       => "ia32_compare_asm_attr",
305         ia32_immediate_attr_t => "ia32_compare_immediate_attr",
306         ia32_copyb_attr_t     => "ia32_compare_copyb_attr",
307         ia32_condcode_attr_t  => "ia32_compare_condcode_attr",
308 );
309
310 %operands = (
311 );
312
313 $mode_xmm     = "mode_E";
314 $mode_gp      = "mode_Iu";
315 $mode_flags   = "mode_Iu";
316 $mode_fpcw    = "mode_fpcw";
317 $status_flags = [ "CF", "PF", "AF", "ZF", "SF", "OF" ];
318 $fpcw_flags   = [ "FP_IM", "FP_DM", "FP_ZM", "FP_OM", "FP_UM", "FP_PM",
319                   "FP_PC0", "FP_PC1", "FP_RC0", "FP_RC1", "FP_X" ];
320
321 %nodes = (
322
323 Immediate => {
324         state     => "pinned",
325         op_flags  => "c",
326         irn_flags => "I",
327         reg_req   => { out => [ "gp_NOREG" ] },
328         attr      => "ir_entity *symconst, int symconst_sign, long offset",
329         attr_type => "ia32_immediate_attr_t",
330         latency   => 0,
331         mode      => $mode_gp,
332 },
333
334 Asm => {
335         mode      => "mode_T",
336         arity     => "variable",
337         out_arity => "variable",
338         attr_type => "ia32_asm_attr_t",
339         attr      => "ident *asm_text, const ia32_asm_reg_t *register_map",
340         init_attr => "attr->asm_text = asm_text;\n".
341                      "\tattr->register_map = register_map;\n",
342         latency   => 10,
343         modified_flags => 1,
344 },
345
346 ProduceVal => {
347         op_flags  => "c",
348         irn_flags => "R",
349         reg_req   => { out => [ "gp" ] },
350         emit      => "",
351         units     => [ ],
352         latency   => 0,
353         mode      => $mode_gp,
354         cmp_attr  => "return 1;",
355 },
356
357 #-----------------------------------------------------------------#
358 #  _       _                                         _            #
359 # (_)     | |                                       | |           #
360 #  _ _ __ | |_ ___  __ _  ___ _ __   _ __   ___   __| | ___  ___  #
361 # | | '_ \| __/ _ \/ _` |/ _ \ '__| | '_ \ / _ \ / _` |/ _ \/ __| #
362 # | | | | | ||  __/ (_| |  __/ |    | | | | (_) | (_| |  __/\__ \ #
363 # |_|_| |_|\__\___|\__, |\___|_|    |_| |_|\___/ \__,_|\___||___/ #
364 #                   __/ |                                         #
365 #                  |___/                                          #
366 #-----------------------------------------------------------------#
367
368 # commutative operations
369
370 Add => {
371         irn_flags => "R",
372         state     => "exc_pinned",
373         reg_req   => { in  => [ "gp", "gp", "none", "gp", "gp" ],
374                        out => [ "in_r4 in_r5", "flags", "none" ] },
375         ins       => [ "base", "index", "mem", "left", "right" ],
376         outs      => [ "res", "flags", "M" ],
377         emit      => '. add%M %binop',
378         am        => "full,binary",
379         units     => [ "GP" ],
380         latency   => 1,
381         mode      => $mode_gp,
382         modified_flags => $status_flags
383 },
384
385 AddMem => {
386         irn_flags => "R",
387         state     => "exc_pinned",
388         reg_req   => { in => [ "gp", "gp", "none", "gp" ], out => [ "none" ] },
389         ins       => [ "base", "index", "mem", "val" ],
390         emit      => ". add%M %SI3, %AM",
391         units     => [ "GP" ],
392         latency   => 1,
393         mode      => "mode_M",
394         modified_flags => $status_flags
395 },
396
397 AddMem8Bit => {
398         irn_flags => "R",
399         state     => "exc_pinned",
400         reg_req   => { in => [ "gp", "gp", "none", "eax ebx ecx edx" ], out => [ "none" ] },
401         ins       => [ "base", "index", "mem", "val" ],
402         emit      => ". add%M %SB3, %AM",
403         units     => [ "GP" ],
404         latency   => 1,
405         mode      => "mode_M",
406         modified_flags => $status_flags
407 },
408
409 Adc => {
410         state     => "exc_pinned",
411         reg_req   => { in => [ "gp", "gp", "none", "gp", "gp", "flags" ],
412                        out => [ "in_r4 in_r5", "flags", "none" ] },
413         ins       => [ "base", "index", "mem", "left", "right", "eflags" ],
414         outs      => [ "res", "flags", "M" ],
415         emit      => '. adc%M %binop',
416         am        => "full,binary",
417         units     => [ "GP" ],
418         latency   => 1,
419         mode      => $mode_gp,
420         modified_flags => $status_flags
421 },
422
423 l_Add => {
424         op_flags  => "C",
425         reg_req   => { in => [ "none", "none" ], out => [ "none" ] },
426         ins       => [ "left", "right" ],
427 },
428
429 l_Adc => {
430         reg_req   => { in => [ "none", "none", "none" ], out => [ "none" ] },
431         ins       => [ "left", "right", "eflags" ],
432 },
433
434 Mul => {
435         # we should not rematrialize this node. It produces 2 results and has
436         # very strict constrains
437         state     => "exc_pinned",
438         reg_req   => { in => [ "gp", "gp", "none", "eax", "gp" ],
439                        out => [ "eax", "edx", "none" ] },
440         ins       => [ "base", "index", "mem", "val_high", "val_low" ],
441         emit      => '. mul%M %unop4',
442         outs      => [ "res_low", "res_high", "M" ],
443         am        => "source,binary",
444         latency   => 10,
445         units     => [ "GP" ],
446         modified_flags => $status_flags
447 },
448
449 l_Mul => {
450         # we should not rematrialize this node. It produces 2 results and has
451         # very strict constrains
452         op_flags  => "C",
453         cmp_attr  => "return 1;",
454         outs      => [ "EAX", "EDX", "M" ],
455         arity     => 2
456 },
457
458 IMul => {
459         irn_flags => "R",
460         state     => "exc_pinned",
461         # TODO: adjust out requirements for the 3 operand form
462         # (no need for should_be_same then)
463         reg_req   => { in => [ "gp", "gp", "none", "gp", "gp" ],
464                            out => [ "in_r4 in_r5", "flags", "none" ] },
465         ins       => [ "base", "index", "mem", "left", "right" ],
466         outs      => [ "res", "flags", "M" ],
467         am        => "source,binary",
468         latency   => 5,
469         units     => [ "GP" ],
470         mode      => $mode_gp,
471         modified_flags => $status_flags
472 },
473
474 IMul1OP => {
475         irn_flags => "R",
476         state     => "exc_pinned",
477         reg_req   => { in => [ "gp", "gp", "none", "eax", "gp" ],
478                        out => [ "eax", "edx", "none" ] },
479         ins       => [ "base", "index", "mem", "val_high", "val_low" ],
480         emit      => '. imul%M %unop4',
481         outs      => [ "res_low", "res_high", "M" ],
482         am        => "source,binary",
483         latency   => 5,
484         units     => [ "GP" ],
485         modified_flags => $status_flags
486 },
487
488 l_IMul => {
489         op_flags  => "C",
490         cmp_attr  => "return 1;",
491         outs      => [ "res_low", "res_high", "M" ],
492         arity     => 2
493 },
494
495 And => {
496         irn_flags => "R",
497         state     => "exc_pinned",
498         reg_req   => { in => [ "gp", "gp", "none", "gp", "gp" ],
499                            out => [ "in_r4 in_r5", "flags", "none" ] },
500         ins       => [ "base", "index", "mem", "left", "right" ],
501         outs      => [ "res", "flags", "M" ],
502         op_modes  => "commutative | am | immediate | mode_neutral",
503         am        => "full,binary",
504         emit      => '. and%M %binop',
505         units     => [ "GP" ],
506         latency   => 1,
507         mode      => $mode_gp,
508         modified_flags => $status_flags
509 },
510
511 AndMem => {
512         irn_flags => "R",
513         state     => "exc_pinned",
514         reg_req   => { in => [ "gp", "gp", "none", "gp" ], out => [ "none" ] },
515         ins       => [ "base", "index", "mem", "val" ],
516         emit      => '. and%M %SI3, %AM',
517         units     => [ "GP" ],
518         latency   => 1,
519         mode      => "mode_M",
520         modified_flags => $status_flags
521 },
522
523 AndMem8Bit => {
524         irn_flags => "R",
525         state     => "exc_pinned",
526         reg_req   => { in => [ "gp", "gp", "none",  "eax ebx ecx edx" ], out => [ "none" ] },
527         ins       => [ "base", "index", "mem", "val" ],
528         emit      => '. and%M %SB3, %AM',
529         units     => [ "GP" ],
530         latency   => 1,
531         mode      => "mode_M",
532         modified_flags => $status_flags
533 },
534
535 Or => {
536         irn_flags => "R",
537         state     => "exc_pinned",
538         reg_req   => { in => [ "gp", "gp", "none", "gp", "gp" ],
539                        out => [ "in_r4 in_r5", "flags", "none" ] },
540         ins       => [ "base", "index", "mem", "left", "right" ],
541         outs      => [ "res", "flags", "M" ],
542         am        => "full,binary",
543         emit      => '. or%M %binop',
544         units     => [ "GP" ],
545         latency   => 1,
546         mode      => $mode_gp,
547         modified_flags => $status_flags
548 },
549
550 OrMem => {
551         irn_flags => "R",
552         state     => "exc_pinned",
553         reg_req   => { in => [ "gp", "gp", "none", "gp" ], out => [ "none" ] },
554         ins       => [ "base", "index", "mem", "val" ],
555         emit      => '. or%M %SI3, %AM',
556         units     => [ "GP" ],
557         latency   => 1,
558         mode      => "mode_M",
559         modified_flags => $status_flags
560 },
561
562 OrMem8Bit => {
563         irn_flags => "R",
564         state     => "exc_pinned",
565         reg_req   => { in => [ "gp", "gp", "none", "eax ebx ecx edx" ], out => [ "none" ] },
566         ins       => [ "base", "index", "mem", "val" ],
567         emit      => '. or%M %SB3, %AM',
568         units     => [ "GP" ],
569         latency   => 1,
570         mode      => "mode_M",
571         modified_flags => $status_flags
572 },
573
574 Xor => {
575         irn_flags => "R",
576         state     => "exc_pinned",
577         reg_req   => { in => [ "gp", "gp", "none", "gp", "gp" ],
578                        out => [ "in_r4 in_r5", "flags", "none" ] },
579         ins       => [ "base", "index", "mem", "left", "right" ],
580         outs      => [ "res", "flags", "M" ],
581         am        => "full,binary",
582         emit      => '. xor%M %binop',
583         units     => [ "GP" ],
584         latency   => 1,
585         mode      => $mode_gp,
586         modified_flags => $status_flags
587 },
588
589 XorMem => {
590         irn_flags => "R",
591         state     => "exc_pinned",
592         reg_req   => { in => [ "gp", "gp", "none", "gp" ], out => [ "none" ] },
593         ins       => [ "base", "index", "mem", "val" ],
594         emit      => '. xor%M %SI3, %AM',
595         units     => [ "GP" ],
596         latency   => 1,
597         mode      => "mode_M",
598         modified_flags => $status_flags
599 },
600
601 XorMem8Bit => {
602         irn_flags => "R",
603         state     => "exc_pinned",
604         reg_req   => { in => [ "gp", "gp", "none", "eax ebx ecx edx" ], out => [ "none" ] },
605         ins       => [ "base", "index", "mem", "val" ],
606         emit      => '. xor%M %SB3, %AM',
607         units     => [ "GP" ],
608         latency   => 1,
609         mode      => "mode_M",
610         modified_flags => $status_flags
611 },
612
613 # not commutative operations
614
615 Sub => {
616         irn_flags => "R",
617         state     => "exc_pinned",
618         reg_req   => { in => [ "gp", "gp", "none", "gp", "gp" ],
619                        out => [ "in_r4", "flags", "none" ] },
620         ins       => [ "base", "index", "mem", "left", "right" ],
621         outs      => [ "res", "flags", "M" ],
622         am        => "full,binary",
623         emit      => '. sub%M %binop',
624         units     => [ "GP" ],
625         latency   => 1,
626         mode      => $mode_gp,
627         modified_flags => $status_flags
628 },
629
630 SubMem => {
631         irn_flags => "R",
632         state     => "exc_pinned",
633         reg_req   => { in => [ "gp", "gp", "none", "gp" ], out => [ "none" ] },
634         ins       => [ "base", "index", "mem", "val" ],
635         emit      => '. sub%M %SI3, %AM',
636         units     => [ "GP" ],
637         latency   => 1,
638         mode      => 'mode_M',
639         modified_flags => $status_flags
640 },
641
642 SubMem8Bit => {
643         irn_flags => "R",
644         state     => "exc_pinned",
645         reg_req   => { in => [ "gp", "gp", "none", "eax ebx ecx edx" ], out => [ "none" ] },
646         ins       => [ "base", "index", "mem", "val" ],
647         emit      => '. sub%M %SB3, %AM',
648         units     => [ "GP" ],
649         latency   => 1,
650         mode      => 'mode_M',
651         modified_flags => $status_flags
652 },
653
654 Sbb => {
655         state     => "exc_pinned",
656         reg_req   => { in => [ "gp", "gp", "none", "gp", "gp", "flags" ],
657                        out => [ "in_r4 !in_r5", "flags", "none" ] },
658         ins       => [ "base", "index", "mem", "left", "right", "eflags" ],
659         outs      => [ "res", "flags", "M" ],
660         am        => "full,binary",
661         emit      => '. sbb%M %binop',
662         units     => [ "GP" ],
663         latency   => 1,
664         mode      => $mode_gp,
665         modified_flags => $status_flags
666 },
667
668 l_Sub => {
669         reg_req   => { in => [ "none", "none" ], out => [ "none" ] },
670         ins       => [ "left", "right" ],
671 },
672
673 l_Sbb => {
674         reg_req   => { in => [ "none", "none", "none" ], out => [ "none" ] },
675         ins       => [ "left", "right", "eflags" ],
676 },
677
678 IDiv => {
679         op_flags  => "F|L",
680         state     => "exc_pinned",
681         reg_req   => { in => [ "gp", "gp", "none", "eax", "edx", "gp" ],
682                        out => [ "eax", "flags", "none", "edx", "none" ] },
683         ins       => [ "base", "index", "mem", "left_low", "left_high", "right" ],
684         outs      => [ "div_res", "flags", "M", "mod_res", "X_exc" ],
685         am        => "source,ternary",
686         emit      => ". idiv%M %unop5",
687         latency   => 25,
688         units     => [ "GP" ],
689         modified_flags => $status_flags
690 },
691
692 Div => {
693         op_flags  => "F|L",
694         state     => "exc_pinned",
695         reg_req   => { in => [ "gp", "gp", "none", "eax", "edx", "gp" ],
696                        out => [ "eax", "flags", "none", "edx", "none" ] },
697         ins       => [ "base", "index", "mem", "left_low", "left_high", "right" ],
698         outs      => [ "div_res", "flags", "M", "mod_res", "X_exc" ],
699         am        => "source,ternary",
700         emit      => ". div%M %unop5",
701         latency   => 25,
702         units     => [ "GP" ],
703         modified_flags => $status_flags
704 },
705
706 Shl => {
707         irn_flags => "R",
708         reg_req   => { in => [ "gp", "ecx" ],
709                        out => [ "in_r1 !in_r2", "flags" ] },
710         ins       => [ "val", "count" ],
711         outs      => [ "res", "flags" ],
712         emit      => '. shl %SB1, %S0',
713         units     => [ "GP" ],
714         latency   => 1,
715         mode      => $mode_gp,
716         modified_flags => $status_flags
717 },
718
719 ShlMem => {
720         irn_flags => "R",
721         state     => "exc_pinned",
722         reg_req   => { in => [ "gp", "gp", "none", "ecx" ], out => [ "none" ] },
723         ins       => [ "base", "index", "mem", "count" ],
724         emit      => '. shl%M %SB3, %AM',
725         units     => [ "GP" ],
726         latency   => 1,
727         mode      => "mode_M",
728         modified_flags => $status_flags
729 },
730
731 l_ShlDep => {
732         cmp_attr => "return 1;",
733         ins      => [ "val", "count", "dep" ],
734         arity    => 3
735 },
736
737 ShlD => {
738         irn_flags => "R",
739         reg_req   => { in => [ "gp", "gp", "ecx" ],
740                        out => [ "in_r1 !in_r2 !in_r3", "flags" ] },
741         ins       => [ "val_high", "val_low", "count" ],
742         outs      => [ "res", "flags" ],
743         emit      => ". shld%M %SB2, %S1, %D0",
744         latency   => 6,
745         units     => [ "GP" ],
746         mode      => $mode_gp,
747         modified_flags => $status_flags
748 },
749
750 l_ShlD => {
751         cmp_attr  => "return 1;",
752         ins       => [ "val_high", "val_low", "count" ],
753         arity     => 3,
754 },
755
756 Shr => {
757         irn_flags => "R",
758         reg_req   => { in => [ "gp", "ecx" ],
759                        out => [ "in_r1 !in_r2", "flags" ] },
760         ins       => [ "val", "count" ],
761         outs      => [ "res", "flags" ],
762         emit      => '. shr %SB1, %S0',
763         units     => [ "GP" ],
764         mode      => $mode_gp,
765         latency   => 1,
766         modified_flags => $status_flags
767 },
768
769 ShrMem => {
770         irn_flags => "R",
771         state     => "exc_pinned",
772         reg_req   => { in => [ "gp", "gp", "none", "ecx" ], out => [ "none" ] },
773         ins       => [ "base", "index", "mem", "count" ],
774         emit      => '. shr%M %SB3, %AM',
775         units     => [ "GP" ],
776         mode      => "mode_M",
777         latency   => 1,
778         modified_flags => $status_flags
779 },
780
781 l_ShrDep => {
782         cmp_attr  => "return 1;",
783         ins       => [ "val", "count", "dep" ],
784         arity     => 3
785 },
786
787 ShrD => {
788         irn_flags => "R",
789         reg_req   => { in => [ "gp", "gp", "ecx" ],
790                        out => [ "in_r1 !in_r2 !in_r3", "flags" ] },
791         ins       => [ "val_high", "val_low", "count" ],
792         outs      => [ "res", "flags" ],
793         emit      => ". shrd%M %SB2, %S1, %D0",
794         latency   => 6,
795         units     => [ "GP" ],
796         mode      => $mode_gp,
797         modified_flags => $status_flags
798 },
799
800 l_ShrD => {
801         cmp_attr  => "return 1;",
802         arity     => 3,
803         ins       => [ "val_high", "val_low", "count" ],
804 },
805
806 Sar => {
807         irn_flags => "R",
808         reg_req   => { in => [ "gp", "ecx" ],
809                        out => [ "in_r1 !in_r2", "flags" ] },
810         ins       => [ "val", "count" ],
811         outs      => [ "res", "flags" ],
812         emit      => '. sar %SB1, %S0',
813         units     => [ "GP" ],
814         latency   => 1,
815         mode      => $mode_gp,
816         modified_flags => $status_flags
817 },
818
819 SarMem => {
820         irn_flags => "R",
821         state     => "exc_pinned",
822         reg_req   => { in => [ "gp", "gp", "none", "ecx" ], out => [ "none" ] },
823         ins       => [ "base", "index", "mem", "count" ],
824         emit      => '. sar%M %SB3, %AM',
825         units     => [ "GP" ],
826         latency   => 1,
827         mode      => "mode_M",
828         modified_flags => $status_flags
829 },
830
831 l_SarDep => {
832         cmp_attr  => "return 1;",
833         ins       => [ "val", "count", "dep" ],
834         arity     => 3
835 },
836
837 Ror => {
838         irn_flags => "R",
839         reg_req   => { in => [ "gp", "ecx" ],
840                        out => [ "in_r1 !in_r2", "flags" ] },
841         ins       => [ "val", "count" ],
842         outs      => [ "res", "flags" ],
843         emit      => '. ror %SB1, %S0',
844         units     => [ "GP" ],
845         latency   => 1,
846         mode      => $mode_gp,
847         modified_flags => $status_flags
848 },
849
850 RorMem => {
851         irn_flags => "R",
852         state     => "exc_pinned",
853         reg_req   => { in => [ "gp", "gp", "none", "ecx" ], out => [ "none" ] },
854         ins       => [ "base", "index", "mem", "count" ],
855         emit      => '. ror%M %SB3, %AM',
856         units     => [ "GP" ],
857         latency   => 1,
858         mode      => "mode_M",
859         modified_flags => $status_flags
860 },
861
862 Rol => {
863         irn_flags => "R",
864         reg_req   => { in => [ "gp", "ecx" ],
865                        out => [ "in_r1 !in_r2", "flags" ] },
866         ins       => [ "val", "count" ],
867         outs      => [ "res", "flags" ],
868         emit      => '. rol %SB1, %S0',
869         units     => [ "GP" ],
870         latency   => 1,
871         mode      => $mode_gp,
872         modified_flags => $status_flags
873 },
874
875 RolMem => {
876         irn_flags => "R",
877         state     => "exc_pinned",
878         reg_req   => { in => [ "gp", "gp", "none", "ecx" ], out => [ "none" ] },
879         ins       => [ "base", "index", "mem", "count" ],
880         emit      => '. rol%M %SB3, %AM',
881         units     => [ "GP" ],
882         latency   => 1,
883         mode      => "mode_M",
884         modified_flags => $status_flags
885 },
886
887 # unary operations
888
889 Neg => {
890         irn_flags => "R",
891         reg_req   => { in => [ "gp" ],
892                        out => [ "in_r1", "flags" ] },
893         emit      => '. neg %S0',
894         ins       => [ "val" ],
895         outs      => [ "res", "flags" ],
896         units     => [ "GP" ],
897         latency   => 1,
898         mode      => $mode_gp,
899         modified_flags => $status_flags
900 },
901
902 NegMem => {
903         irn_flags => "R",
904         state     => "exc_pinned",
905         reg_req   => { in => [ "gp", "gp", "none" ], out => [ "none" ] },
906         ins       => [ "base", "index", "mem" ],
907         emit      => '. neg%M %AM',
908         units     => [ "GP" ],
909         latency   => 1,
910         mode      => "mode_M",
911         modified_flags => $status_flags
912 },
913
914 Minus64Bit => {
915         irn_flags => "R",
916         reg_req   => { in => [ "gp", "gp" ], out => [ "in_r1", "gp" ] },
917         outs      => [ "low_res", "high_res" ],
918         units     => [ "GP" ],
919         latency   => 3,
920         modified_flags => $status_flags
921 },
922
923
924 Inc => {
925         irn_flags => "R",
926         reg_req   => { in => [ "gp" ],
927                        out => [ "in_r1", "flags" ] },
928         outs      => [ "res", "flags" ],
929         emit      => '. inc %S0',
930         units     => [ "GP" ],
931         mode      => $mode_gp,
932         latency   => 1,
933         modified_flags => [ "OF", "SF", "ZF", "AF", "PF" ]
934 },
935
936 IncMem => {
937         irn_flags => "R",
938         state     => "exc_pinned",
939         reg_req   => { in => [ "gp", "gp", "none" ], out => [ "none" ] },
940         ins       => [ "base", "index", "mem" ],
941         emit      => '. inc%M %AM',
942         units     => [ "GP" ],
943         mode      => "mode_M",
944         latency   => 1,
945         modified_flags => [ "OF", "SF", "ZF", "AF", "PF" ]
946 },
947
948 Dec => {
949         irn_flags => "R",
950         reg_req   => { in => [ "gp" ],
951                        out => [ "in_r1", "flags" ] },
952         outs      => [ "res", "flags" ],
953         emit      => '. dec %S0',
954         units     => [ "GP" ],
955         mode      => $mode_gp,
956         latency   => 1,
957         modified_flags => [ "OF", "SF", "ZF", "AF", "PF" ]
958 },
959
960 DecMem => {
961         irn_flags => "R",
962         state     => "exc_pinned",
963         reg_req   => { in => [ "gp", "gp", "none" ], out => [ "none" ] },
964         ins       => [ "base", "index", "mem" ],
965         emit      => '. dec%M %AM',
966         units     => [ "GP" ],
967         mode      => "mode_M",
968         latency   => 1,
969         modified_flags => [ "OF", "SF", "ZF", "AF", "PF" ]
970 },
971
972 Not => {
973         irn_flags => "R",
974         reg_req   => { in => [ "gp" ],
975                        out => [ "in_r1", "flags" ] },
976         ins       => [ "val" ],
977         outs      => [ "res", "flags" ],
978         emit      => '. not %S0',
979         units     => [ "GP" ],
980         latency   => 1,
981         mode      => $mode_gp,
982         # no flags modified
983 },
984
985 NotMem => {
986         irn_flags => "R",
987         state     => "exc_pinned",
988         reg_req   => { in => [ "gp", "gp", "none" ], out => [ "none" ] },
989         ins       => [ "base", "index", "mem" ],
990         emit      => '. not%M %AM',
991         units     => [ "GP" ],
992         latency   => 1,
993         mode      => "mode_M",
994         # no flags modified
995 },
996
997 Cmc => {
998         reg_req => { in => [ "flags" ], out => [ "flags" ] },
999         emit    => '.cmc',
1000         units     => [ "GP" ],
1001         latency   => 1,
1002         mode      => $mode_flags,
1003         modified_flags => $status_flags
1004 },
1005
1006 Stc => {
1007         reg_req => { out => [ "flags" ] },
1008         emit    => '.stc',
1009         units     => [ "GP" ],
1010         latency   => 1,
1011         mode      => $mode_flags,
1012         modified_flags => $status_flags
1013 },
1014
1015 # other operations
1016
1017 Cmp => {
1018         irn_flags => "R",
1019         state     => "exc_pinned",
1020         reg_req   => { in => [ "gp", "gp", "none", "gp", "gp" ] , out => [ "flags" ] },
1021         ins       => [ "base", "index", "mem", "left", "right" ],
1022         outs      => [ "eflags" ],
1023         am        => "source,binary",
1024         emit      => '. cmp%M %binop',
1025         attr      => "int ins_permuted, int cmp_unsigned",
1026         init_attr => "attr->data.ins_permuted   = ins_permuted;\n".
1027                      "\tattr->data.cmp_unsigned = cmp_unsigned;\n",
1028         latency   => 1,
1029         units     => [ "GP" ],
1030         mode      => $mode_flags,
1031         modified_flags => $status_flags
1032 },
1033
1034 Cmp8Bit => {
1035         irn_flags => "R",
1036         state     => "exc_pinned",
1037         reg_req   => { in => [ "gp", "gp", "none", "eax ebx ecx edx", "eax ebx ecx edx" ] , out => [ "flags" ] },
1038         ins       => [ "base", "index", "mem", "left", "right" ],
1039         outs      => [ "eflags" ],
1040         am        => "source,binary",
1041         emit      => '. cmpb %binop',
1042         attr      => "int ins_permuted, int cmp_unsigned",
1043         init_attr => "attr->data.ins_permuted   = ins_permuted;\n".
1044                      "\tattr->data.cmp_unsigned = cmp_unsigned;\n",
1045         latency   => 1,
1046         units     => [ "GP" ],
1047         mode      => $mode_flags,
1048         modified_flags => $status_flags
1049 },
1050
1051 Test => {
1052         irn_flags => "R",
1053         state     => "exc_pinned",
1054         reg_req   => { in => [ "gp", "gp", "none", "gp", "gp" ] , out => [ "flags" ] },
1055         ins       => [ "base", "index", "mem", "left", "right" ],
1056         outs      => [ "eflags" ],
1057         am        => "source,binary",
1058         emit      => '. test%M %binop',
1059         attr      => "int ins_permuted, int cmp_unsigned",
1060         init_attr => "attr->data.ins_permuted = ins_permuted;\n".
1061                      "\tattr->data.cmp_unsigned = cmp_unsigned;\n",
1062         latency   => 1,
1063         units     => [ "GP" ],
1064         mode      => $mode_flags,
1065         modified_flags => $status_flags
1066 },
1067
1068 Test8Bit => {
1069         irn_flags => "R",
1070         state     => "exc_pinned",
1071         reg_req   => { in => [ "gp", "gp", "none", "eax ebx ecx edx", "eax ebx ecx edx" ] , out => [ "flags" ] },
1072         ins       => [ "base", "index", "mem", "left", "right" ],
1073         outs      => [ "eflags" ],
1074         am        => "source,binary",
1075         emit      => '. testb %binop',
1076         attr      => "int ins_permuted, int cmp_unsigned",
1077         init_attr => "attr->data.ins_permuted = ins_permuted;\n".
1078                      "\tattr->data.cmp_unsigned = cmp_unsigned;\n",
1079         latency   => 1,
1080         units     => [ "GP" ],
1081         mode      => $mode_flags,
1082         modified_flags => $status_flags
1083 },
1084
1085 Set => {
1086         #irn_flags => "R",
1087         reg_req   => { in => [ "eflags" ], out => [ "eax ebx ecx edx" ] },
1088         ins       => [ "eflags" ],
1089         attr_type => "ia32_condcode_attr_t",
1090         attr      => "pn_Cmp pnc, int ins_permuted",
1091         init_attr => "attr->attr.data.ins_permuted = ins_permuted;\n".
1092                       "\tset_ia32_ls_mode(res, mode_Bu);\n",
1093         emit      => '. set%CMP0 %DB0',
1094         latency   => 1,
1095         units     => [ "GP" ],
1096         mode      => $mode_gp,
1097 },
1098
1099 SetMem => {
1100         #irn_flags => "R",
1101         state     => "exc_pinned",
1102         reg_req   => { in => [ "gp", "gp", "none", "eflags" ], out => [ "none" ] },
1103         ins       => [ "base", "index", "mem","eflags" ],
1104         attr_type => "ia32_condcode_attr_t",
1105         attr      => "pn_Cmp pnc, int ins_permuted",
1106         init_attr => "attr->attr.data.ins_permuted = ins_permuted;\n".
1107                       "\tset_ia32_ls_mode(res, mode_Bu);\n",
1108         emit      => '. set%CMP3 %AM',
1109         latency   => 1,
1110         units     => [ "GP" ],
1111         mode      => 'mode_M',
1112 },
1113
1114 CMov => {
1115         #irn_flags => "R",
1116         # (note: leave the false,true order intact to make it compatible with other
1117         #  ia32_binary ops)
1118         state     => "exc_pinned",
1119         reg_req   => { in => [ "gp", "gp", "none", "gp", "gp", "eflags" ], out => [ "in_r4 in_r5" ] },
1120         ins       => [ "base", "index", "mem", "val_false", "val_true", "eflags" ],
1121         am        => "source,binary",
1122         attr_type => "ia32_condcode_attr_t",
1123         attr      => "int ins_permuted, pn_Cmp pnc",
1124         init_attr => "attr->attr.data.ins_permuted = ins_permuted;",
1125         latency   => 1,
1126         units     => [ "GP" ],
1127         mode      => $mode_gp,
1128 },
1129
1130 Jcc => {
1131         state     => "pinned",
1132         op_flags  => "L|X|Y",
1133         reg_req   => { in  => [ "eflags" ], out => [ "none", "none" ] },
1134         ins       => [ "eflags" ],
1135         outs      => [ "false", "true" ],
1136         attr_type => "ia32_condcode_attr_t",
1137         attr      => "pn_Cmp pnc",
1138         latency   => 2,
1139         units     => [ "BRANCH" ],
1140 },
1141
1142 SwitchJmp => {
1143         state     => "pinned",
1144         op_flags  => "L|X|Y",
1145         reg_req   => { in => [ "gp" ], out => [ "none" ] },
1146         mode      => "mode_T",
1147         attr_type => "ia32_condcode_attr_t",
1148         attr      => "pn_Cmp pnc",
1149         latency   => 3,
1150         units     => [ "BRANCH" ],
1151         modified_flags => $status_flags,
1152 },
1153
1154 IJmp => {
1155         state     => "pinned",
1156         op_flags  => "X",
1157         reg_req   => { in => [ "gp", "gp", "none", "gp" ] },
1158         ins       => [ "base", "index", "mem", "target" ],
1159         am        => "source,unary",
1160         emit      => '. jmp *%unop3',
1161         latency   => 1,
1162         units     => [ "BRANCH" ],
1163         mode      => "mode_X",
1164 },
1165
1166 Const => {
1167         op_flags  => "c",
1168         irn_flags => "R",
1169         reg_req   => { out => [ "gp" ] },
1170         units     => [ "GP" ],
1171         attr      => "ir_entity *symconst, int symconst_sign, long offset",
1172         attr_type => "ia32_immediate_attr_t",
1173         latency   => 1,
1174         mode      => $mode_gp,
1175 },
1176
1177 Unknown_GP => {
1178         state     => "pinned",
1179         op_flags  => "c",
1180         irn_flags => "I",
1181         reg_req   => { out => [ "gp_UKNWN" ] },
1182         units     => [],
1183         emit      => "",
1184         latency   => 0,
1185         mode      => $mode_gp
1186 },
1187
1188 Unknown_VFP => {
1189         state     => "pinned",
1190         op_flags  => "c",
1191         irn_flags => "I",
1192         reg_req   => { out => [ "vfp_UKNWN" ] },
1193         units     => [],
1194         emit      => "",
1195         mode      => "mode_E",
1196         latency   => 0,
1197         attr_type => "ia32_x87_attr_t",
1198 },
1199
1200 Unknown_XMM => {
1201         state     => "pinned",
1202         op_flags  => "c",
1203         irn_flags => "I",
1204         reg_req   => { out => [ "xmm_UKNWN" ] },
1205         units     => [],
1206         emit      => "",
1207         latency   => 0,
1208         mode      => "mode_E"
1209 },
1210
1211 NoReg_GP => {
1212         state     => "pinned",
1213         op_flags  => "c",
1214         irn_flags => "I",
1215         reg_req   => { out => [ "gp_NOREG" ] },
1216         units     => [],
1217         emit      => "",
1218         latency   => 0,
1219         mode      => $mode_gp
1220 },
1221
1222 NoReg_VFP => {
1223         state     => "pinned",
1224         op_flags  => "c",
1225         irn_flags => "I",
1226         reg_req   => { out => [ "vfp_NOREG" ] },
1227         units     => [],
1228         emit      => "",
1229         mode      => "mode_E",
1230         latency   => 0,
1231         attr_type => "ia32_x87_attr_t",
1232 },
1233
1234 NoReg_XMM => {
1235         state     => "pinned",
1236         op_flags  => "c",
1237         irn_flags => "I",
1238         reg_req   => { out => [ "xmm_NOREG" ] },
1239         units     => [],
1240         emit      => "",
1241         latency   => 0,
1242         mode      => "mode_E"
1243 },
1244
1245 ChangeCW => {
1246         state     => "pinned",
1247         op_flags  => "c",
1248         irn_flags => "I",
1249         reg_req   => { out => [ "fp_cw" ] },
1250         mode      => $mode_fpcw,
1251         latency   => 3,
1252         units     => [ "GP" ],
1253         modified_flags => $fpcw_flags
1254 },
1255
1256 FldCW => {
1257         op_flags  => "L|F",
1258         state     => "pinned",
1259         reg_req   => { in => [ "gp", "gp", "none" ], out => [ "fp_cw" ] },
1260         ins       => [ "base", "index", "mem" ],
1261         latency   => 5,
1262         emit      => ". fldcw %AM",
1263         mode      => $mode_fpcw,
1264         units     => [ "GP" ],
1265         modified_flags => $fpcw_flags
1266 },
1267
1268 FnstCW => {
1269         op_flags  => "L|F",
1270         state     => "pinned",
1271         reg_req   => { in => [ "gp", "gp", "none", "fp_cw" ], out => [ "none" ] },
1272         ins       => [ "base", "index", "mem", "fpcw" ],
1273         latency   => 5,
1274         emit      => ". fnstcw %AM",
1275         mode      => "mode_M",
1276         units     => [ "GP" ],
1277 },
1278
1279 FnstCWNOP => {
1280         op_flags  => "L|F",
1281         state     => "pinned",
1282         reg_req   => { in => [ "fp_cw" ], out => [ "none" ] },
1283         ins       => [ "fpcw" ],
1284         latency   => 0,
1285         emit      => "",
1286         mode      => "mode_M",
1287 },
1288
1289 Cltd => {
1290         # we should not rematrialize this node. It has very strict constraints.
1291         reg_req   => { in => [ "eax", "edx" ], out => [ "edx" ] },
1292         ins       => [ "val", "globbered" ],
1293         emit      => '. cltd',
1294         latency   => 1,
1295         mode      => $mode_gp,
1296         units     => [ "GP" ],
1297 },
1298
1299 # Load / Store
1300 #
1301 # Note that we add additional latency values depending on address mode, so a
1302 # lateny of 0 for load is correct
1303
1304 Load => {
1305         op_flags  => "L|F",
1306         state     => "exc_pinned",
1307         reg_req   => { in => [ "gp", "gp", "none" ], out => [ "gp", "none", "none" ] },
1308         ins       => [ "base", "index", "mem" ],
1309         outs      => [ "res", "M", "X_exc" ],
1310         latency   => 0,
1311         emit      => ". mov%SE%ME%.l %AM, %D0",
1312         units     => [ "GP" ],
1313 },
1314
1315 l_Load => {
1316         op_flags  => "L|F",
1317         cmp_attr  => "return 1;",
1318         outs      => [ "res", "M" ],
1319         arity     => 2,
1320 },
1321
1322 l_Store => {
1323         op_flags  => "L|F",
1324         cmp_attr  => "return 1;",
1325         state     => "exc_pinned",
1326         arity     => 3,
1327         mode      => "mode_M",
1328 },
1329
1330 Store => {
1331         op_flags  => "L|F",
1332         state     => "exc_pinned",
1333         reg_req   => { in => [ "gp", "gp", "none", "gp" ], out => [ "none", "none" ] },
1334         ins       => [ "base", "index", "mem", "val" ],
1335         outs      => [ "M", "X_exc" ],
1336         emit      => '. mov%M %SI3, %AM',
1337         latency   => 2,
1338         units     => [ "GP" ],
1339         mode      => "mode_M",
1340 },
1341
1342 Store8Bit => {
1343         op_flags  => "L|F",
1344         state     => "exc_pinned",
1345         reg_req   => { in => [ "gp", "gp", "none", "eax ebx ecx edx" ], out => ["none", "none" ] },
1346         ins       => [ "base", "index", "mem", "val" ],
1347         outs      => [ "M", "X_exc" ],
1348         emit      => '. mov%M %SB3, %AM',
1349         latency   => 2,
1350         units     => [ "GP" ],
1351         mode      => "mode_M",
1352 },
1353
1354 Lea => {
1355         irn_flags => "R",
1356         reg_req   => { in => [ "gp", "gp" ], out => [ "gp" ] },
1357         ins       => [ "base", "index" ],
1358         emit      => '. leal %AM, %D0',
1359         latency   => 2,
1360         units     => [ "GP" ],
1361         mode      => $mode_gp,
1362 # lea doesn't modify the flags, but setting this seems advantageous since it
1363 # increases chances that the Lea is transformed back to an Add
1364         modified_flags => 1,
1365 },
1366
1367 Push => {
1368         state     => "exc_pinned",
1369         reg_req   => { in => [ "gp", "gp", "none", "esp", "gp" ], out => [ "esp", "none" ] },
1370         ins       => [ "base", "index", "mem", "val", "stack" ],
1371         emit      => '. push%M %unop4',
1372         outs      => [ "stack:I|S", "M" ],
1373         am        => "source,binary",
1374         latency   => 2,
1375         units     => [ "GP" ],
1376 },
1377
1378 Pop => {
1379         state     => "exc_pinned",
1380         reg_req   => { in => [ "gp", "gp", "none", "esp" ], out => [ "gp", "none", "none", "esp" ] },
1381         emit      => '. pop%M %DAM0',
1382         outs      => [ "res", "M", "unused", "stack:I|S" ],
1383         ins       => [ "base", "index", "mem", "stack" ],
1384         am        => "dest,unary",
1385         latency   => 3, # Pop is more expensive than Push on Athlon
1386         units     => [ "GP" ],
1387 },
1388
1389 Enter => {
1390         reg_req   => { in => [ "esp" ], out => [ "ebp", "esp", "none" ] },
1391         emit      => '. enter',
1392         outs      => [ "frame:I", "stack:I|S", "M" ],
1393         latency   => 15,
1394         units     => [ "GP" ],
1395 },
1396
1397 Leave => {
1398         reg_req   => { in => [ "esp", "ebp" ], out => [ "ebp", "esp" ] },
1399         emit      => '. leave',
1400         outs      => [ "frame:I", "stack:I|S" ],
1401         latency   => 3,
1402         units     => [ "GP" ],
1403 },
1404
1405 AddSP => {
1406         irn_flags => "I",
1407         state     => "pinned",
1408         reg_req   => { in => [ "gp", "gp", "none", "esp", "gp" ], out => [ "in_r4", "none" ] },
1409         ins       => [ "base", "index", "mem", "stack", "size" ],
1410         am        => "source,binary",
1411         emit      => '. addl %binop',
1412         latency   => 1,
1413         outs      => [ "stack:S", "M" ],
1414         units     => [ "GP" ],
1415         modified_flags => $status_flags
1416 },
1417
1418 SubSP => {
1419 #irn_flags => "I",
1420         state     => "pinned",
1421         reg_req   => { in => [ "gp", "gp", "none", "esp", "gp" ], out => [ "in_r4", "gp", "none" ] },
1422         ins       => [ "base", "index", "mem", "stack", "size" ],
1423         am        => "source,binary",
1424         emit      => ". subl %binop\n".
1425                      ". movl %%esp, %D1",
1426         latency   => 2,
1427         outs      => [ "stack:I|S", "addr", "M" ],
1428         units     => [ "GP" ],
1429         modified_flags => $status_flags
1430 },
1431
1432 LdTls => {
1433         irn_flags => "R",
1434         reg_req   => { out => [ "gp" ] },
1435         units     => [ "GP" ],
1436         latency   => 1,
1437 },
1438
1439
1440 #-----------------------------------------------------------------------------#
1441 #   _____ _____ ______    __ _             _                     _            #
1442 #  / ____/ ____|  ____|  / _| |           | |                   | |           #
1443 # | (___| (___ | |__    | |_| | ___   __ _| |_   _ __   ___   __| | ___  ___  #
1444 #  \___ \\___ \|  __|   |  _| |/ _ \ / _` | __| | '_ \ / _ \ / _` |/ _ \/ __| #
1445 #  ____) |___) | |____  | | | | (_) | (_| | |_  | | | | (_) | (_| |  __/\__ \ #
1446 # |_____/_____/|______| |_| |_|\___/ \__,_|\__| |_| |_|\___/ \__,_|\___||___/ #
1447 #-----------------------------------------------------------------------------#
1448
1449 xZero => {
1450         irn_flags => "R",
1451         reg_req   => { out => [ "xmm" ] },
1452         emit      => '. xorp%XSD %D0, %D0',
1453         latency   => 3,
1454         units     => [ "SSE" ],
1455         mode      => "mode_E",
1456 },
1457
1458 # commutative operations
1459
1460 xAdd => {
1461         irn_flags => "R",
1462         state     => "exc_pinned",
1463         reg_req   => { in => [ "gp", "gp", "none", "xmm", "xmm" ], out => [ "in_r4 in_r5" ] },
1464         ins       => [ "base", "index", "mem", "left", "right" ],
1465         am        => "source,binary",
1466         emit      => '. add%XXM %binop',
1467         latency   => 4,
1468         units     => [ "SSE" ],
1469         mode      => "mode_E",
1470 },
1471
1472 xMul => {
1473         irn_flags => "R",
1474         state     => "exc_pinned",
1475         reg_req   => { in => [ "gp", "gp", "none", "xmm", "xmm" ], out => [ "in_r4 in_r5" ] },
1476         ins       => [ "base", "index", "mem", "left", "right" ],
1477         am        => "source,binary",
1478         emit      => '. mul%XXM %binop',
1479         latency   => 4,
1480         units     => [ "SSE" ],
1481         mode      => "mode_E",
1482 },
1483
1484 xMax => {
1485         irn_flags => "R",
1486         state     => "exc_pinned",
1487         reg_req   => { in => [ "gp", "gp", "none", "xmm", "xmm" ], out => [ "in_r4 in_r5" ] },
1488         ins       => [ "base", "index", "mem", "left", "right" ],
1489         am        => "source,binary",
1490         emit      => '. max%XXM %binop',
1491         latency   => 2,
1492         units     => [ "SSE" ],
1493         mode      => "mode_E",
1494 },
1495
1496 xMin => {
1497         irn_flags => "R",
1498         state     => "exc_pinned",
1499         reg_req   => { in => [ "gp", "gp", "none", "xmm", "xmm" ], out => [ "in_r4 in_r5" ] },
1500         ins       => [ "base", "index", "mem", "left", "right" ],
1501         am        => "source,binary",
1502         emit      => '. min%XXM %binop',
1503         latency   => 2,
1504         units     => [ "SSE" ],
1505         mode      => "mode_E",
1506 },
1507
1508 xAnd => {
1509         irn_flags => "R",
1510         state     => "exc_pinned",
1511         reg_req   => { in => [ "gp", "gp", "none", "xmm", "xmm" ], out => [ "in_r4 in_r5" ] },
1512         ins       => [ "base", "index", "mem", "left", "right" ],
1513         am        => "source,binary",
1514         emit      => '. andp%XSD %binop',
1515         latency   => 3,
1516         units     => [ "SSE" ],
1517         mode      => "mode_E",
1518 },
1519
1520 xOr => {
1521         irn_flags => "R",
1522         state     => "exc_pinned",
1523         reg_req   => { in => [ "gp", "gp", "none", "xmm", "xmm" ], out => [ "in_r4 in_r5" ] },
1524         ins       => [ "base", "index", "mem", "left", "right" ],
1525         am        => "source,binary",
1526         emit      => '. orp%XSD %binop',
1527         latency   => 3,
1528         units     => [ "SSE" ],
1529         mode      => "mode_E",
1530 },
1531
1532 xXor => {
1533         irn_flags => "R",
1534         state     => "exc_pinned",
1535         reg_req   => { in => [ "gp", "gp", "none", "xmm", "xmm" ], out => [ "in_r4 in_r5" ] },
1536         ins       => [ "base", "index", "mem", "left", "right" ],
1537         am        => "source,binary",
1538         emit      => '. xorp%XSD %binop',
1539         latency   => 3,
1540         units     => [ "SSE" ],
1541         mode      => "mode_E",
1542 },
1543
1544 # not commutative operations
1545
1546 xAndNot => {
1547         irn_flags => "R",
1548         state     => "exc_pinned",
1549         reg_req   => { in => [ "gp", "gp", "none", "xmm", "xmm" ], out => [ "in_r4 !in_r5" ] },
1550         ins       => [ "base", "index", "mem", "left", "right" ],
1551         am        => "source,binary",
1552         emit      => '. andnp%XSD %binop',
1553         latency   => 3,
1554         units     => [ "SSE" ],
1555         mode      => "mode_E",
1556 },
1557
1558 xSub => {
1559         irn_flags => "R",
1560         state     => "exc_pinned",
1561         reg_req   => { in => [ "gp", "gp", "none", "xmm", "xmm" ], out => [ "in_r4" ] },
1562         ins       => [ "base", "index", "mem", "left", "right" ],
1563         am        => "source,binary",
1564         emit      => '. sub%XXM %binop',
1565         latency   => 4,
1566         units     => [ "SSE" ],
1567         mode      => "mode_E",
1568 },
1569
1570 xDiv => {
1571         irn_flags => "R",
1572         state     => "exc_pinned",
1573         reg_req   => { in => [ "gp", "gp", "none", "xmm", "xmm" ], out => [ "in_r4 !in_r5", "none" ] },
1574         ins       => [ "base", "index", "mem", "left", "right" ],
1575         am        => "source,binary",
1576         outs      => [ "res", "M" ],
1577         emit      => '. div%XXM %binop',
1578         latency   => 16,
1579         units     => [ "SSE" ],
1580 },
1581
1582 # other operations
1583
1584 Ucomi => {
1585         irn_flags => "R",
1586         state     => "exc_pinned",
1587         reg_req   => { in => [ "gp", "gp", "none", "xmm", "xmm" ], out => [ "eflags" ] },
1588         ins       => [ "base", "index", "mem", "left", "right" ],
1589         outs      => [ "flags" ],
1590         am        => "source,binary",
1591         attr      => "int ins_permuted",
1592         init_attr => "attr->data.ins_permuted = ins_permuted;",
1593         emit      => ' .ucomi%XXM %binop',
1594         latency   => 3,
1595         units     => [ "SSE" ],
1596         mode      => $mode_flags,
1597         modified_flags => 1,
1598 },
1599
1600 # Load / Store
1601
1602 xLoad => {
1603         op_flags  => "L|F",
1604         state     => "exc_pinned",
1605         reg_req   => { in => [ "gp", "gp", "none" ], out => [ "xmm", "none", "none" ] },
1606         ins       => [ "base", "index", "mem" ],
1607         outs      => [ "res", "M", "X_exc" ],
1608         emit      => '. mov%XXM %AM, %D0',
1609         attr      => "ir_mode *load_mode",
1610         init_attr => "attr->ls_mode = load_mode;",
1611         latency   => 0,
1612         units     => [ "SSE" ],
1613 },
1614
1615 xStore => {
1616         op_flags => "L|F",
1617         state    => "exc_pinned",
1618         reg_req  => { in => [ "gp", "gp", "none", "xmm" ], out => [ "none", "none" ] },
1619         ins       => [ "base", "index", "mem", "val" ],
1620         outs      => [ "M", "X_exc" ],
1621         emit     => '. mov%XXM %S3, %AM',
1622         latency  => 0,
1623         units    => [ "SSE" ],
1624         mode     => "mode_M",
1625 },
1626
1627 xStoreSimple => {
1628         op_flags => "L|F",
1629         state    => "exc_pinned",
1630         reg_req  => { in => [ "gp", "gp", "none", "xmm" ] },
1631         ins      => [ "base", "index", "mem", "val" ],
1632         emit     => '. mov%XXM %S3, %AM',
1633         latency  => 0,
1634         units    => [ "SSE" ],
1635         mode     => "mode_M",
1636 },
1637
1638 CvtSI2SS => {
1639         op_flags => "L|F",
1640         state     => "exc_pinned",
1641         reg_req  => { in => [ "gp", "gp", "none", "gp" ], out => [ "xmm" ] },
1642         ins      => [ "base", "index", "mem", "val" ],
1643         am       => "source,unary",
1644         emit     => '. cvtsi2ss %unop3, %D0',
1645         latency  => 2,
1646         units    => [ "SSE" ],
1647         mode     => $mode_xmm
1648 },
1649
1650 CvtSI2SD => {
1651         op_flags => "L|F",
1652         state     => "exc_pinned",
1653         reg_req  => { in => [ "gp", "gp", "none", "gp" ], out => [ "xmm" ] },
1654         ins      => [ "base", "index", "mem", "val" ],
1655         am       => "source,unary",
1656         emit     => '. cvtsi2sd %unop3, %D0',
1657         latency  => 2,
1658         units    => [ "SSE" ],
1659         mode     => $mode_xmm
1660 },
1661
1662
1663 l_LLtoFloat => {
1664         op_flags => "L|F",
1665         cmp_attr => "return 1;",
1666         ins      => [ "val_high", "val_low" ],
1667 },
1668
1669 l_FloattoLL => {
1670         op_flags => "L|F",
1671         cmp_attr => "return 1;",
1672         ins      => [ "val" ],
1673         outs     => [ "res_high", "res_low" ],
1674 },
1675
1676 # CopyB
1677
1678 CopyB => {
1679         op_flags  => "F|H",
1680         state     => "pinned",
1681         reg_req   => { in => [ "edi", "esi", "ecx", "none" ], out => [ "edi", "esi", "ecx", "none" ] },
1682         outs      => [ "DST", "SRC", "CNT", "M" ],
1683         attr_type => "ia32_copyb_attr_t",
1684         attr      => "unsigned size",
1685         units     => [ "GP" ],
1686         latency  => 3,
1687 # we don't care about this flag, so no need to mark this node
1688 #       modified_flags => [ "DF" ]
1689 },
1690
1691 CopyB_i => {
1692         op_flags  => "F|H",
1693         state     => "pinned",
1694         reg_req   => { in => [ "edi", "esi", "none" ], out => [  "edi", "esi", "none" ] },
1695         outs      => [ "DST", "SRC", "M" ],
1696         attr_type => "ia32_copyb_attr_t",
1697         attr      => "unsigned size",
1698         units     => [ "GP" ],
1699         latency  => 3,
1700 # we don't care about this flag, so no need to mark this node
1701 #       modified_flags => [ "DF" ]
1702 },
1703
1704 # Conversions
1705
1706 Conv_I2I => {
1707         state     => "exc_pinned",
1708         reg_req   => { in => [ "gp", "gp", "none", "gp" ], out => [ "gp", "none" ] },
1709         ins       => [ "base", "index", "mem", "val" ],
1710         am        => "source,unary",
1711         units     => [ "GP" ],
1712         latency   => 1,
1713         attr      => "ir_mode *smaller_mode",
1714         init_attr => "attr->ls_mode = smaller_mode;",
1715         mode      => $mode_gp,
1716 },
1717
1718 Conv_I2I8Bit => {
1719         state     => "exc_pinned",
1720         reg_req   => { in => [ "gp", "gp", "none", "eax ebx ecx edx" ], out => [ "gp", "none" ] },
1721         ins       => [ "base", "index", "mem", "val" ],
1722         am        => "source,unary",
1723         units     => [ "GP" ],
1724         latency   => 1,
1725         attr      => "ir_mode *smaller_mode",
1726         init_attr => "attr->ls_mode = smaller_mode;",
1727         mode      => $mode_gp,
1728 },
1729
1730 Conv_I2FP => {
1731         state     => "exc_pinned",
1732         reg_req   => { in => [ "gp", "gp", "none", "gp" ], out => [ "xmm", "none" ] },
1733         ins       => [ "base", "index", "mem", "val" ],
1734         am        => "source,unary",
1735         latency   => 10,
1736         units     => [ "SSE" ],
1737         mode      => "mode_E",
1738 },
1739
1740 Conv_FP2I => {
1741         state     => "exc_pinned",
1742         reg_req   => { in => [ "gp", "gp", "none", "xmm" ], out => [ "gp", "none" ] },
1743         ins       => [ "base", "index", "mem", "val" ],
1744         am        => "source,unary",
1745         latency   => 10,
1746         units     => [ "SSE" ],
1747         mode      => $mode_gp,
1748 },
1749
1750 Conv_FP2FP => {
1751         state     => "exc_pinned",
1752         reg_req   => { in => [ "gp", "gp", "none", "xmm" ], out => [ "xmm", "none" ] },
1753         ins       => [ "base", "index", "mem", "val" ],
1754         am        => "source,unary",
1755         latency   => 8,
1756         units     => [ "SSE" ],
1757         mode      => "mode_E",
1758 },
1759
1760 #----------------------------------------------------------#
1761 #        _      _               _    __ _             _    #
1762 #       (_)    | |             | |  / _| |           | |   #
1763 # __   ___ _ __| |_ _   _  __ _| | | |_| | ___   __ _| |_  #
1764 # \ \ / / | '__| __| | | |/ _` | | |  _| |/ _ \ / _` | __| #
1765 #  \ V /| | |  | |_| |_| | (_| | | | | | | (_) | (_| | |_  #
1766 #   \_/ |_|_|   \__|\__,_|\__,_|_| |_| |_|\___/ \__,_|\__| #
1767 #                 | |                                      #
1768 #  _ __   ___   __| | ___  ___                             #
1769 # | '_ \ / _ \ / _` |/ _ \/ __|                            #
1770 # | | | | (_) | (_| |  __/\__ \                            #
1771 # |_| |_|\___/ \__,_|\___||___/                            #
1772 #----------------------------------------------------------#
1773
1774 # rematerialisation disabled for all float nodes for now, because the fpcw
1775 # handler runs before spilling and we might end up with wrong fpcw then
1776
1777 vfadd => {
1778 #       irn_flags => "R",
1779         state     => "exc_pinned",
1780         reg_req   => { in => [ "gp", "gp", "none", "vfp", "vfp", "fpcw" ], out => [ "vfp" ] },
1781         ins       => [ "base", "index", "mem", "left", "right", "fpcw" ],
1782         am        => "source,binary",
1783         latency   => 4,
1784         units     => [ "VFP" ],
1785         mode      => "mode_E",
1786         attr_type => "ia32_x87_attr_t",
1787 },
1788
1789 vfmul => {
1790 #       irn_flags => "R",
1791         state     => "exc_pinned",
1792         reg_req   => { in => [ "gp", "gp", "none", "vfp", "vfp", "fpcw" ], out => [ "vfp" ] },
1793         ins       => [ "base", "index", "mem", "left", "right", "fpcw" ],
1794         am        => "source,binary",
1795         latency   => 4,
1796         units     => [ "VFP" ],
1797         mode      => "mode_E",
1798         attr_type => "ia32_x87_attr_t",
1799 },
1800
1801 vfsub => {
1802 #       irn_flags => "R",
1803         state     => "exc_pinned",
1804         reg_req   => { in => [ "gp", "gp", "none", "vfp", "vfp", "fpcw" ], out => [ "vfp" ] },
1805         ins       => [ "base", "index", "mem", "left", "right", "fpcw" ],
1806         am        => "source,binary",
1807         latency   => 4,
1808         units     => [ "VFP" ],
1809         mode      => "mode_E",
1810         attr_type => "ia32_x87_attr_t",
1811 },
1812
1813 vfdiv => {
1814         state     => "exc_pinned",
1815         reg_req   => { in => [ "gp", "gp", "none", "vfp", "vfp", "fpcw" ], out => [ "vfp", "none" ] },
1816         ins       => [ "base", "index", "mem", "left", "right", "fpcw" ],
1817         am        => "source,binary",
1818         outs      => [ "res", "M" ],
1819         latency   => 20,
1820         units     => [ "VFP" ],
1821         attr_type => "ia32_x87_attr_t",
1822 },
1823
1824 vfprem => {
1825         reg_req   => { in => [ "vfp", "vfp", "fpcw" ], out => [ "vfp" ] },
1826         ins       => [ "left", "right", "fpcw" ],
1827         latency   => 20,
1828         units     => [ "VFP" ],
1829         mode      => "mode_E",
1830         attr_type => "ia32_x87_attr_t",
1831 },
1832
1833 vfabs => {
1834         irn_flags => "R",
1835         reg_req   => { in => [ "vfp"], out => [ "vfp" ] },
1836         ins       => [ "value" ],
1837         latency   => 2,
1838         units     => [ "VFP" ],
1839         mode      => "mode_E",
1840         attr_type => "ia32_x87_attr_t",
1841 },
1842
1843 vfchs => {
1844         irn_flags => "R",
1845         reg_req   => { in => [ "vfp"], out => [ "vfp" ] },
1846         ins       => [ "value" ],
1847         latency   => 2,
1848         units     => [ "VFP" ],
1849         mode      => "mode_E",
1850         attr_type => "ia32_x87_attr_t",
1851 },
1852
1853 # virtual Load and Store
1854
1855 vfld => {
1856         irn_flags => "R",
1857         op_flags  => "L|F",
1858         state     => "exc_pinned",
1859         reg_req   => { in => [ "gp", "gp", "none" ], out => [ "vfp", "none", "none" ] },
1860         ins       => [ "base", "index", "mem" ],
1861         outs      => [ "res", "M", "X_exc" ],
1862         attr      => "ir_mode *load_mode",
1863         init_attr => "attr->attr.ls_mode = load_mode;",
1864         latency   => 2,
1865         units     => [ "VFP" ],
1866         attr_type => "ia32_x87_attr_t",
1867 },
1868
1869 vfst => {
1870         irn_flags => "R",
1871         op_flags  => "L|F",
1872         state     => "exc_pinned",
1873         reg_req   => { in => [ "gp", "gp", "none", "vfp" ], out => [ "none", "none" ] },
1874         ins       => [ "base", "index", "mem", "val" ],
1875         outs      => [ "M", "X_exc" ],
1876         attr      => "ir_mode *store_mode",
1877         init_attr => "attr->attr.ls_mode = store_mode;",
1878         latency   => 2,
1879         units     => [ "VFP" ],
1880         mode      => "mode_M",
1881         attr_type => "ia32_x87_attr_t",
1882 },
1883
1884 # Conversions
1885
1886 vfild => {
1887         state     => "exc_pinned",
1888         reg_req   => { in => [ "gp", "gp", "none" ], out => [ "vfp", "none" ] },
1889         outs      => [ "res", "M" ],
1890         ins       => [ "base", "index", "mem" ],
1891         latency   => 4,
1892         units     => [ "VFP" ],
1893         attr_type => "ia32_x87_attr_t",
1894 },
1895
1896 l_vfild => {
1897         cmp_attr  => "return 1;",
1898         outs      => [ "res", "M" ],
1899         arity     => 2,
1900 },
1901
1902 vfist => {
1903         state     => "exc_pinned",
1904         reg_req   => { in => [ "gp", "gp", "none", "vfp", "fpcw" ] },
1905         ins       => [ "base", "index", "mem", "val", "fpcw" ],
1906         latency   => 4,
1907         units     => [ "VFP" ],
1908         mode      => "mode_M",
1909         attr_type => "ia32_x87_attr_t",
1910 },
1911
1912 l_vfist => {
1913         cmp_attr  => "return 1;",
1914         state     => "exc_pinned",
1915         arity     => 3,
1916         mode      => "mode_M",
1917 },
1918
1919
1920 # constants
1921
1922 vfldz => {
1923         irn_flags => "R",
1924         reg_req   => { out => [ "vfp" ] },
1925         latency   => 4,
1926         units     => [ "VFP" ],
1927         mode      => "mode_E",
1928         attr_type => "ia32_x87_attr_t",
1929 },
1930
1931 vfld1 => {
1932         irn_flags => "R",
1933         reg_req   => { out => [ "vfp" ] },
1934         latency   => 4,
1935         units     => [ "VFP" ],
1936         mode      => "mode_E",
1937         attr_type => "ia32_x87_attr_t",
1938 },
1939
1940 vfldpi => {
1941         irn_flags => "R",
1942         reg_req   => { out => [ "vfp" ] },
1943         latency   => 4,
1944         units     => [ "VFP" ],
1945         mode      => "mode_E",
1946         attr_type => "ia32_x87_attr_t",
1947 },
1948
1949 vfldln2 => {
1950         irn_flags => "R",
1951         reg_req   => { out => [ "vfp" ] },
1952         latency   => 4,
1953         units     => [ "VFP" ],
1954         mode      => "mode_E",
1955         attr_type => "ia32_x87_attr_t",
1956 },
1957
1958 vfldlg2 => {
1959         irn_flags => "R",
1960         reg_req   => { out => [ "vfp" ] },
1961         latency   => 4,
1962         units     => [ "VFP" ],
1963         mode      => "mode_E",
1964         attr_type => "ia32_x87_attr_t",
1965 },
1966
1967 vfldl2t => {
1968         irn_flags => "R",
1969         reg_req   => { out => [ "vfp" ] },
1970         latency   => 4,
1971         units     => [ "VFP" ],
1972         mode      => "mode_E",
1973         attr_type => "ia32_x87_attr_t",
1974 },
1975
1976 vfldl2e => {
1977         irn_flags => "R",
1978         reg_req   => { out => [ "vfp" ] },
1979         latency   => 4,
1980         units     => [ "VFP" ],
1981         mode      => "mode_E",
1982         attr_type => "ia32_x87_attr_t",
1983 },
1984
1985 # other
1986
1987 vFucomFnstsw => {
1988 # we can't allow to rematerialize this node so we don't have
1989 #  accidently produce Phi(Fucom, Fucom(ins_permuted))
1990 #       irn_flags => "R",
1991         reg_req   => { in => [ "vfp", "vfp" ], out => [ "eax" ] },
1992         ins       => [ "left", "right" ],
1993         outs      => [ "flags" ],
1994         attr      => "int ins_permuted",
1995         init_attr => "attr->attr.data.ins_permuted = ins_permuted;",
1996         latency   => 3,
1997         units     => [ "VFP" ],
1998         attr_type => "ia32_x87_attr_t",
1999         mode      => $mode_gp
2000 },
2001
2002 vFucomi => {
2003         irn_flags => "R",
2004         reg_req   => { in => [ "vfp", "vfp" ], out => [ "eflags" ] },
2005         ins       => [ "left", "right" ],
2006         outs      => [ "flags" ],
2007         attr      => "int ins_permuted",
2008         init_attr => "attr->attr.data.ins_permuted = ins_permuted;",
2009         latency   => 3,
2010         units     => [ "VFP" ],
2011         attr_type => "ia32_x87_attr_t",
2012         mode      => $mode_gp
2013 },
2014
2015 vFtstFnstsw => {
2016 #       irn_flags => "R",
2017         reg_req   => { in => [ "vfp" ], out => [ "eax" ] },
2018         ins       => [ "left" ],
2019         outs      => [ "flags" ],
2020         attr      => "int ins_permuted",
2021         init_attr => "attr->attr.data.ins_permuted = ins_permuted;",
2022         latency   => 3,
2023         units     => [ "VFP" ],
2024         attr_type => "ia32_x87_attr_t",
2025         mode      => $mode_gp
2026 },
2027
2028 Sahf => {
2029         irn_flags => "R",
2030         reg_req   => { in => [ "eax" ], out => [ "eflags" ] },
2031         ins       => [ "val" ],
2032         outs      => [ "flags" ],
2033         emit      => '. sahf',
2034         latency   => 1,
2035         units     => [ "GP" ],
2036         mode      => $mode_flags,
2037 },
2038
2039 #------------------------------------------------------------------------#
2040 #       ___ _____    __ _             _                     _            #
2041 # __  _( _ )___  |  / _| | ___   __ _| |_   _ __   ___   __| | ___  ___  #
2042 # \ \/ / _ \  / /  | |_| |/ _ \ / _` | __| | '_ \ / _ \ / _` |/ _ \/ __| #
2043 #  >  < (_) |/ /   |  _| | (_) | (_| | |_  | | | | (_) | (_| |  __/\__ \ #
2044 # /_/\_\___//_/    |_| |_|\___/ \__,_|\__| |_| |_|\___/ \__,_|\___||___/ #
2045 #------------------------------------------------------------------------#
2046
2047 # Note: gas is strangely buggy: fdivrp and fdivp as well as fsubrp and fsubp
2048 #       are swapped, we work this around in the emitter...
2049
2050 fadd => {
2051         state     => "exc_pinned",
2052         rd_constructor => "NONE",
2053         reg_req   => { },
2054         emit      => '. fadd%XM %x87_binop',
2055         latency   => 4,
2056         attr_type => "ia32_x87_attr_t",
2057 },
2058
2059 faddp => {
2060         state     => "exc_pinned",
2061         rd_constructor => "NONE",
2062         reg_req   => { },
2063         emit      => '. faddp%XM %x87_binop',
2064         latency   => 4,
2065         attr_type => "ia32_x87_attr_t",
2066 },
2067
2068 fmul => {
2069         state     => "exc_pinned",
2070         rd_constructor => "NONE",
2071         reg_req   => { },
2072         emit      => '. fmul%XM %x87_binop',
2073         latency   => 4,
2074         attr_type => "ia32_x87_attr_t",
2075 },
2076
2077 fmulp => {
2078         state     => "exc_pinned",
2079         rd_constructor => "NONE",
2080         reg_req   => { },
2081         emit      => '. fmulp%XM %x87_binop',,
2082         latency   => 4,
2083         attr_type => "ia32_x87_attr_t",
2084 },
2085
2086 fsub => {
2087         state     => "exc_pinned",
2088         rd_constructor => "NONE",
2089         reg_req   => { },
2090         emit      => '. fsub%XM %x87_binop',
2091         latency   => 4,
2092         attr_type => "ia32_x87_attr_t",
2093 },
2094
2095 fsubp => {
2096         state     => "exc_pinned",
2097         rd_constructor => "NONE",
2098         reg_req   => { },
2099 # see note about gas bugs
2100         emit      => '. fsubrp%XM %x87_binop',
2101         latency   => 4,
2102         attr_type => "ia32_x87_attr_t",
2103 },
2104
2105 fsubr => {
2106         state     => "exc_pinned",
2107         rd_constructor => "NONE",
2108         irn_flags => "R",
2109         reg_req   => { },
2110         emit      => '. fsubr%XM %x87_binop',
2111         latency   => 4,
2112         attr_type => "ia32_x87_attr_t",
2113 },
2114
2115 fsubrp => {
2116         state     => "exc_pinned",
2117         rd_constructor => "NONE",
2118         irn_flags => "R",
2119         reg_req   => { },
2120 # see note about gas bugs
2121         emit      => '. fsubp%XM %x87_binop',
2122         latency   => 4,
2123         attr_type => "ia32_x87_attr_t",
2124 },
2125
2126 fprem => {
2127         rd_constructor => "NONE",
2128         reg_req   => { },
2129         emit      => '. fprem1',
2130         latency   => 20,
2131         attr_type => "ia32_x87_attr_t",
2132 },
2133
2134 # this node is just here, to keep the simulator running
2135 # we can omit this when a fprem simulation function exists
2136 fpremp => {
2137         rd_constructor => "NONE",
2138         reg_req   => { },
2139         emit      => '. fprem1\n'.
2140                      '. fstp %X0',
2141         latency   => 20,
2142         attr_type => "ia32_x87_attr_t",
2143 },
2144
2145 fdiv => {
2146         state     => "exc_pinned",
2147         rd_constructor => "NONE",
2148         reg_req   => { },
2149         emit      => '. fdiv%XM %x87_binop',
2150         latency   => 20,
2151         attr_type => "ia32_x87_attr_t",
2152 },
2153
2154 fdivp => {
2155         state     => "exc_pinned",
2156         rd_constructor => "NONE",
2157         reg_req   => { },
2158 # see note about gas bugs
2159         emit      => '. fdivrp%XM %x87_binop',
2160         latency   => 20,
2161         attr_type => "ia32_x87_attr_t",
2162 },
2163
2164 fdivr => {
2165         state     => "exc_pinned",
2166         rd_constructor => "NONE",
2167         reg_req   => { },
2168         emit      => '. fdivr%XM %x87_binop',
2169         latency   => 20,
2170         attr_type => "ia32_x87_attr_t",
2171 },
2172
2173 fdivrp => {
2174         state     => "exc_pinned",
2175         rd_constructor => "NONE",
2176         reg_req   => { },
2177 # see note about gas bugs
2178         emit      => '. fdivp%XM %x87_binop',
2179         latency   => 20,
2180         attr_type => "ia32_x87_attr_t",
2181 },
2182
2183 fabs => {
2184         rd_constructor => "NONE",
2185         reg_req   => { },
2186         emit      => '. fabs',
2187         latency   => 4,
2188         attr_type => "ia32_x87_attr_t",
2189 },
2190
2191 fchs => {
2192         op_flags  => "R|K",
2193         rd_constructor => "NONE",
2194         reg_req   => { },
2195         emit      => '. fchs',
2196         latency   => 4,
2197         attr_type => "ia32_x87_attr_t",
2198 },
2199
2200 # x87 Load and Store
2201
2202 fld => {
2203         rd_constructor => "NONE",
2204         op_flags  => "R|L|F",
2205         state     => "exc_pinned",
2206         reg_req   => { },
2207         emit      => '. fld%XM %AM',
2208         attr_type => "ia32_x87_attr_t",
2209         latency   => 2,
2210 },
2211
2212 fst => {
2213         rd_constructor => "NONE",
2214         op_flags  => "R|L|F",
2215         state     => "exc_pinned",
2216         reg_req   => { },
2217         emit      => '. fst%XM %AM',
2218         mode      => "mode_M",
2219         attr_type => "ia32_x87_attr_t",
2220         latency   => 2,
2221 },
2222
2223 fstp => {
2224         rd_constructor => "NONE",
2225         op_flags  => "R|L|F",
2226         state     => "exc_pinned",
2227         reg_req   => { },
2228         emit      => '. fstp%XM %AM',
2229         mode      => "mode_M",
2230         attr_type => "ia32_x87_attr_t",
2231         latency   => 2,
2232 },
2233
2234 # Conversions
2235
2236 fild => {
2237         state     => "exc_pinned",
2238         rd_constructor => "NONE",
2239         reg_req   => { },
2240         emit      => '. fild%M %AM',
2241         attr_type => "ia32_x87_attr_t",
2242         latency   => 2,
2243 },
2244
2245 fist => {
2246         state     => "exc_pinned",
2247         rd_constructor => "NONE",
2248         reg_req   => { },
2249         emit      => '. fist%M %AM',
2250         mode      => "mode_M",
2251         attr_type => "ia32_x87_attr_t",
2252         latency   => 2,
2253 },
2254
2255 fistp => {
2256         state     => "exc_pinned",
2257         rd_constructor => "NONE",
2258         reg_req   => { },
2259         emit      => '. fistp%M %AM',
2260         mode      => "mode_M",
2261         attr_type => "ia32_x87_attr_t",
2262         latency   => 2,
2263 },
2264
2265 # constants
2266
2267 fldz => {
2268         op_flags  => "R|c|K",
2269         irn_flags => "R",
2270         reg_req   => { out => [ "vfp" ] },
2271         emit      => '. fldz',
2272         attr_type => "ia32_x87_attr_t",
2273         latency   => 2,
2274 },
2275
2276 fld1 => {
2277         op_flags  => "R|c|K",
2278         irn_flags => "R",
2279         reg_req   => { out => [ "vfp" ] },
2280         emit      => '. fld1',
2281         attr_type => "ia32_x87_attr_t",
2282         latency   => 2,
2283 },
2284
2285 fldpi => {
2286         op_flags  => "R|c|K",
2287         irn_flags => "R",
2288         reg_req   => { out => [ "vfp" ] },
2289         emit      => '. fldpi',
2290         attr_type => "ia32_x87_attr_t",
2291         latency   => 2,
2292 },
2293
2294 fldln2 => {
2295         op_flags  => "R|c|K",
2296         irn_flags => "R",
2297         reg_req   => { out => [ "vfp" ] },
2298         emit      => '. fldln2',
2299         attr_type => "ia32_x87_attr_t",
2300         latency   => 2,
2301 },
2302
2303 fldlg2 => {
2304         op_flags  => "R|c|K",
2305         irn_flags => "R",
2306         reg_req   => { out => [ "vfp" ] },
2307         emit      => '. fldlg2',
2308         attr_type => "ia32_x87_attr_t",
2309         latency   => 2,
2310 },
2311
2312 fldl2t => {
2313         op_flags  => "R|c|K",
2314         irn_flags => "R",
2315         reg_req   => { out => [ "vfp" ] },
2316         emit      => '. fldll2t',
2317         attr_type => "ia32_x87_attr_t",
2318         latency   => 2,
2319 },
2320
2321 fldl2e => {
2322         op_flags  => "R|c|K",
2323         irn_flags => "R",
2324         reg_req   => { out => [ "vfp" ] },
2325         emit      => '. fldl2e',
2326         attr_type => "ia32_x87_attr_t",
2327         latency   => 2,
2328 },
2329
2330 # fxch, fpush, fpop
2331 # Note that it is NEVER allowed to do CSE on these nodes
2332 # Moreover, note the virtual register requierements!
2333
2334 fxch => {
2335         op_flags  => "R|K",
2336         reg_req   => { },
2337         cmp_attr  => "return 1;",
2338         emit      => '. fxch %X0',
2339         attr_type => "ia32_x87_attr_t",
2340         mode      => "mode_ANY",
2341         latency   => 1,
2342 },
2343
2344 fpush => {
2345         op_flags  => "R|K",
2346         reg_req   => {},
2347         cmp_attr  => "return 1;",
2348         emit      => '. fld %X0',
2349         attr_type => "ia32_x87_attr_t",
2350         mode      => "mode_ANY",
2351         latency   => 1,
2352 },
2353
2354 fpushCopy => {
2355         reg_req   => { in => [ "vfp"], out => [ "vfp" ] },
2356         cmp_attr  => "return 1;",
2357         emit      => '. fld %X0',
2358         attr_type => "ia32_x87_attr_t",
2359         latency   => 1,
2360 },
2361
2362 fpop => {
2363         op_flags  => "K",
2364         reg_req   => { },
2365         cmp_attr  => "return 1;",
2366         emit      => '. fstp %X0',
2367         attr_type => "ia32_x87_attr_t",
2368         mode      => "mode_ANY",
2369         latency   => 1,
2370 },
2371
2372 ffreep => {
2373         op_flags  => "K",
2374         reg_req   => { },
2375         cmp_attr  => "return 1;",
2376         emit      => '. ffreep %X0',
2377         attr_type => "ia32_x87_attr_t",
2378         mode      => "mode_ANY",
2379         latency   => 1,
2380 },
2381
2382 emms => {
2383         op_flags  => "K",
2384         reg_req   => { },
2385         cmp_attr  => "return 1;",
2386         emit      => '. emms',
2387         attr_type => "ia32_x87_attr_t",
2388         mode      => "mode_ANY",
2389         latency   => 3,
2390 },
2391
2392 femms => {
2393         op_flags  => "K",
2394         reg_req   => { },
2395         cmp_attr  => "return 1;",
2396         emit      => '. femms',
2397         attr_type => "ia32_x87_attr_t",
2398         mode      => "mode_ANY",
2399         latency   => 3,
2400 },
2401
2402 # compare
2403
2404 FucomFnstsw => {
2405         reg_req   => { },
2406         emit      => ". fucom %X1\n".
2407                      ". fnstsw %%ax",
2408         attr_type => "ia32_x87_attr_t",
2409         latency   => 2,
2410 },
2411
2412 FucompFnstsw => {
2413         reg_req   => { },
2414         emit      => ". fucomp %X1\n".
2415                      ". fnstsw %%ax",
2416         attr_type => "ia32_x87_attr_t",
2417         latency   => 2,
2418 },
2419
2420 FucomppFnstsw => {
2421         reg_req   => { },
2422         emit      => ". fucompp\n".
2423                      ". fnstsw %%ax",
2424         attr_type => "ia32_x87_attr_t",
2425         latency   => 2,
2426 },
2427
2428 Fucomi => {
2429         reg_req   => { },
2430         emit      => '. fucomi %X1',
2431         attr_type => "ia32_x87_attr_t",
2432         latency   => 1,
2433 },
2434
2435 Fucompi => {
2436         reg_req   => { },
2437         emit      => '. fucompi %X1',
2438         attr_type => "ia32_x87_attr_t",
2439         latency   => 1,
2440 },
2441
2442 FtstFnstsw => {
2443         reg_req   => { },
2444         emit      => ". ftst\n".
2445                      ". fnstsw %%ax",
2446         attr_type => "ia32_x87_attr_t",
2447         latency   => 2,
2448 },
2449
2450
2451 # -------------------------------------------------------------------------------- #
2452 #  ____ ____  _____                  _                               _             #
2453 # / ___/ ___|| ____| __   _____  ___| |_ ___  _ __   _ __   ___   __| | ___  ___   #
2454 # \___ \___ \|  _|   \ \ / / _ \/ __| __/ _ \| '__| | '_ \ / _ \ / _` |/ _ \/ __|  #
2455 #  ___) |__) | |___   \ V /  __/ (__| || (_) | |    | | | | (_) | (_| |  __/\__ \  #
2456 # |____/____/|_____|   \_/ \___|\___|\__\___/|_|    |_| |_|\___/ \__,_|\___||___/  #
2457 #                                                                                  #
2458 # -------------------------------------------------------------------------------- #
2459
2460
2461 # Spilling and reloading of SSE registers, hardcoded, not generated #
2462
2463 xxLoad => {
2464         op_flags  => "L|F",
2465         state     => "exc_pinned",
2466         reg_req   => { in => [ "gp", "gp", "none" ], out => [ "xmm", "none" ] },
2467         emit      => '. movdqu %D0, %AM',
2468         outs      => [ "res", "M" ],
2469         units     => [ "SSE" ],
2470         latency   => 1,
2471 },
2472
2473 xxStore => {
2474         op_flags => "L|F",
2475         state    => "exc_pinned",
2476         reg_req  => { in => [ "gp", "gp", "none", "xmm" ] },
2477         ins      => [ "base", "index", "mem", "val" ],
2478         emit     => '. movdqu %binop',
2479         units    => [ "SSE" ],
2480         latency   => 1,
2481         mode     => "mode_M",
2482 },
2483
2484 ); # end of %nodes
2485
2486 # Include the generated SIMD node specification written by the SIMD optimization
2487 $my_script_name = dirname($myname) . "/../ia32/ia32_simd_spec.pl";
2488 unless ($return = do $my_script_name) {
2489         warn "couldn't parse $my_script_name: $@" if $@;
2490         warn "couldn't do $my_script_name: $!"    unless defined $return;
2491         warn "couldn't run $my_script_name"       unless $return;
2492 }
2493
2494 # Transform some attributes
2495 foreach my $op (keys(%nodes)) {
2496         my $node         = $nodes{$op};
2497         my $op_attr_init = $node->{op_attr_init};
2498
2499         if(defined($op_attr_init)) {
2500                 $op_attr_init .= "\n\t";
2501         } else {
2502                 $op_attr_init = "";
2503         }
2504
2505         if(!defined($node->{latency})) {
2506                 if($op =~ m/^l_/) {
2507                         $node->{latency} = 0;
2508                 } else {
2509                         die("Latency missing for op $op");
2510                 }
2511         }
2512         $op_attr_init .= "attr->latency = ".$node->{latency} . ";";
2513
2514         $node->{op_attr_init} = $op_attr_init;
2515 }
2516
2517 print "";