b906e4e14479f0a515477d97e55e1270b4a9f760
[libfirm] / ir / be / ia32 / ia32_spec.pl
1 # Creation: 2005/10/19
2 # $Id$
3 # This is the specification for the ia32 assembler Firm-operations
4
5 use File::Basename;
6
7 $new_emit_syntax = 1;
8 my $myname = $0;
9
10 # the cpu architecture (ia32, ia64, mips, sparc, ppc, ...)
11 $arch = "ia32";
12
13 # The node description is done as a perl hash initializer with the
14 # following structure:
15 #
16 # %nodes = (
17 #
18 # <op-name> => {
19 #   op_flags  => "N|L|C|X|I|F|Y|H|c|K",
20 #   irn_flags => "R|N|I|S"
21 #   arity     => "0|1|2|3 ... |variable|dynamic|any",
22 #   state     => "floats|pinned|mem_pinned|exc_pinned",
23 #   args      => [
24 #                    { type => "type 1", name => "name 1" },
25 #                    { type => "type 2", name => "name 2" },
26 #                    ...
27 #                  ],
28 #   comment   => "any comment for constructor",
29 #   reg_req   => { in => [ "reg_class|register" ], out => [ "reg_class|register|in_rX" ] },
30 #   cmp_attr  => "c source code for comparing node attributes",
31 #   emit      => "emit code with templates",
32 #   attr      => "attitional attribute arguments for constructor"
33 #   init_attr => "emit attribute initialization template"
34 #   rd_constructor => "c source code which constructs an ir_node"
35 #   latency   => "latency of this operation (can be float)"
36 # },
37 #
38 # ... # (all nodes you need to describe)
39 #
40 # ); # close the %nodes initializer
41
42 # op_flags: flags for the operation, OPTIONAL (default is "N")
43 # the op_flags correspond to the firm irop_flags:
44 #   N   irop_flag_none
45 #   L   irop_flag_labeled
46 #   C   irop_flag_commutative
47 #   X   irop_flag_cfopcode
48 #   I   irop_flag_ip_cfopcode
49 #   F   irop_flag_fragile
50 #   Y   irop_flag_forking
51 #   H   irop_flag_highlevel
52 #   c   irop_flag_constlike
53 #   K   irop_flag_keep
54 #
55 # irn_flags: special node flags, OPTIONAL (default is 0)
56 # following irn_flags are supported:
57 #   R   rematerializeable
58 #   N   not spillable
59 #   I   ignore for register allocation
60 #   S   modifies stack pointer
61 #
62 # state: state of the operation, OPTIONAL (default is "floats")
63 #
64 # arity: arity of the operation, MUST NOT BE OMITTED
65 #
66 # args:  the OPTIONAL arguments of the node constructor (debug, irg and block
67 #        are always the first 3 arguments and are always autmatically
68 #        created)
69 #        If this key is missing the following arguments will be created:
70 #        for i = 1 .. arity: ir_node *op_i
71 #        ir_mode *mode
72 #
73 # outs:  if a node defines more than one output, the names of the projections
74 #        nodes having outs having automatically the mode mode_T
75 #        One can also annotate some flags for each out, additional to irn_flags.
76 #        They are separated from name with a colon ':', and concatenated by pipe '|'
77 #        Only I and S are available at the moment (same meaning as in irn_flags).
78 #        example: [ "frame:I", "stack:I|S", "M" ]
79 #
80 # comment: OPTIONAL comment for the node constructor
81 #
82 # rd_constructor: for every operation there will be a
83 #      new_rd_<arch>_<op-name> function with the arguments from above
84 #      which creates the ir_node corresponding to the defined operation
85 #      you can either put the complete source code of this function here
86 #
87 #      This key is OPTIONAL. If omitted, the following constructor will
88 #      be created:
89 #      if (!op_<arch>_<op-name>) assert(0);
90 #      for i = 1 to arity
91 #         set in[i] = op_i
92 #      done
93 #      res = new_ir_node(db, irg, block, op_<arch>_<op-name>, mode, arity, in)
94 #      return res
95 #
96 # NOTE: rd_constructor and args are only optional if and only if arity is 0,1,2 or 3
97 #
98 # latency: the latency of the operation, default is 1
99 #
100
101 # register types:
102 #   0 - no special type
103 #   1 - caller save (register must be saved by the caller of a function)
104 #   2 - callee save (register must be saved by the called function)
105 #   4 - ignore (do not assign this register)
106 #   8 - emitter can choose an arbitrary register of this class
107 #  16 - the register is a virtual one
108 #  32 - register represents a state
109 # NOTE: Last entry of each class is the largest Firm-Mode a register can hold
110 %reg_classes = (
111         gp => [
112                 { name => "eax", type => 1 },
113                 { name => "edx", type => 1 },
114                 { name => "ebx", type => 2 },
115                 { name => "ecx", type => 1 },
116                 { name => "esi", type => 2 },
117                 { name => "edi", type => 2 },
118                 { name => "ebp", type => 2 },
119                 { name => "esp", type => 4 },
120                 { name => "gp_NOREG", type => 4 | 8 | 16 }, # we need a dummy register for NoReg nodes
121                 { name => "gp_UKNWN", type => 4 | 8 | 16 },  # we need a dummy register for Unknown nodes
122                 { mode => "mode_Iu" }
123         ],
124         xmm => [
125                 { name => "xmm0", type => 1 },
126                 { name => "xmm1", type => 1 },
127                 { name => "xmm2", type => 1 },
128                 { name => "xmm3", type => 1 },
129                 { name => "xmm4", type => 1 },
130                 { name => "xmm5", type => 1 },
131                 { name => "xmm6", type => 1 },
132                 { name => "xmm7", type => 1 },
133                 { name => "xmm_NOREG", type => 4 | 16 },     # we need a dummy register for NoReg nodes
134                 { name => "xmm_UKNWN", type => 4 | 8 | 16},  # we need a dummy register for Unknown nodes
135                 { mode => "mode_E" }
136         ],
137         vfp => [
138                 { name => "vf0", type => 1 | 16 },
139                 { name => "vf1", type => 1 | 16 },
140                 { name => "vf2", type => 1 | 16 },
141                 { name => "vf3", type => 1 | 16 },
142                 { name => "vf4", type => 1 | 16 },
143                 { name => "vf5", type => 1 | 16 },
144                 { name => "vf6", type => 1 | 16 },
145                 { name => "vf7", type => 1 | 16 },
146                 { name => "vfp_NOREG", type => 4 | 8 | 16 }, # we need a dummy register for NoReg nodes
147                 { name => "vfp_UKNWN", type => 4 | 8 | 16 },  # we need a dummy register for Unknown nodes
148                 { mode => "mode_E" }
149         ],
150         st => [
151                 { name => "st0", realname => "st",    type => 4 },
152                 { name => "st1", realname => "st(1)", type => 4 },
153                 { name => "st2", realname => "st(2)", type => 4 },
154                 { name => "st3", realname => "st(3)", type => 4 },
155                 { name => "st4", realname => "st(4)", type => 4 },
156                 { name => "st5", realname => "st(5)", type => 4 },
157                 { name => "st6", realname => "st(6)", type => 4 },
158                 { name => "st7", realname => "st(7)", type => 4 },
159                 { mode => "mode_E" }
160         ],
161         fp_cw => [      # the floating point control word
162                 { name => "fpcw", type => 4 | 32},
163                 { mode => "mode_fpcw" }
164         ],
165         flags => [
166                 { name => "eflags", type => 4 },
167                 { mode => "mode_Iu" }
168         ],
169         fp_sw => [
170                 { name => "fpsw", type => 4 },
171                 { mode => "mode_Hu" }
172         ],
173 ); # %reg_classes
174
175 %flags = (
176         CF  => { reg => "eflags", bit => 0 },
177         PF  => { reg => "eflags", bit => 2 },
178         AF  => { reg => "eflags", bit => 4 },
179         ZF  => { reg => "eflags", bit => 6 },
180         SF  => { reg => "eflags", bit => 7 },
181         TF  => { reg => "eflags", bit => 8 },
182         IF  => { reg => "eflags", bit => 9 },
183         DF  => { reg => "eflags", bit => 10 },
184         OF  => { reg => "eflags", bit => 11 },
185         IOPL0 => { reg => "eflags", bit => 12 },
186         IOPL1 => { reg => "eflags", bit => 13 },
187         NT  => { reg => "eflags", bit => 14 },
188         RF  => { reg => "eflags", bit => 16 },
189         VM  => { reg => "eflags", bit => 17 },
190         AC  => { reg => "eflags", bit => 18 },
191         VIF => { reg => "eflags", bit => 19 },
192         VIP => { reg => "eflags", bit => 20 },
193         ID  => { reg => "eflags", bit => 21 },
194
195         FP_IE => { reg => "fpsw", bit => 0 },
196         FP_DE => { reg => "fpsw", bit => 1 },
197         FP_ZE => { reg => "fpsw", bit => 2 },
198         FP_OE => { reg => "fpsw", bit => 3 },
199         FP_UE => { reg => "fpsw", bit => 4 },
200         FP_PE => { reg => "fpsw", bit => 5 },
201         FP_SF => { reg => "fpsw", bit => 6 },
202         FP_ES => { reg => "fpsw", bit => 7 },
203         FP_C0 => { reg => "fpsw", bit => 8 },
204         FP_C1 => { reg => "fpsw", bit => 9 },
205         FP_C2 => { reg => "fpsw", bit => 10 },
206         FP_TOP0 => { reg => "fpsw", bit => 11 },
207         FP_TOP1 => { reg => "fpsw", bit => 12 },
208         FP_TOP2 => { reg => "fpsw", bit => 13 },
209         FP_C3 => { reg => "fpsw", bit => 14 },
210         FP_B  => { reg => "fpsw", bit => 15 },
211
212         FP_IM => { reg => "fpcw", bit => 0 },
213         FP_DM => { reg => "fpcw", bit => 1 },
214         FP_ZM => { reg => "fpcw", bit => 2 },
215         FP_OM => { reg => "fpcw", bit => 3 },
216         FP_UM => { reg => "fpcw", bit => 4 },
217         FP_PM => { reg => "fpcw", bit => 5 },
218         FP_PC0 => { reg => "fpcw", bit => 8 },
219         FP_PC1 => { reg => "fpcw", bit => 9 },
220         FP_RC0 => { reg => "fpcw", bit => 10 },
221         FP_RC1 => { reg => "fpcw", bit => 11 },
222         FP_X  => { reg => "fpcw", bit => 12 }
223 ); # %flags
224
225 %cpu = (
226         GP     => [ 1, "GP_EAX", "GP_EBX", "GP_ECX", "GP_EDX", "GP_ESI", "GP_EDI", "GP_EBP" ],
227         SSE    => [ 1, "SSE_XMM0", "SSE_XMM1", "SSE_XMM2", "SSE_XMM3", "SSE_XMM4", "SSE_XMM5", "SSE_XMM6", "SSE_XMM7" ],
228         VFP    => [ 1, "VFP_VF0", "VFP_VF1", "VFP_VF2", "VFP_VF3", "VFP_VF4", "VFP_VF5", "VFP_VF6", "VFP_VF7" ],
229         BRANCH => [ 1, "BRANCH1", "BRANCH2" ],
230 ); # %cpu
231
232 %vliw = (
233         bundle_size       => 1,
234         bundels_per_cycle => 1
235 ); # vliw
236
237 %emit_templates = (
238         S0 => "${arch}_emit_source_register(env, node, 0);",
239         S1 => "${arch}_emit_source_register(env, node, 1);",
240         S2 => "${arch}_emit_source_register(env, node, 2);",
241         S3 => "${arch}_emit_source_register(env, node, 3);",
242         S4 => "${arch}_emit_source_register(env, node, 4);",
243         S5 => "${arch}_emit_source_register(env, node, 5);",
244         D0 => "${arch}_emit_dest_register(env, node, 0);",
245         D1 => "${arch}_emit_dest_register(env, node, 1);",
246         D2 => "${arch}_emit_dest_register(env, node, 2);",
247         D3 => "${arch}_emit_dest_register(env, node, 3);",
248         D4 => "${arch}_emit_dest_register(env, node, 4);",
249         D5 => "${arch}_emit_dest_register(env, node, 5);",
250         X0 => "${arch}_emit_x87_name(env, node, 0);",
251         X1 => "${arch}_emit_x87_name(env, node, 1);",
252         X2 => "${arch}_emit_x87_name(env, node, 2);",
253         C  => "${arch}_emit_immediate(env, node);",
254         SE => "${arch}_emit_extend_suffix(env, get_ia32_ls_mode(node));",
255         ME => "if(get_mode_size_bits(get_ia32_ls_mode(node)) != 32)\n
256                    ia32_emit_mode_suffix(env, node);",
257         M  => "${arch}_emit_mode_suffix(env, node);",
258         XM => "${arch}_emit_x87_mode_suffix(env, node);",
259         XXM => "${arch}_emit_xmm_mode_suffix(env, node);",
260         XSD => "${arch}_emit_xmm_mode_suffix_s(env, node);",
261         AM => "${arch}_emit_am(env, node);",
262         unop => "${arch}_emit_unop(env, node);",
263         binop => "${arch}_emit_binop(env, node);",
264         x87_binop => "${arch}_emit_x87_binop(env, node);",
265 );
266
267 #--------------------------------------------------#
268 #                        _                         #
269 #                       (_)                        #
270 #  _ __   _____      __  _ _ __    ___  _ __  ___  #
271 # | '_ \ / _ \ \ /\ / / | | '__|  / _ \| '_ \/ __| #
272 # | | | |  __/\ V  V /  | | |    | (_) | |_) \__ \ #
273 # |_| |_|\___| \_/\_/   |_|_|     \___/| .__/|___/ #
274 #                                      | |         #
275 #                                      |_|         #
276 #--------------------------------------------------#
277
278 $default_cmp_attr  = "return ia32_compare_attr(attr_a, attr_b);";
279 $default_attr_type = "ia32_attr_t";
280
281 %operands = (
282 );
283
284 $mode_xmm     = "mode_E";
285 $mode_gp      = "mode_Iu";
286 $mode_fpcw    = "mode_fpcw";
287 $status_flags = [ "CF", "PF", "AF", "ZF", "SF", "OF" ];
288 $fpcw_flags   = [ "FP_IM", "FP_DM", "FP_ZM", "FP_OM", "FP_UM", "FP_PM",
289                   "FP_PC0", "FP_PC1", "FP_RC0", "FP_RC1", "FP_X" ];
290
291 %nodes = (
292
293 #Immediate => {
294 #       irn_flags => "i",
295 #       reg_req   => { out => [ "NoReg_GP" ] },
296 #       mode      => $mode_gp,
297 #       attr_type => "ia32_imm_t",
298 #},
299
300 #-----------------------------------------------------------------#
301 #  _       _                                         _            #
302 # (_)     | |                                       | |           #
303 #  _ _ __ | |_ ___  __ _  ___ _ __   _ __   ___   __| | ___  ___  #
304 # | | '_ \| __/ _ \/ _` |/ _ \ '__| | '_ \ / _ \ / _` |/ _ \/ __| #
305 # | | | | | ||  __/ (_| |  __/ |    | | | | (_) | (_| |  __/\__ \ #
306 # |_|_| |_|\__\___|\__, |\___|_|    |_| |_|\___/ \__,_|\___||___/ #
307 #                   __/ |                                         #
308 #                  |___/                                          #
309 #-----------------------------------------------------------------#
310
311 # commutative operations
312
313 # NOTE:
314 # All nodes supporting Addressmode have 5 INs:
315 # 1 - base    r1 == NoReg in case of no AM or no base
316 # 2 - index   r2 == NoReg in case of no AM or no index
317 # 3 - op1     r3 == always present
318 # 4 - op2     r4 == NoReg in case of immediate operation
319 # 5 - mem     NoMem in case of no AM otherwise it takes the mem from the Load
320
321 Add => {
322         irn_flags => "R",
323         comment   => "construct Add: Add(a, b) = Add(b, a) = a + b",
324         reg_req   => { in => [ "gp", "gp", "gp", "gp", "none" ], out => [ "in_r3" ] },
325         ins       => [ "base", "index", "left", "right", "mem" ],
326         emit      => '. add%M %binop',
327         units     => [ "GP" ],
328         mode      => $mode_gp,
329         modified_flags => $status_flags
330 },
331
332 Adc => {
333         comment   => "construct Add with Carry: Adc(a, b) = Add(b, a) = a + b + carry",
334         reg_req   => { in => [ "gp", "gp", "gp", "gp", "none" ], out => [ "in_r3" ] },
335         emit      => '. adc%M %binop',
336         units     => [ "GP" ],
337         mode      => $mode_gp,
338         modified_flags => $status_flags
339 },
340
341 Add64Bit => {
342         irn_flags => "R",
343         comment   => "construct 64Bit Add: Add(a_l, a_h, b_l, b_h) = a_l + b_l; a_h + b_h + carry",
344         arity     => 4,
345         reg_req   => { in => [ "gp", "gp", "gp", "gp" ], out => [ "!in", "!in" ] },
346         emit      => '
347 . movl %S0, %D0
348 . movl %S1, %D1
349 . addl %S2, %D0
350 . adcl %S3, %D1
351 ',
352         outs      => [ "low_res", "high_res" ],
353         units     => [ "GP" ],
354         modified_flags => $status_flags
355 },
356
357 l_Add => {
358         op_flags  => "C",
359         irn_flags => "R",
360         cmp_attr  => "return 1;",
361         comment   => "construct lowered Add: Add(a, b) = Add(b, a) = a + b",
362         arity     => 2,
363 },
364
365 l_Adc => {
366         op_flags  => "C",
367         cmp_attr  => "return 1;",
368         comment   => "construct lowered Add with Carry: Adc(a, b) = Adc(b, a) = a + b + carry",
369         arity     => 2,
370 },
371
372 Mul => {
373         # we should not rematrialize this node. It produces 2 results and has
374         # very strict constrains
375         comment   => "construct MulS: MulS(a, b) = MulS(b, a) = a * b",
376         reg_req   => { in => [ "gp", "gp", "eax", "gp", "none" ], out => [ "eax", "edx", "none" ] },
377         emit      => '. mul%M %unop',
378         outs      => [ "EAX", "EDX", "M" ],
379         latency   => 10,
380         units     => [ "GP" ],
381         modified_flags => $status_flags
382 },
383
384 l_Mul => {
385         # we should not rematrialize this node. It produces 2 results and has
386         # very strict constrains
387         op_flags  => "C",
388         cmp_attr  => "return 1;",
389         comment   => "construct lowered MulS: Mul(a, b) = Mul(b, a) = a * b",
390         outs      => [ "EAX", "EDX", "M" ],
391         arity     => 2
392 },
393
394 IMul => {
395         irn_flags => "R",
396         comment   => "construct Mul: Mul(a, b) = Mul(b, a) = a * b",
397         reg_req   => { in => [ "gp", "gp", "gp", "gp", "none" ], out => [ "in_r3" ] },
398         emit      => '. imul%M %binop',
399         latency   => 5,
400         units     => [ "GP" ],
401         mode      => $mode_gp,
402         modified_flags => $status_flags
403 },
404
405 IMul1OP => {
406         irn_flags => "R",
407         comment   => "construct Mul (1 operand format): Mul(a, b) = Mul(b, a) = a * b",
408         reg_req   => { in => [ "gp", "gp", "eax", "gp", "none" ], out => [ "eax", "edx", "none" ] },
409         emit      => '. imul%M %unop',
410         outs      => [ "EAX", "EDX", "M" ],
411         latency   => 5,
412         units     => [ "GP" ],
413         modified_flags => $status_flags
414 },
415
416 l_IMul => {
417         op_flags  => "C",
418         cmp_attr  => "return 1;",
419         comment   => "construct lowered IMul: IMul(a, b) = IMul(b, a) = a * b",
420         arity     => 2
421 },
422
423 And => {
424         irn_flags => "R",
425         comment   => "construct And: And(a, b) = And(b, a) = a AND b",
426         reg_req   => { in => [ "gp", "gp", "gp", "gp", "none" ], out => [ "in_r3" ] },
427         emit      => '. and%M %binop',
428         units     => [ "GP" ],
429         mode      => $mode_gp,
430         modified_flags => $status_flags
431 },
432
433 Or => {
434         irn_flags => "R",
435         comment   => "construct Or: Or(a, b) = Or(b, a) = a OR b",
436         reg_req   => { in => [ "gp", "gp", "gp", "gp", "none" ], out => [ "in_r3" ] },
437         emit      => '. or%M %binop',
438         units     => [ "GP" ],
439         mode      => $mode_gp,
440         modified_flags => $status_flags
441 },
442
443 Xor => {
444         irn_flags => "R",
445         comment   => "construct Xor: Xor(a, b) = Xor(b, a) = a EOR b",
446         reg_req   => { in => [ "gp", "gp", "gp", "gp", "none" ], out => [ "in_r3" ] },
447         emit      => '. xor%M %binop',
448         units     => [ "GP" ],
449         mode      => $mode_gp,
450         modified_flags => $status_flags
451 },
452
453 l_Xor => {
454         op_flags  => "C",
455         cmp_attr  => "return 1;",
456         comment   => "construct lowered Xor: Xor(a, b) = Xor(b, a) = a XOR b",
457         arity     => 2,
458         modified_flags => $status_flags
459 },
460
461 # not commutative operations
462
463 Sub => {
464         irn_flags => "R",
465         comment   => "construct Sub: Sub(a, b) = a - b",
466         reg_req   => { in => [ "gp", "gp", "gp", "gp", "none" ], out => [ "in_r3" ] },
467         emit      => '. sub%M %binop',
468         units     => [ "GP" ],
469         mode      => $mode_gp,
470         modified_flags => $status_flags
471 },
472
473 Sbb => {
474         comment   => "construct Sub with Carry: SubC(a, b) = a - b - carry",
475         reg_req   => { in => [ "gp", "gp", "gp", "gp", "none" ], out => [ "in_r3 !in_r4" ] },
476         emit      => '. sbb%M %binop',
477         units     => [ "GP" ],
478         mode      => $mode_gp,
479         modified_flags => $status_flags
480 },
481
482 Sub64Bit => {
483         irn_flags => "R",
484         comment   => "construct 64Bit Sub: Sub(a_l, a_h, b_l, b_h) = a_l - b_l; a_h - b_h - borrow",
485         arity     => 4,
486         reg_req   => { in => [ "gp", "gp", "gp", "gp" ], out => [ "!in", "!in" ] },
487         emit      => '
488 . movl %S0, %D0
489 . movl %S1, %D1
490 . subl %S2, %D0
491 . sbbl %S3, %D1
492 ',
493         outs      => [ "low_res", "high_res" ],
494         units     => [ "GP" ],
495         modified_flags => $status_flags
496 },
497
498 l_Sub => {
499         irn_flags => "R",
500         cmp_attr  => "return 1;",
501         comment   => "construct lowered Sub: Sub(a, b) = a - b",
502         arity     => 2,
503 },
504
505 l_Sbb => {
506         cmp_attr  => "return 1;",
507         comment   => "construct lowered Sub with Carry: SubC(a, b) = a - b - carry",
508         arity     => 2,
509 },
510
511 IDiv => {
512         op_flags  => "F|L",
513         state     => "exc_pinned",
514         reg_req   => { in => [ "gp", "gp", "eax", "edx", "gp", "none" ], out => [ "eax", "edx", "none" ] },
515         attr      => "ia32_op_flavour_t dm_flav",
516         init_attr => "attr->data.op_flav = dm_flav;",
517         emit      => ". idiv%M %unop",
518         outs      => [ "div_res", "mod_res", "M" ],
519         latency   => 25,
520         units     => [ "GP" ],
521         modified_flags => $status_flags
522 },
523
524 Div => {
525         op_flags  => "F|L",
526         state     => "exc_pinned",
527         reg_req   => { in => [ "gp", "gp", "eax", "edx", "gp", "none" ], out => [ "eax", "edx", "none" ] },
528         attr      => "ia32_op_flavour_t dm_flav",
529         init_attr => "attr->data.op_flav = dm_flav;",
530         emit      => ". div%M %unop",
531         outs      => [ "div_res", "mod_res", "M" ],
532         latency   => 25,
533         units     => [ "GP" ],
534         modified_flags => $status_flags
535 },
536
537 Shl => {
538         irn_flags => "R",
539         comment   => "construct Shl: Shl(a, b) = a << b",
540         reg_req   => { in => [ "gp", "gp", "gp", "ecx", "none" ], out => [ "in_r3 !in_r4" ] },
541         ins       => [ "base", "index", "left", "right", "mem" ],
542         emit      => '. shl%M %binop',
543         units     => [ "GP" ],
544         mode      => $mode_gp,
545         modified_flags => $status_flags
546 },
547
548 l_Shl => {
549         cmp_attr  => "return 1;",
550         comment   => "construct lowered Shl: Shl(a, b) = a << b",
551         arity     => 2
552 },
553
554 ShlD => {
555         irn_flags => "R",
556         comment   => "construct ShlD: ShlD(a, b, c) = a, b << count (shift left count bits from b into a)",
557         # Out requirements is: different from all in
558         # This is because, out must be different from LowPart and ShiftCount.
559         # We could say "!ecx !in_r4" but it can occur, that all values live through
560         # this Shift and the only value dying is the ShiftCount. Then there would be a
561         # register missing, as result must not be ecx and all other registers are
562         # occupied. What we should write is "!in_r4 !in_r5", but this is not supported
563         # (and probably never will). So we create artificial interferences of the result
564         # with all inputs, so the spiller can always assure a free register.
565         reg_req   => { in => [ "gp", "gp", "gp", "gp", "ecx", "none" ], out => [ "!in" ] },
566         emit      =>
567 '
568 if (get_ia32_immop_type(node) == ia32_ImmNone) {
569         if (get_ia32_op_type(node) == ia32_AddrModeD) {
570                 . shld%M %%cl, %S3, %AM
571         } else {
572                 . shld%M %%cl, %S3, %S2
573         }
574 } else {
575         if (get_ia32_op_type(node) == ia32_AddrModeD) {
576                 . shld%M %C, %S3, %AM
577         } else {
578                 . shld%M %C, %S3, %S2
579         }
580 }
581 ',
582         latency   => 6,
583         units     => [ "GP" ],
584         mode      => $mode_gp,
585         modified_flags => $status_flags
586 },
587
588 l_ShlD => {
589         cmp_attr  => "return 1;",
590         comment   => "construct lowered ShlD: ShlD(a, b, c) = a, b << count (shift left count bits from b into a)",
591         arity     => 3,
592 },
593
594 Shr => {
595         irn_flags => "R",
596         comment   => "construct Shr: Shr(a, b) = a >> b",
597         reg_req   => { in => [ "gp", "gp", "gp", "ecx", "none" ], out => [ "in_r3 !in_r4" ] },
598         emit      => '. shr%M %binop',
599         units     => [ "GP" ],
600         mode      => $mode_gp,
601         modified_flags => $status_flags
602 },
603
604 l_Shr => {
605         cmp_attr  => "return 1;",
606         comment   => "construct lowered Shr: Shr(a, b) = a << b",
607         arity     => 2
608 },
609
610 ShrD => {
611         irn_flags => "R",
612         comment   => "construct ShrD: ShrD(a, b, c) = a, b >> count (shift rigth count bits from a into b)",
613         # Out requirements is: different from all in
614         # This is because, out must be different from LowPart and ShiftCount.
615         # We could say "!ecx !in_r4" but it can occur, that all values live through
616         # this Shift and the only value dying is the ShiftCount. Then there would be a
617         # register missing, as result must not be ecx and all other registers are
618         # occupied. What we should write is "!in_r4 !in_r5", but this is not supported
619         # (and probably never will). So we create artificial interferences of the result
620         # with all inputs, so the spiller can always assure a free register.
621         reg_req   => { in => [ "gp", "gp", "gp", "gp", "ecx", "none" ], out => [ "!in" ] },
622         emit      => '
623 if (get_ia32_immop_type(node) == ia32_ImmNone) {
624         if (get_ia32_op_type(node) == ia32_AddrModeD) {
625                 . shrd%M %%cl, %S3, %AM
626         } else {
627                 . shrd%M %%cl, %S3, %S2
628         }
629 } else {
630         if (get_ia32_op_type(node) == ia32_AddrModeD) {
631                 . shrd%M %C, %S3, %AM
632         } else {
633                 . shrd%M %C, %S3, %S2
634         }
635 }
636 ',
637         latency   => 6,
638         units     => [ "GP" ],
639         mode      => $mode_gp,
640         modified_flags => $status_flags
641 },
642
643 l_ShrD => {
644         cmp_attr  => "return 1;",
645         comment   => "construct lowered ShrD: ShrD(a, b, c) = a, b >> count (shift rigth count bits from a into b)",
646         arity     => 3
647 },
648
649 Sar => {
650         irn_flags => "R",
651         comment   => "construct Shrs: Shrs(a, b) = a >> b",
652         reg_req   => { in => [ "gp", "gp", "gp", "ecx", "none" ], out => [ "in_r3 !in_r4" ] },
653         emit      => '. sar%M %binop',
654         units     => [ "GP" ],
655         mode      => $mode_gp,
656         modified_flags => $status_flags
657 },
658
659 l_Sar => {
660         cmp_attr  => "return 1;",
661         comment   => "construct lowered Sar: Sar(a, b) = a << b",
662         arity     => 2
663 },
664
665 Ror => {
666         irn_flags => "R",
667         comment   => "construct Ror: Ror(a, b) = a ROR b",
668         reg_req   => { in => [ "gp", "gp", "gp", "ecx", "none" ], out => [ "in_r3 !in_r4" ] },
669         emit      => '. ror%M %binop',
670         units     => [ "GP" ],
671         mode      => $mode_gp,
672         modified_flags => $status_flags
673 },
674
675 Rol => {
676         irn_flags => "R",
677         comment   => "construct Rol: Rol(a, b) = a ROL b",
678         reg_req   => { in => [ "gp", "gp", "gp", "ecx", "none" ], out => [ "in_r3 !in_r4" ] },
679         emit      => '. rol%M %binop',
680         units     => [ "GP" ],
681         mode      => $mode_gp,
682         modified_flags => $status_flags
683 },
684
685 # unary operations
686
687 Neg => {
688         irn_flags => "R",
689         comment   => "construct Minus: Minus(a) = -a",
690         reg_req   => { in => [ "gp", "gp", "gp", "none" ], out => [ "in_r3" ] },
691         emit      => '. neg%M %unop',
692         units     => [ "GP" ],
693         mode      => $mode_gp,
694         modified_flags => $status_flags
695 },
696
697 Minus64Bit => {
698         irn_flags => "R",
699         comment   => "construct 64Bit Minus: Minus(a_l, a_h, 0) = 0 - a_l; 0 - a_h - borrow",
700         arity     => 4,
701         reg_req   => { in => [ "gp", "gp", "gp" ], out => [ "!in", "!in" ] },
702         emit      => '
703 . movl %S0, %D0
704 . movl %S0, %D1
705 . subl %S1, %D0
706 . sbbl %S2, %D1
707 ',
708         outs      => [ "low_res", "high_res" ],
709         units     => [ "GP" ],
710         modified_flags => $status_flags
711 },
712
713
714 l_Neg => {
715         cmp_attr  => "return 1;",
716         comment   => "construct lowered Minus: Minus(a) = -a",
717         arity     => 1,
718 },
719
720 Inc => {
721         irn_flags => "R",
722         comment   => "construct Increment: Inc(a) = a++",
723         reg_req   => { in => [ "gp", "gp", "gp", "none" ], out => [ "in_r3" ] },
724         emit      => '. inc%M %unop',
725         units     => [ "GP" ],
726         mode      => $mode_gp,
727         modified_flags => [ "OF", "SF", "ZF", "AF", "PF" ]
728 },
729
730 Dec => {
731         irn_flags => "R",
732         comment   => "construct Decrement: Dec(a) = a--",
733         reg_req   => { in => [ "gp", "gp", "gp", "none" ], out => [ "in_r3" ] },
734         emit      => '. dec%M %unop',
735         units     => [ "GP" ],
736         mode      => $mode_gp,
737         modified_flags => [ "OF", "SF", "ZF", "AF", "PF" ]
738 },
739
740 Not => {
741         irn_flags => "R",
742         comment   => "construct Not: Not(a) = !a",
743         reg_req   => { in => [ "gp", "gp", "gp", "none" ], out => [ "in_r3" ] },
744         emit      => '. not%M %unop',
745         units     => [ "GP" ],
746         mode      => $mode_gp,
747         modified_flags => []
748 },
749
750 # other operations
751
752 CondJmp => {
753         state     => "pinned",
754         op_flags  => "L|X|Y",
755         comment   => "construct conditional jump: CMP A, B && JMPxx LABEL",
756         reg_req   => { in => [ "gp", "gp", "gp", "gp", "none" ] },
757         outs      => [ "false", "true" ],
758         latency   => 3,
759         units     => [ "BRANCH" ],
760 },
761
762 TestJmp => {
763         state     => "pinned",
764         op_flags  => "L|X|Y",
765         comment   => "construct conditional jump: TEST A, B && JMPxx LABEL",
766         reg_req  => { in => [ "gp", "gp" ] },
767         outs      => [ "false", "true" ],
768         latency   => 3,
769         units     => [ "BRANCH" ],
770 },
771
772 CJmpAM => {
773         state     => "pinned",
774         op_flags  => "L|X|Y",
775         comment   => "construct conditional jump without CMP (replaces CondJmp): JMPxx LABEL",
776         reg_req   => { in => [ "gp", "gp", "gp", "gp", "none" ], out => [ "none", "none" ] },
777         outs      => [ "false", "true" ],
778         units     => [ "BRANCH" ],
779 },
780
781 CJmp => {
782         state     => "pinned",
783         op_flags  => "L|X|Y",
784         comment   => "construct conditional jump without CMP (replaces TestJmp): JMPxx LABEL",
785         reg_req   => { in => [ "gp", "gp" ] },
786         units     => [ "BRANCH" ],
787 },
788
789 SwitchJmp => {
790         state     => "pinned",
791         op_flags  => "L|X|Y",
792         comment   => "construct switch",
793         reg_req   => { in => [ "gp" ], out => [ "none" ] },
794         latency   => 3,
795         units     => [ "BRANCH" ],
796 },
797
798 Const => {
799         op_flags  => "c",
800         irn_flags => "R",
801         comment   => "represents an integer constant",
802         reg_req   => { out => [ "gp" ] },
803         units     => [ "GP" ],
804         mode      => $mode_gp,
805 },
806
807 Unknown_GP => {
808         state     => "pinned",
809         op_flags  => "c",
810         irn_flags => "I",
811         comment   => "unknown value",
812         reg_req   => { out => [ "gp_UKNWN" ] },
813         units     => [],
814         emit      => "",
815         mode      => $mode_gp
816 },
817
818 Unknown_VFP => {
819         state     => "pinned",
820         op_flags  => "c",
821         irn_flags => "I",
822         comment   => "unknown value",
823         reg_req   => { out => [ "vfp_UKNWN" ] },
824         units     => [],
825         emit      => "",
826         mode      => "mode_E"
827 },
828
829 Unknown_XMM => {
830         state     => "pinned",
831         op_flags  => "c",
832         irn_flags => "I",
833         comment   => "unknown value",
834         reg_req   => { out => [ "xmm_UKNWN" ] },
835         units     => [],
836         emit      => "",
837         mode      => "mode_E"
838 },
839
840 NoReg_GP => {
841         state     => "pinned",
842         op_flags  => "c",
843         irn_flags => "I",
844         comment   => "noreg GP value",
845         reg_req   => { out => [ "gp_NOREG" ] },
846         units     => [],
847         emit      => "",
848         mode      => $mode_gp
849 },
850
851 NoReg_VFP => {
852         state     => "pinned",
853         op_flags  => "c",
854         irn_flags => "I",
855         comment   => "noreg VFP value",
856         reg_req   => { out => [ "vfp_NOREG" ] },
857         units     => [],
858         emit      => "",
859         mode      => "mode_E"
860 },
861
862 NoReg_XMM => {
863         state     => "pinned",
864         op_flags  => "c",
865         irn_flags => "I",
866         comment   => "noreg XMM value",
867         reg_req   => { out => [ "xmm_NOREG" ] },
868         units     => [],
869         emit      => "",
870         mode      => "mode_E"
871 },
872
873 ChangeCW => {
874         state     => "pinned",
875         op_flags  => "c",
876         irn_flags => "I",
877         comment   => "change floating point control word",
878         reg_req   => { out => [ "fp_cw" ] },
879         mode      => $mode_fpcw,
880         latency   => 3,
881         units     => [ "GP" ],
882         modified_flags => $fpcw_flags
883 },
884
885 FldCW => {
886         op_flags  => "L|F",
887         state     => "exc_pinned",
888         comment   => "load floating point control word FldCW(ptr, mem) = LD ptr -> reg",
889         reg_req   => { in => [ "gp", "gp", "none" ], out => [ "fp_cw" ] },
890         latency   => 5,
891         emit      => ". fldcw %AM",
892         mode      => $mode_fpcw,
893         units     => [ "GP" ],
894         modified_flags => $fpcw_flags
895 },
896
897 FnstCW => {
898         op_flags  => "L|F",
899         state     => "exc_pinned",
900         comment   => "store floating point control word: FstCW(ptr, mem) = ST ptr -> reg",
901         reg_req   => { in => [ "gp", "gp", "fp_cw", "none" ], out => [ "none" ] },
902         latency   => 5,
903         emit      => ". fnstcw %AM",
904         mode      => "mode_M",
905         units     => [ "GP" ],
906 },
907
908 Cltd => {
909         # we should not rematrialize this node. It produces 2 results and has
910         # very strict constrains
911         comment   => "construct CDQ: sign extend EAX -> EDX:EAX",
912         reg_req   => { in => [ "gp" ], out => [ "eax in_r1", "edx" ] },
913         emit      => '. cltd',
914         outs      => [ "EAX", "EDX" ],
915         units     => [ "GP" ],
916 },
917
918 # Load / Store
919
920 Load => {
921         op_flags  => "L|F",
922         state     => "exc_pinned",
923         comment   => "construct Load: Load(ptr, mem) = LD ptr -> reg",
924         reg_req   => { in => [ "gp", "gp", "none" ], out => [ "gp", "none" ] },
925         latency   => 3,
926         emit      => ". mov%SE%ME%.l %AM, %D0",
927         outs      => [ "res", "M" ],
928         units     => [ "GP" ],
929 },
930
931 l_Load => {
932         op_flags  => "L|F",
933         cmp_attr  => "return 1;",
934         comment   => "construct lowered Load: Load(ptr, mem) = LD ptr -> reg",
935         outs      => [ "res", "M" ],
936         arity     => 2,
937 },
938
939 l_Store => {
940         op_flags  => "L|F",
941         cmp_attr  => "return 1;",
942         state     => "exc_pinned",
943         comment   => "construct lowered Store: Store(ptr, val, mem) = ST ptr,val",
944         arity     => 3,
945         mode      => "mode_M",
946 },
947
948 Store => {
949         op_flags  => "L|F",
950         state     => "exc_pinned",
951         comment   => "construct Store: Store(ptr, val, mem) = ST ptr,val",
952         reg_req   => { in => [ "gp", "gp", "gp", "none" ], out => [ "none" ] },
953         emit      => '. mov%M %binop',
954         latency   => 3,
955         units     => [ "GP" ],
956         mode      => "mode_M",
957 },
958
959 Store8Bit => {
960         op_flags  => "L|F",
961         state     => "exc_pinned",
962         comment   => "construct 8Bit Store: Store(ptr, val, mem) = ST ptr,val",
963         reg_req   => { in => [ "gp", "gp", "eax ebx ecx edx", "none" ], out => ["none" ] },
964         emit      => '. mov%M %binop',
965         latency   => 3,
966         units     => [ "GP" ],
967         mode      => "mode_M",
968 },
969
970 Lea => {
971         irn_flags => "R",
972         comment   => "construct Lea: Lea(a,b) = lea [a+b*const+offs] | res = a + b * const + offs with const = 0,1,2,4,8",
973         reg_req   => { in => [ "gp", "gp" ], out => [ "in_r1" ] },
974         emit      => '. leal %AM, %D0',
975         latency   => 2,
976         units     => [ "GP" ],
977         mode      => $mode_gp,
978         modified_flags => [],
979 },
980
981 Push => {
982         comment   => "push on the stack",
983         reg_req   => { in => [ "gp", "gp", "gp", "esp", "none" ], out => [ "esp", "none" ] },
984         emit      => '. push%M %unop',
985         outs      => [ "stack:I|S", "M" ],
986         latency   => 3,
987         units     => [ "GP" ],
988         modified_flags => [],
989 },
990
991 Pop => {
992         comment   => "pop a gp register from the stack",
993         reg_req   => { in => [ "gp", "gp", "esp", "none" ], out => [ "esp", "gp", "none" ] },
994         emit      => '. pop%M %unop',
995         outs      => [ "stack:I|S", "res", "M" ],
996         latency   => 4,
997         units     => [ "GP" ],
998         modified_flags => [],
999 },
1000
1001 Enter => {
1002         comment   => "create stack frame",
1003         reg_req   => { in => [ "esp" ], out => [ "ebp", "esp" ] },
1004         emit      => '. enter',
1005         outs      => [ "frame:I", "stack:I|S", "M" ],
1006         latency   => 15,
1007         units     => [ "GP" ],
1008 },
1009
1010 Leave => {
1011         comment   => "destroy stack frame",
1012         reg_req   => { in => [ "esp", "ebp" ], out => [ "ebp", "esp" ] },
1013         emit      => '. leave',
1014         outs      => [ "frame:I", "stack:I|S" ],
1015         latency   => 3,
1016         units     => [ "GP" ],
1017 },
1018
1019 AddSP => {
1020         irn_flags => "I",
1021         comment   => "allocate space on stack",
1022         reg_req   => { in => [ "gp", "gp", "esp", "gp", "none" ], out => [ "in_r3", "none" ] },
1023         emit      => '. addl %binop',
1024         outs      => [ "stack:S", "M" ],
1025         units     => [ "GP" ],
1026         modified_flags => $status_flags
1027 },
1028
1029 SubSP => {
1030         irn_flags => "I",
1031         comment   => "free space on stack",
1032         reg_req   => { in => [ "gp", "gp", "esp", "gp", "none" ], out => [ "in_r3", "none" ] },
1033         emit      => '. subl %binop',
1034         outs      => [ "stack:S", "M" ],
1035         units     => [ "GP" ],
1036         modified_flags => $status_flags
1037 },
1038
1039 LdTls => {
1040         irn_flags => "R",
1041         comment   => "get the TLS base address",
1042         reg_req   => { out => [ "gp" ] },
1043         units     => [ "GP" ],
1044 },
1045
1046 # the int instruction
1047 int => {
1048         reg_req   => { in => [ "none" ], out => [ "none" ] },
1049         comment   => "software interrupt",
1050         mode      => "mode_M",
1051         attr      => "tarval *tv",
1052         init_attr => "\tset_ia32_Immop_tarval(res, tv);",
1053         emit      => '. int %C',
1054         units     => [ "GP" ],
1055         cmp_attr  => "return 1;",
1056 },
1057
1058
1059 #-----------------------------------------------------------------------------#
1060 #   _____ _____ ______    __ _             _                     _            #
1061 #  / ____/ ____|  ____|  / _| |           | |                   | |           #
1062 # | (___| (___ | |__    | |_| | ___   __ _| |_   _ __   ___   __| | ___  ___  #
1063 #  \___ \\___ \|  __|   |  _| |/ _ \ / _` | __| | '_ \ / _ \ / _` |/ _ \/ __| #
1064 #  ____) |___) | |____  | | | | (_) | (_| | |_  | | | | (_) | (_| |  __/\__ \ #
1065 # |_____/_____/|______| |_| |_|\___/ \__,_|\__| |_| |_|\___/ \__,_|\___||___/ #
1066 #-----------------------------------------------------------------------------#
1067
1068 # commutative operations
1069
1070 xAdd => {
1071         irn_flags => "R",
1072         comment   => "construct SSE Add: Add(a, b) = Add(b, a) = a + b",
1073         reg_req   => { in => [ "gp", "gp", "xmm", "xmm", "none" ], out => [ "in_r3" ] },
1074         emit      => '. add%XXM %binop',
1075         latency   => 4,
1076         units     => [ "SSE" ],
1077         mode      => "mode_E",
1078 },
1079
1080 xMul => {
1081         irn_flags => "R",
1082         comment   => "construct SSE Mul: Mul(a, b) = Mul(b, a) = a * b",
1083         reg_req   => { in => [ "gp", "gp", "xmm", "xmm", "none" ], out => [ "in_r3" ] },
1084         emit      => '. mul%XXM %binop',
1085         latency   => 4,
1086         units     => [ "SSE" ],
1087         mode      => "mode_E",
1088 },
1089
1090 xMax => {
1091         irn_flags => "R",
1092         comment   => "construct SSE Max: Max(a, b) = Max(b, a) = a > b ? a : b",
1093         reg_req   => { in => [ "gp", "gp", "xmm", "xmm", "none" ], out => [ "in_r3" ] },
1094         emit      => '. max%XXM %binop',
1095         latency   => 2,
1096         units     => [ "SSE" ],
1097         mode      => "mode_E",
1098 },
1099
1100 xMin => {
1101         irn_flags => "R",
1102         comment   => "construct SSE Min: Min(a, b) = Min(b, a) = a < b ? a : b",
1103         reg_req   => { in => [ "gp", "gp", "xmm", "xmm", "none" ], out => [ "in_r3" ] },
1104         emit      => '. min%XXM %binop',
1105         latency   => 2,
1106         units     => [ "SSE" ],
1107         mode      => "mode_E",
1108 },
1109
1110 xAnd => {
1111         irn_flags => "R",
1112         comment   => "construct SSE And: And(a, b) = a AND b",
1113         reg_req   => { in => [ "gp", "gp", "xmm", "xmm", "none" ], out => [ "in_r3" ] },
1114         emit      => '. andp%XSD %binop',
1115         latency   => 3,
1116         units     => [ "SSE" ],
1117         mode      => "mode_E",
1118 },
1119
1120 xOr => {
1121         irn_flags => "R",
1122         comment   => "construct SSE Or: Or(a, b) = a OR b",
1123         reg_req   => { in => [ "gp", "gp", "xmm", "xmm", "none" ], out => [ "in_r3" ] },
1124         emit      => '. orp%XSD %binop',
1125         units     => [ "SSE" ],
1126         mode      => "mode_E",
1127 },
1128
1129 xXor => {
1130         irn_flags => "R",
1131         comment   => "construct SSE Xor: Xor(a, b) = a XOR b",
1132         reg_req   => { in => [ "gp", "gp", "xmm", "xmm", "none" ], out => [ "in_r3" ] },
1133         emit      => '. xorp%XSD %binop',
1134         latency   => 3,
1135         units     => [ "SSE" ],
1136         mode      => "mode_E",
1137 },
1138
1139 # not commutative operations
1140
1141 xAndNot => {
1142         irn_flags => "R",
1143         comment   => "construct SSE AndNot: AndNot(a, b) = a AND NOT b",
1144         reg_req   => { in => [ "gp", "gp", "xmm", "xmm", "none" ], out => [ "in_r3 !in_r4" ] },
1145         emit      => '. andnp%XSD %binop',
1146         latency   => 3,
1147         units     => [ "SSE" ],
1148         mode      => "mode_E",
1149 },
1150
1151 xSub => {
1152         irn_flags => "R",
1153         comment   => "construct SSE Sub: Sub(a, b) = a - b",
1154         reg_req   => { in => [ "gp", "gp", "xmm", "xmm", "none" ], out => [ "in_r3" ] },
1155         emit      => '. sub%XXM %binop',
1156         latency   => 4,
1157         units     => [ "SSE" ],
1158         mode      => "mode_E",
1159 },
1160
1161 xDiv => {
1162         irn_flags => "R",
1163         comment   => "construct SSE Div: Div(a, b) = a / b",
1164         reg_req   => { in => [ "gp", "gp", "xmm", "xmm", "none" ], out => [ "in_r3 !in_r4" ] },
1165         outs      => [ "res", "M" ],
1166         emit      => '. div%XXM %binop',
1167         latency   => 16,
1168         units     => [ "SSE" ],
1169 },
1170
1171 # other operations
1172
1173 xCmp => {
1174         irn_flags => "R",
1175         comment   => "construct SSE Compare: Cmp(a, b) == a = a cmp b",
1176         reg_req   => { in => [ "gp", "gp", "xmm", "xmm", "none" ], out => [ "in_r3 !in_r4" ] },
1177         latency   => 3,
1178         units     => [ "SSE" ],
1179         mode      => "mode_E",
1180 },
1181
1182 xCondJmp => {
1183         state     => "pinned",
1184         op_flags  => "L|X|Y",
1185         comment   => "construct conditional jump: UCOMIS A, B && JMPxx LABEL",
1186         reg_req   => { in => [ "gp", "gp", "xmm", "xmm", "none" ], out => [ "none", "none" ] },
1187         outs      => [ "false", "true" ],
1188         latency   => 5,
1189         units     => [ "SSE" ],
1190 },
1191
1192 xConst => {
1193         op_flags  => "c",
1194         irn_flags => "R",
1195         comment   => "represents a SSE constant",
1196         reg_req   => { out => [ "xmm" ] },
1197         emit      => '. mov%XXM %C, %D0',
1198         latency   => 2,
1199         units     => [ "SSE" ],
1200         mode      => "mode_E",
1201 },
1202
1203 # Load / Store
1204
1205 xLoad => {
1206         op_flags  => "L|F",
1207         state     => "exc_pinned",
1208         comment   => "construct SSE Load: Load(ptr, mem) = LD ptr",
1209         reg_req   => { in => [ "gp", "gp", "none" ], out => [ "xmm", "none" ] },
1210         emit      => '. mov%XXM %AM, %D0',
1211         outs      => [ "res", "M" ],
1212         latency   => 2,
1213         units     => [ "SSE" ],
1214 },
1215
1216 xStore => {
1217         op_flags => "L|F",
1218         state    => "exc_pinned",
1219         comment  => "construct Store: Store(ptr, val, mem) = ST ptr,val",
1220         reg_req  => { in => [ "gp", "gp", "xmm", "none" ] },
1221         emit     => '. mov%XXM %binop',
1222         latency  => 2,
1223         units    => [ "SSE" ],
1224         mode     => "mode_M",
1225 },
1226
1227 xStoreSimple => {
1228         op_flags => "L|F",
1229         state    => "exc_pinned",
1230         comment  => "construct Store without index: Store(ptr, val, mem) = ST ptr,val",
1231         reg_req  => { in => [ "gp", "gp", "xmm", "none" ] },
1232         ins      => [ "base", "index", "val", "mem" ],
1233         emit     => '. mov%XXM %S2, %AM',
1234         latency  => 2,
1235         units    => [ "SSE" ],
1236         mode     => "mode_M",
1237 },
1238
1239 CvtSI2SS => {
1240         op_flags => "L|F",
1241         reg_req  => { in => [ "gp", "gp", "gp", "none" ], out => [ "xmm" ] },
1242         emit     => '. cvtsi2ss %D0, %AM',
1243         latency  => 2,
1244         units    => [ "SSE" ],
1245         mode     => $mode_xmm
1246 },
1247
1248 CvtSI2SD => {
1249         op_flags => "L|F",
1250         reg_req  => { in => [ "gp", "gp", "gp", "none" ], out => [ "xmm" ] },
1251         emit     => '. cvtsi2sd %unop',
1252         latency  => 2,
1253         units    => [ "SSE" ],
1254         mode     => $mode_xmm
1255 },
1256
1257
1258 l_X87toSSE => {
1259         op_flags => "L|F",
1260         comment  => "construct: transfer a value from x87 FPU into a SSE register",
1261         cmp_attr => "return 1;",
1262         arity    => 3,
1263 },
1264
1265 l_SSEtoX87 => {
1266         op_flags => "L|F",
1267         comment  => "construct: transfer a value from SSE register to x87 FPU",
1268         cmp_attr => "return 1;",
1269         arity    => 3,
1270 },
1271
1272 GetST0 => {
1273         op_flags => "L|F",
1274         irn_flags => "I",
1275         state    => "exc_pinned",
1276         comment  => "store ST0 onto stack",
1277         reg_req  => { in => [ "gp", "gp", "none" ] },
1278         emit     => '. fstp%XM %AM',
1279         latency  => 4,
1280         units    => [ "SSE" ],
1281         mode     => "mode_M",
1282 },
1283
1284 SetST0 => {
1285         op_flags => "L|F",
1286         irn_flags => "I",
1287         state    => "exc_pinned",
1288         comment  => "load ST0 from stack",
1289         reg_req  => { in => [ "gp", "gp", "none" ], out => [ "vf0", "none" ] },
1290         ins      => [ "base", "index", "mem" ],
1291         emit     => '. fld%XM %AM',
1292         outs     => [ "res", "M" ],
1293         latency  => 2,
1294         units     => [ "SSE" ],
1295 },
1296
1297 # CopyB
1298
1299 CopyB => {
1300         op_flags => "F|H",
1301         state    => "pinned",
1302         comment  => "implements a memcopy: CopyB(dst, src, size, mem) == memcpy(dst, src, size)",
1303         reg_req  => { in => [ "edi", "esi", "ecx", "none" ], out => [ "edi", "esi", "ecx", "none" ] },
1304         outs     => [ "DST", "SRC", "CNT", "M" ],
1305         units    => [ "GP" ],
1306         modified_flags => [ "DF" ]
1307 },
1308
1309 CopyB_i => {
1310         op_flags => "F|H",
1311         state    => "pinned",
1312         comment  => "implements a memcopy: CopyB(dst, src, mem) == memcpy(dst, src, attr(size))",
1313         reg_req  => { in => [ "edi", "esi", "none" ], out => [  "edi", "esi", "none" ] },
1314         outs     => [ "DST", "SRC", "M" ],
1315         units    => [ "GP" ],
1316         modified_flags => [ "DF" ]
1317 },
1318
1319 # Conversions
1320
1321 Conv_I2I => {
1322         reg_req  => { in => [ "gp", "gp", "gp", "none" ], out => [ "in_r3", "none" ] },
1323         comment  => "construct Conv Int -> Int",
1324         units    => [ "GP" ],
1325         mode     => $mode_gp,
1326         modified_flags => $status_flags
1327 },
1328
1329 Conv_I2I8Bit => {
1330         reg_req  => { in => [ "gp", "gp", "eax ebx ecx edx", "none" ], out => [ "in_r3", "none" ] },
1331         comment  => "construct Conv Int -> Int",
1332         units    => [ "GP" ],
1333         mode     => $mode_gp,
1334         modified_flags => $status_flags
1335 },
1336
1337 Conv_I2FP => {
1338         reg_req  => { in => [ "gp", "gp", "gp", "none" ], out => [ "xmm", "none" ] },
1339         comment  => "construct Conv Int -> Floating Point",
1340         latency  => 10,
1341         units    => [ "SSE" ],
1342         mode     => "mode_E",
1343 },
1344
1345 Conv_FP2I => {
1346         reg_req  => { in => [ "gp", "gp", "xmm", "none" ], out => [ "gp", "none" ] },
1347         comment  => "construct Conv Floating Point -> Int",
1348         latency  => 10,
1349         units    => [ "SSE" ],
1350         mode     => $mode_gp,
1351 },
1352
1353 Conv_FP2FP => {
1354         reg_req  => { in => [ "gp", "gp", "xmm", "none" ], out => [ "xmm", "none" ] },
1355         comment  => "construct Conv Floating Point -> Floating Point",
1356         latency  => 8,
1357         units    => [ "SSE" ],
1358         mode     => "mode_E",
1359 },
1360
1361 CmpCMov => {
1362         irn_flags => "R",
1363         comment   => "construct Conditional Move: CMov(sel, a, b) == sel ? a : b",
1364         reg_req   => { in => [ "gp", "gp", "gp", "gp" ], out => [ "in_r4" ] },
1365         latency   => 2,
1366         units     => [ "GP" ],
1367         mode      => $mode_gp,
1368 },
1369
1370 PsiCondCMov => {
1371         irn_flags => "R",
1372         comment   => "check if Psi condition tree evaluates to true and move result accordingly",
1373         reg_req   => { in => [ "gp", "gp", "gp" ], out => [ "in_r3" ] },
1374         latency   => 2,
1375         units     => [ "GP" ],
1376         mode      => $mode_gp,
1377 },
1378
1379 xCmpCMov => {
1380         irn_flags => "R",
1381         comment   => "construct Conditional Move: SSE Compare + int CMov ",
1382         reg_req   => { in => [ "xmm", "xmm", "gp", "gp" ], out => [ "in_r4" ] },
1383         latency   => 5,
1384         units     => [ "SSE" ],
1385         mode      => $mode_gp,
1386 },
1387
1388 vfCmpCMov => {
1389         irn_flags => "R",
1390         comment   => "construct Conditional Move: x87 Compare + int CMov",
1391         reg_req   => { in => [ "vfp", "vfp", "gp", "gp" ], out => [ "in_r4" ] },
1392         latency   => 10,
1393         units     => [ "VFP" ],
1394         mode      => $mode_gp,
1395 },
1396
1397 CmpSet => {
1398         irn_flags => "R",
1399         comment   => "construct Set: Set(sel) == sel ? 1 : 0",
1400         reg_req   => { in => [ "gp", "gp", "gp", "gp", "none" ], out => [ "eax ebx ecx edx" ] },
1401         latency   => 2,
1402         units     => [ "GP" ],
1403         mode      => $mode_gp,
1404 },
1405
1406 PsiCondSet => {
1407         irn_flags => "R",
1408         comment   => "check if Psi condition tree evaluates to true and set result accordingly",
1409         reg_req   => { in => [ "gp" ], out => [ "eax ebx ecx edx" ] },
1410         latency   => 2,
1411         units     => [ "GP" ],
1412         mode      => $mode_gp,
1413 },
1414
1415 xCmpSet => {
1416         irn_flags => "R",
1417         comment   => "construct Set: SSE Compare + int Set",
1418         reg_req   => { in => [ "gp", "gp", "xmm", "xmm", "none" ], out => [ "eax ebx ecx edx" ] },
1419         latency   => 5,
1420         units     => [ "SSE" ],
1421         mode      => $mode_gp,
1422 },
1423
1424 vfCmpSet => {
1425         irn_flags => "R",
1426         comment   => "construct Set: x87 Compare + int Set",
1427         reg_req   => { in => [ "gp", "gp", "vfp", "vfp", "none" ], out => [ "eax ebx ecx edx" ] },
1428         latency   => 10,
1429         units     => [ "VFP" ],
1430         mode      => $mode_gp,
1431 },
1432
1433 vfCMov => {
1434         irn_flags => "R",
1435         comment   => "construct x87 Conditional Move: vfCMov(sel, a, b) = sel ? a : b",
1436         reg_req   => { in => [ "vfp", "vfp", "vfp", "vfp" ], out => [ "vfp" ] },
1437         latency   => 10,
1438         units     => [ "VFP" ],
1439         mode      => "mode_E",
1440 },
1441
1442 #----------------------------------------------------------#
1443 #        _      _               _    __ _             _    #
1444 #       (_)    | |             | |  / _| |           | |   #
1445 # __   ___ _ __| |_ _   _  __ _| | | |_| | ___   __ _| |_  #
1446 # \ \ / / | '__| __| | | |/ _` | | |  _| |/ _ \ / _` | __| #
1447 #  \ V /| | |  | |_| |_| | (_| | | | | | | (_) | (_| | |_  #
1448 #   \_/ |_|_|   \__|\__,_|\__,_|_| |_| |_|\___/ \__,_|\__| #
1449 #                 | |                                      #
1450 #  _ __   ___   __| | ___  ___                             #
1451 # | '_ \ / _ \ / _` |/ _ \/ __|                            #
1452 # | | | | (_) | (_| |  __/\__ \                            #
1453 # |_| |_|\___/ \__,_|\___||___/                            #
1454 #----------------------------------------------------------#
1455
1456 vfadd => {
1457         irn_flags => "R",
1458         comment   => "virtual fp Add: Add(a, b) = Add(b, a) = a + b",
1459         reg_req   => { in => [ "gp", "gp", "vfp", "vfp", "none" ], out => [ "vfp" ] },
1460         latency   => 4,
1461         units     => [ "VFP" ],
1462         mode      => "mode_E",
1463 },
1464
1465 vfmul => {
1466         irn_flags => "R",
1467         comment   => "virtual fp Mul: Mul(a, b) = Mul(b, a) = a * b",
1468         reg_req   => { in => [ "gp", "gp", "vfp", "vfp", "none" ], out => [ "vfp" ] },
1469         latency   => 4,
1470         units     => [ "VFP" ],
1471         mode      => "mode_E",
1472 },
1473
1474 l_vfmul => {
1475         op_flags  => "C",
1476         cmp_attr  => "return 1;",
1477         comment   => "lowered virtual fp Mul: Mul(a, b) = Mul(b, a) = a * b",
1478         arity     => 2,
1479 },
1480
1481 vfsub => {
1482         irn_flags => "R",
1483         comment   => "virtual fp Sub: Sub(a, b) = a - b",
1484         reg_req   => { in => [ "gp", "gp", "vfp", "vfp", "none" ], out => [ "vfp" ] },
1485         latency   => 4,
1486         units     => [ "VFP" ],
1487         mode      => "mode_E",
1488 },
1489
1490 l_vfsub => {
1491         cmp_attr  => "return 1;",
1492         comment   => "lowered virtual fp Sub: Sub(a, b) = a - b",
1493         arity     => 2,
1494 },
1495
1496 vfdiv => {
1497         comment   => "virtual fp Div: Div(a, b) = a / b",
1498         reg_req   => { in => [ "gp", "gp", "vfp", "vfp", "none" ], out => [ "vfp" ] },
1499         outs      => [ "res", "M" ],
1500         latency   => 20,
1501         units     => [ "VFP" ],
1502 },
1503
1504 l_vfdiv => {
1505         cmp_attr  => "return 1;",
1506         comment   => "lowered virtual fp Div: Div(a, b) = a / b",
1507         outs      => [ "res", "M" ],
1508         arity     => 2,
1509 },
1510
1511 vfprem => {
1512         comment   => "virtual fp Rem: Rem(a, b) = a - Q * b (Q is integer)",
1513         reg_req   => { in => [ "gp", "gp", "vfp", "vfp", "none" ], out => [ "vfp" ] },
1514         latency   => 20,
1515         units     => [ "VFP" ],
1516         mode      => "mode_E",
1517 },
1518
1519 l_vfprem => {
1520         cmp_attr  => "return 1;",
1521         comment   => "lowered virtual fp Rem: Rem(a, b) = a - Q * b (Q is integer)",
1522         arity     => 2,
1523 },
1524
1525 vfabs => {
1526         irn_flags => "R",
1527         comment   => "virtual fp Abs: Abs(a) = |a|",
1528         reg_req   => { in => [ "vfp"], out => [ "vfp" ] },
1529         latency   => 2,
1530         units     => [ "VFP" ],
1531         mode      => "mode_E",
1532 },
1533
1534 vfchs => {
1535         irn_flags => "R",
1536         comment   => "virtual fp Chs: Chs(a) = -a",
1537         reg_req   => { in => [ "vfp"], out => [ "vfp" ] },
1538         latency   => 2,
1539         units     => [ "VFP" ],
1540         mode      => "mode_E",
1541 },
1542
1543 vfsin => {
1544         irn_flags => "R",
1545         comment   => "virtual fp Sin: Sin(a) = sin(a)",
1546         reg_req   => { in => [ "vfp"], out => [ "vfp" ] },
1547         latency   => 150,
1548         units     => [ "VFP" ],
1549         mode      => "mode_E",
1550 },
1551
1552 vfcos => {
1553         irn_flags => "R",
1554         comment   => "virtual fp Cos: Cos(a) = cos(a)",
1555         reg_req   => { in => [ "vfp"], out => [ "vfp" ] },
1556         latency   => 150,
1557         units     => [ "VFP" ],
1558         mode      => "mode_E",
1559 },
1560
1561 vfsqrt => {
1562         irn_flags => "R",
1563         comment   => "virtual fp Sqrt: Sqrt(a) = a ^ 0.5",
1564         reg_req   => { in => [ "vfp"], out => [ "vfp" ] },
1565         latency   => 30,
1566         units     => [ "VFP" ],
1567         mode      => "mode_E",
1568 },
1569
1570 # virtual Load and Store
1571
1572 vfld => {
1573         op_flags  => "L|F",
1574         state     => "exc_pinned",
1575         comment   => "virtual fp Load: Load(ptr, mem) = LD ptr -> reg",
1576         reg_req   => { in => [ "gp", "gp", "none" ], out => [ "vfp", "none" ] },
1577         outs      => [ "res", "M" ],
1578         latency   => 2,
1579         units     => [ "VFP" ],
1580 },
1581
1582 vfst => {
1583         op_flags  => "L|F",
1584         state     => "exc_pinned",
1585         comment   => "virtual fp Store: Store(ptr, val, mem) = ST ptr,val",
1586         reg_req   => { in => [ "gp", "gp", "vfp", "none" ] },
1587         latency   => 2,
1588         units     => [ "VFP" ],
1589         mode      => "mode_M",
1590 },
1591
1592 # Conversions
1593
1594 vfild => {
1595         comment   => "virtual fp integer Load: Load(ptr, mem) = iLD ptr -> reg",
1596         reg_req   => { in => [ "gp", "gp", "none" ], out => [ "vfp", "none" ] },
1597         outs      => [ "res", "M" ],
1598         latency   => 4,
1599         units     => [ "VFP" ],
1600 },
1601
1602 l_vfild => {
1603         cmp_attr  => "return 1;",
1604         comment   => "lowered virtual fp integer Load: Load(ptr, mem) = iLD ptr -> reg",
1605         outs      => [ "res", "M" ],
1606         arity     => 2,
1607 },
1608
1609 vfist => {
1610         comment   => "virtual fp integer Store: Store(ptr, val, mem) = iST ptr,val",
1611         reg_req   => { in => [ "gp", "gp", "vfp", "fpcw", "none" ] },
1612         latency   => 4,
1613         units     => [ "VFP" ],
1614         mode      => "mode_M",
1615 },
1616
1617 l_vfist => {
1618         cmp_attr  => "return 1;",
1619         comment   => "lowered virtual fp integer Store: Store(ptr, val, mem) = iST ptr,val",
1620         arity     => 3,
1621         mode      => "mode_M",
1622 },
1623
1624
1625 # constants
1626
1627 vfldz => {
1628         irn_flags => "R",
1629         comment   => "virtual fp Load 0.0: Ld 0.0 -> reg",
1630         reg_req   => { out => [ "vfp" ] },
1631         latency   => 4,
1632         units     => [ "VFP" ],
1633         mode      => "mode_E",
1634 },
1635
1636 vfld1 => {
1637         irn_flags => "R",
1638         comment   => "virtual fp Load 1.0: Ld 1.0 -> reg",
1639         reg_req   => { out => [ "vfp" ] },
1640         latency   => 4,
1641         units     => [ "VFP" ],
1642         mode      => "mode_E",
1643 },
1644
1645 vfldpi => {
1646         irn_flags => "R",
1647         comment   => "virtual fp Load pi: Ld pi -> reg",
1648         reg_req   => { out => [ "vfp" ] },
1649         latency   => 4,
1650         units     => [ "VFP" ],
1651         mode      => "mode_E",
1652 },
1653
1654 vfldln2 => {
1655         irn_flags => "R",
1656         comment   => "virtual fp Load ln 2: Ld ln 2 -> reg",
1657         reg_req   => { out => [ "vfp" ] },
1658         latency   => 4,
1659         units     => [ "VFP" ],
1660         mode      => "mode_E",
1661 },
1662
1663 vfldlg2 => {
1664         irn_flags => "R",
1665         comment   => "virtual fp Load lg 2: Ld lg 2 -> reg",
1666         reg_req   => { out => [ "vfp" ] },
1667         latency   => 4,
1668         units     => [ "VFP" ],
1669         mode      => "mode_E",
1670 },
1671
1672 vfldl2t => {
1673         irn_flags => "R",
1674         comment   => "virtual fp Load ld 10: Ld ld 10 -> reg",
1675         reg_req   => { out => [ "vfp" ] },
1676         latency   => 4,
1677         units     => [ "VFP" ],
1678         mode      => "mode_E",
1679 },
1680
1681 vfldl2e => {
1682         irn_flags => "R",
1683         comment   => "virtual fp Load ld e: Ld ld e -> reg",
1684         reg_req   => { out => [ "vfp" ] },
1685         latency   => 4,
1686         units     => [ "VFP" ],
1687         mode      => "mode_E",
1688 },
1689
1690 vfConst => {
1691         op_flags  => "c",
1692         irn_flags => "R",
1693 #  init_attr => "  set_ia32_ls_mode(res, mode);",
1694         comment   => "represents a virtual floating point constant",
1695         reg_req   => { out => [ "vfp" ] },
1696         latency   => 3,
1697         units     => [ "VFP" ],
1698         mode      => "mode_E",
1699 },
1700
1701 # other
1702
1703 vfCondJmp => {
1704         state     => "pinned",
1705         op_flags  => "L|X|Y",
1706         comment   => "represents a virtual floating point compare",
1707         reg_req   => { in => [ "gp", "gp", "vfp", "vfp", "none" ], out => [ "none", "none", "eax" ] },
1708         outs      => [ "false", "true", "temp_reg_eax" ],
1709         latency   => 10,
1710         units     => [ "VFP" ],
1711 },
1712
1713 #------------------------------------------------------------------------#
1714 #       ___ _____    __ _             _                     _            #
1715 # __  _( _ )___  |  / _| | ___   __ _| |_   _ __   ___   __| | ___  ___  #
1716 # \ \/ / _ \  / /  | |_| |/ _ \ / _` | __| | '_ \ / _ \ / _` |/ _ \/ __| #
1717 #  >  < (_) |/ /   |  _| | (_) | (_| | |_  | | | | (_) | (_| |  __/\__ \ #
1718 # /_/\_\___//_/    |_| |_|\___/ \__,_|\__| |_| |_|\___/ \__,_|\___||___/ #
1719 #------------------------------------------------------------------------#
1720
1721 # Note: gas is strangely buggy: fdivrp and fdivp as well as fsubrp and fsubp
1722 #       are swapped, we work this around in the emitter...
1723
1724 fadd => {
1725         op_flags  => "R",
1726         rd_constructor => "NONE",
1727         comment   => "x87 Add: Add(a, b) = Add(b, a) = a + b",
1728         reg_req   => { },
1729         emit      => '. fadd%XM %x87_binop',
1730 },
1731
1732 faddp => {
1733         op_flags  => "R",
1734         rd_constructor => "NONE",
1735         comment   => "x87 Add: Add(a, b) = Add(b, a) = a + b",
1736         reg_req   => { },
1737         emit      => '. faddp %x87_binop',
1738 },
1739
1740 fmul => {
1741         op_flags  => "R",
1742         rd_constructor => "NONE",
1743         comment   => "x87 fp Mul: Mul(a, b) = Mul(b, a) = a + b",
1744         reg_req   => { },
1745         emit      => '. fmul%XM %x87_binop',
1746 },
1747
1748 fmulp => {
1749         op_flags  => "R",
1750         rd_constructor => "NONE",
1751         comment   => "x87 fp Mul: Mul(a, b) = Mul(b, a) = a + b",
1752         reg_req   => { },
1753         emit      => '. fmulp %x87_binop',,
1754 },
1755
1756 fsub => {
1757         op_flags  => "R",
1758         rd_constructor => "NONE",
1759         comment   => "x87 fp Sub: Sub(a, b) = a - b",
1760         reg_req   => { },
1761         emit      => '. fsub%XM %x87_binop',
1762 },
1763
1764 fsubp => {
1765         op_flags  => "R",
1766         rd_constructor => "NONE",
1767         comment   => "x87 fp Sub: Sub(a, b) = a - b",
1768         reg_req   => { },
1769 # see note about gas bugs
1770         emit      => '. fsubrp %x87_binop',
1771 },
1772
1773 fsubr => {
1774         op_flags  => "R",
1775         rd_constructor => "NONE",
1776         irn_flags => "R",
1777         comment   => "x87 fp SubR: SubR(a, b) = b - a",
1778         reg_req   => { },
1779         emit      => '. fsubr%XM %x87_binop',
1780 },
1781
1782 fsubrp => {
1783         op_flags  => "R",
1784         rd_constructor => "NONE",
1785         irn_flags => "R",
1786         comment   => "x87 fp SubR: SubR(a, b) = b - a",
1787         reg_req   => { },
1788 # see note about gas bugs
1789         emit      => '. fsubp %x87_binop',
1790 },
1791
1792 fprem => {
1793         op_flags  => "R",
1794         rd_constructor => "NONE",
1795         comment   => "x87 fp Rem: Rem(a, b) = a - Q * b (Q is integer)",
1796         reg_req   => { },
1797         emit      => '. fprem1',
1798 },
1799
1800 # this node is just here, to keep the simulator running
1801 # we can omit this when a fprem simulation function exists
1802 fpremp => {
1803         op_flags  => "R",
1804         rd_constructor => "NONE",
1805         comment   => "x87 fp Rem: Rem(a, b) = a - Q * b (Q is integer)",
1806         reg_req   => { },
1807         emit      => '. fprem1',
1808 },
1809
1810 fdiv => {
1811         op_flags  => "R",
1812         rd_constructor => "NONE",
1813         comment   => "x87 fp Div: Div(a, b) = a / b",
1814         reg_req   => { },
1815         emit      => '. fdiv%XM %x87_binop',
1816 },
1817
1818 fdivp => {
1819         op_flags  => "R",
1820         rd_constructor => "NONE",
1821         comment   => "x87 fp Div: Div(a, b) = a / b",
1822         reg_req   => { },
1823 # see note about gas bugs
1824         emit      => '. fdivrp %x87_binop',
1825 },
1826
1827 fdivr => {
1828         op_flags  => "R",
1829         rd_constructor => "NONE",
1830         comment   => "x87 fp DivR: DivR(a, b) = b / a",
1831         reg_req   => { },
1832         emit      => '. fdivr%XM %x87_binop',
1833 },
1834
1835 fdivrp => {
1836         op_flags  => "R",
1837         rd_constructor => "NONE",
1838         comment   => "x87 fp DivR: DivR(a, b) = b / a",
1839         reg_req   => { },
1840 # see note about gas bugs
1841         emit      => '. fdivp %x87_binop',
1842 },
1843
1844 fabs => {
1845         op_flags  => "R",
1846         rd_constructor => "NONE",
1847         comment   => "x87 fp Abs: Abs(a) = |a|",
1848         reg_req   => { },
1849         emit      => '. fabs',
1850 },
1851
1852 fchs => {
1853         op_flags  => "R|K",
1854         rd_constructor => "NONE",
1855         comment   => "x87 fp Chs: Chs(a) = -a",
1856         reg_req   => { },
1857         emit      => '. fchs',
1858 },
1859
1860 fsin => {
1861         op_flags  => "R",
1862         rd_constructor => "NONE",
1863         comment   => "x87 fp Sin: Sin(a) = sin(a)",
1864         reg_req   => { },
1865         emit      => '. fsin',
1866 },
1867
1868 fcos => {
1869         op_flags  => "R",
1870         rd_constructor => "NONE",
1871         comment   => "x87 fp Cos: Cos(a) = cos(a)",
1872         reg_req   => { },
1873         emit      => '. fcos',
1874 },
1875
1876 fsqrt => {
1877         op_flags  => "R",
1878         rd_constructor => "NONE",
1879         comment   => "x87 fp Sqrt: Sqrt(a) = a ^ 0.5",
1880         reg_req   => { },
1881         emit      => '. fsqrt $',
1882 },
1883
1884 # x87 Load and Store
1885
1886 fld => {
1887         rd_constructor => "NONE",
1888         op_flags  => "R|L|F",
1889         state     => "exc_pinned",
1890         comment   => "x87 fp Load: Load(ptr, mem) = LD ptr -> reg",
1891         reg_req   => { },
1892         emit      => '. fld%XM %AM',
1893 },
1894
1895 fst => {
1896         rd_constructor => "NONE",
1897         op_flags  => "R|L|F",
1898         state     => "exc_pinned",
1899         comment   => "x87 fp Store: Store(ptr, val, mem) = ST ptr,val",
1900         reg_req   => { },
1901         emit      => '. fst%XM %AM',
1902         mode      => "mode_M",
1903 },
1904
1905 fstp => {
1906         rd_constructor => "NONE",
1907         op_flags  => "R|L|F",
1908         state     => "exc_pinned",
1909         comment   => "x87 fp Store: Store(ptr, val, mem) = ST ptr,val",
1910         reg_req   => { },
1911         emit      => '. fstp%XM %AM',
1912         mode      => "mode_M",
1913 },
1914
1915 # Conversions
1916
1917 fild => {
1918         op_flags  => "R",
1919         rd_constructor => "NONE",
1920         comment   => "x87 fp integer Load: Load(ptr, mem) = iLD ptr -> reg",
1921         reg_req   => { },
1922         emit      => '. fild%XM %AM',
1923 },
1924
1925 fist => {
1926         op_flags  => "R",
1927         rd_constructor => "NONE",
1928         comment   => "x87 fp integer Store: Store(ptr, val, mem) = iST ptr,val",
1929         reg_req   => { },
1930         emit      => '. fist%XM %AM',
1931         mode      => "mode_M",
1932 },
1933
1934 fistp => {
1935         op_flags  => "R",
1936         rd_constructor => "NONE",
1937         comment   => "x87 fp integer Store: Store(ptr, val, mem) = iST ptr,val",
1938         reg_req   => { },
1939         emit      => '. fistp%XM %AM',
1940         mode      => "mode_M",
1941 },
1942
1943 # constants
1944
1945 fldz => {
1946         op_flags  => "R|c|K",
1947         irn_flags  => "R",
1948         comment   => "x87 fp Load 0.0: Ld 0.0 -> reg",
1949         reg_req   => { },
1950         emit      => '. fldz',
1951 },
1952
1953 fld1 => {
1954         op_flags  => "R|c|K",
1955         irn_flags  => "R",
1956         comment   => "x87 fp Load 1.0: Ld 1.0 -> reg",
1957         reg_req   => { },
1958         emit      => '. fld1',
1959 },
1960
1961 fldpi => {
1962         op_flags  => "R|c|K",
1963         irn_flags  => "R",
1964         comment   => "x87 fp Load pi: Ld pi -> reg",
1965         reg_req   => { },
1966         emit      => '. fldpi',
1967 },
1968
1969 fldln2 => {
1970         op_flags  => "R|c|K",
1971         irn_flags  => "R",
1972         comment   => "x87 fp Load ln 2: Ld ln 2 -> reg",
1973         reg_req   => { },
1974         emit      => '. fldln2',
1975 },
1976
1977 fldlg2 => {
1978         op_flags  => "R|c|K",
1979         irn_flags  => "R",
1980         comment   => "x87 fp Load lg 2: Ld lg 2 -> reg",
1981         reg_req   => { },
1982         emit      => '. fldlg2',
1983 },
1984
1985 fldl2t => {
1986         op_flags  => "R|c|K",
1987         irn_flags  => "R",
1988         comment   => "x87 fp Load ld 10: Ld ld 10 -> reg",
1989         reg_req   => { },
1990         emit      => '. fldll2t',
1991 },
1992
1993 fldl2e => {
1994         op_flags  => "R|c|K",
1995         irn_flags  => "R",
1996         comment   => "x87 fp Load ld e: Ld ld e -> reg",
1997         reg_req   => { },
1998         emit      => '. fldl2e',
1999 },
2000
2001 # fxch, fpush, fpop
2002 # Note that it is NEVER allowed to do CSE on these nodes
2003 # Moreover, note the virtual register requierements!
2004
2005 fxch => {
2006         op_flags  => "R|K",
2007         comment   => "x87 stack exchange",
2008         reg_req   => { },
2009         cmp_attr  => "return 1;",
2010         emit      => '. fxch %X0',
2011 },
2012
2013 fpush => {
2014         op_flags  => "R|K",
2015         comment   => "x87 stack push",
2016         reg_req   => {},
2017         cmp_attr  => "return 1;",
2018         emit      => '. fld %X0',
2019 },
2020
2021 fpushCopy => {
2022         op_flags  => "R",
2023         comment   => "x87 stack push",
2024         reg_req   => { in => [ "vfp"], out => [ "vfp" ] },
2025         cmp_attr  => "return 1;",
2026         emit      => '. fld %X0',
2027 },
2028
2029 fpop => {
2030         op_flags  => "R|K",
2031         comment   => "x87 stack pop",
2032         reg_req   => { },
2033         cmp_attr  => "return 1;",
2034         emit      => '. fstp %X0',
2035 },
2036
2037 # compare
2038
2039 fcomJmp => {
2040         op_flags  => "L|X|Y",
2041         comment   => "floating point compare",
2042         reg_req   => { },
2043 },
2044
2045 fcompJmp => {
2046         op_flags  => "L|X|Y",
2047         comment   => "floating point compare and pop",
2048         reg_req   => { },
2049 },
2050
2051 fcomppJmp => {
2052         op_flags  => "L|X|Y",
2053         comment   => "floating point compare and pop twice",
2054         reg_req   => { },
2055 },
2056
2057 fcomrJmp => {
2058         op_flags  => "L|X|Y",
2059         comment   => "floating point compare reverse",
2060         reg_req   => { },
2061 },
2062
2063 fcomrpJmp => {
2064         op_flags  => "L|X|Y",
2065         comment   => "floating point compare reverse and pop",
2066         reg_req   => { },
2067 },
2068
2069 fcomrppJmp => {
2070         op_flags  => "L|X|Y",
2071         comment   => "floating point compare reverse and pop twice",
2072         reg_req   => { },
2073 },
2074
2075
2076 # -------------------------------------------------------------------------------- #
2077 #  ____ ____  _____                  _                               _             #
2078 # / ___/ ___|| ____| __   _____  ___| |_ ___  _ __   _ __   ___   __| | ___  ___   #
2079 # \___ \___ \|  _|   \ \ / / _ \/ __| __/ _ \| '__| | '_ \ / _ \ / _` |/ _ \/ __|  #
2080 #  ___) |__) | |___   \ V /  __/ (__| || (_) | |    | | | | (_) | (_| |  __/\__ \  #
2081 # |____/____/|_____|   \_/ \___|\___|\__\___/|_|    |_| |_|\___/ \__,_|\___||___/  #
2082 #                                                                                  #
2083 # -------------------------------------------------------------------------------- #
2084
2085
2086 # Spilling and reloading of SSE registers, hardcoded, not generated #
2087
2088 xxLoad => {
2089         op_flags  => "L|F",
2090         state     => "exc_pinned",
2091         comment   => "construct SSE Load: Load(ptr, mem) = LD ptr",
2092         reg_req   => { in => [ "gp", "gp", "none" ], out => [ "xmm", "none" ] },
2093         emit      => '. movdqu %D0, %AM',
2094         outs      => [ "res", "M" ],
2095         units     => [ "SSE" ],
2096 },
2097
2098 xxStore => {
2099         op_flags => "L|F",
2100         state    => "exc_pinned",
2101         comment  => "construct Store: Store(ptr, val, mem) = ST ptr,val",
2102         reg_req  => { in => [ "gp", "gp", "xmm", "none" ] },
2103         emit     => '. movdqu %binop',
2104         units    => [ "SSE" ],
2105         mode     => "mode_M",
2106 },
2107
2108 ); # end of %nodes
2109
2110 # Include the generated SIMD node specification written by the SIMD optimization
2111 $my_script_name = dirname($myname) . "/../ia32/ia32_simd_spec.pl";
2112 unless ($return = do $my_script_name) {
2113         warn "couldn't parse $my_script_name: $@" if $@;
2114         warn "couldn't do $my_script_name: $!"    unless defined $return;
2115         warn "couldn't run $my_script_name"       unless $return;
2116 }