082dc6685e05abe59c9c4d5a2a4d4e3e16f5c2ed
[libfirm] / ir / ana / irmemory.c
1 /*
2  * Project:     libFIRM
3  * File name:   ir/ana/irmemory.c
4  * Purpose:     Memory disambiguator
5  * Author:      Michael Beck
6  * Modified by:
7  * Created:     27.12.2006
8  * CVS-ID:      $Id$
9  * Copyright:   (c) 2006-2007 Universität Karlsruhe
10  * Licence:     This file protected by GPL -  GNU GENERAL PUBLIC LICENSE.
11  */
12 #ifdef HAVE_CONFIG_H
13 #include "config.h"
14 #endif
15
16 #include <stdlib.h>
17
18 #include "irnode_t.h"
19 #include "irgraph_t.h"
20 #include "irprog_t.h"
21 #include "irmemory.h"
22 #include "irflag.h"
23 #include "hashptr.h"
24 #include "irflag.h"
25 #include "irouts.h"
26 #include "irgwalk.h"
27 #include "irprintf.h"
28
29 /** The source language specific language disambiguator function. */
30 static DISAMBIGUATOR_FUNC language_disambuigator = NULL;
31
32 /** The global memory disambiguator options. */
33 static unsigned global_mem_disamgig_opt = aa_opt_no_opt;
34
35 /* Get the memory disambiguator options for a graph. */
36 unsigned get_irg_memory_disambiguator_options(ir_graph *irg) {
37         unsigned opt = irg->mem_disambig_opt;
38         if (opt & aa_opt_inherited)
39                 return global_mem_disamgig_opt;
40         return opt;
41 }  /* get_irg_memory_disambiguator_options */
42
43 /*  Set the memory disambiguator options for a graph. */
44 void set_irg_memory_disambiguator_options(ir_graph *irg, unsigned options) {
45         irg->mem_disambig_opt = options & ~aa_opt_inherited;
46 }  /* set_irg_memory_disambiguator_options */
47
48 /* Set the global disambiguator options for all graphs not having local options. */
49 void set_irp_memory_disambiguator_options(unsigned options) {
50         global_mem_disamgig_opt = options;
51 }  /* set_irp_memory_disambiguator_options */
52
53 /**
54  * Find the base address and entity of an Sel node.
55  *
56  * @param sel  the node
57  * @param pEnt after return points to the base entity.
58  *
59  * @return the base address.
60  */
61 static ir_node *find_base_adr(ir_node *sel, ir_entity **pEnt) {
62         ir_node *ptr = get_Sel_ptr(sel);
63
64         while (is_Sel(ptr)) {
65                 sel = ptr;
66                 ptr = get_Sel_ptr(sel);
67         }
68         *pEnt = get_Sel_entity(sel);
69         return ptr;
70 }  /* find_base_adr */
71
72 /**
73  * Two address expressions have the same base address,
74  * check if there offsets are different.
75  *
76  * @param adr1  The first address.
77  * @param adr2  The second address.
78  */
79 static ir_alias_relation different_offsets(ir_node *adr1, ir_node *adr2) {
80         return may_alias;
81 }  /* different_offsets */
82
83 /**
84  * Determine the alias relation by checking if adr1 and adr2 are pointer
85  * to different type.
86  *
87  * @param adr1    The first address.
88  * @param adr2    The second address.
89  */
90 static ir_alias_relation different_types(ir_node *adr1, ir_node *adr2)
91 {
92         ir_entity *ent1 = NULL, *ent2 = NULL;
93
94         if (is_SymConst(adr1) && get_SymConst_kind(adr1) == symconst_addr_ent)
95                 ent1 = get_SymConst_entity(adr1);
96         else if (is_Sel(adr1))
97                 ent1 = get_Sel_entity(adr1);
98
99         if (is_SymConst(adr2) && get_SymConst_kind(adr2) == symconst_addr_ent)
100                 ent2 = get_SymConst_entity(adr2);
101         else if (is_Sel(adr2))
102                 ent2 = get_Sel_entity(adr2);
103
104         if (ent1 != NULL && ent2 != NULL) {
105                 ir_type *tp1 = get_entity_type(ent1);
106                 ir_type *tp2 = get_entity_type(ent2);
107
108                 if (tp1 != tp2) {
109                         if (is_Pointer_type(tp1) && is_Pointer_type(tp2)) {
110                                 /* do deref until no pointer types are found */
111                                 do {
112                                         tp1 = get_pointer_points_to_type(tp1);
113                                         tp2 = get_pointer_points_to_type(tp2);
114                                 } while (is_Pointer_type(tp1) && is_Pointer_type(tp2));
115                         }
116
117                         if (get_type_tpop(tp1) != get_type_tpop(tp2)) {
118                                 /* different type structure */
119                                 return no_alias;
120                         }
121                         if (is_Class_type(tp1)) {
122                                 /* check class hierarchy */
123                                 if (! is_SubClass_of(tp1, tp2) &&
124                                         ! is_SubClass_of(tp2, tp1))
125                                         return no_alias;
126                         } else {
127                                 /* different types */
128                                 return no_alias;
129                         }
130                 }
131         }
132         return may_alias;
133 }  /* different_types */
134
135 /**
136  * Determine the alias relation between two addresses.
137  */
138 static ir_alias_relation _get_alias_relation(
139         ir_graph *irg,
140         ir_node *adr1, ir_mode *mode1,
141         ir_node *adr2, ir_mode *mode2)
142 {
143         opcode op1, op2;
144         ir_entity *ent1, *ent2;
145         unsigned options;
146
147         if (! get_opt_alias_analysis())
148                 return may_alias;
149
150         if (adr1 == adr2)
151                 return sure_alias;
152
153         options = get_irg_memory_disambiguator_options(irg);
154
155         /* The Armageddon switch */
156         if (options & aa_opt_no_alias)
157                 return no_alias;
158
159         /* Two save some code, sort the addresses by its id's. Beware, this
160            might break some things, so better check here. */
161         assert(iro_SymConst < iro_Sel && "Code dependence breaked");
162         op1 = get_irn_opcode(adr1);
163         op2 = get_irn_opcode(adr2);
164
165         if (op1 > op2) {
166                 ir_node *t = adr1;
167                 ir_mode *m = mode1;
168                 adr1  = adr2;
169                 mode1 = mode2;
170                 adr2  = t;
171                 mode2 = m;
172         }
173
174         if (is_SymConst(adr1) && get_SymConst_kind(adr1) == symconst_addr_ent) {
175                 /* first address is a global variable */
176
177                 if (is_SymConst(adr2) && get_SymConst_kind(adr2) == symconst_addr_ent) {
178                         /* both addresses are global variables and we know
179                            they are different (R1 a) */
180                         if (get_SymConst_entity(adr1) != get_SymConst_entity(adr2))
181                                 return no_alias;
182                         else {
183                                 /* equal addresses */
184                                 return sure_alias;
185                         }
186                 }
187                 if (is_Sel(adr2)) {
188                         ir_node *base = find_base_adr(adr2, &ent2);
189
190                         if (is_SymConst(base) && get_SymConst_kind(base) == symconst_addr_ent) {
191                                 /* base address is a global var (R1 a) */
192                                 if (adr1 != base)
193                                         return no_alias;
194                                 if (base == adr1)
195                                         return different_offsets(adr1, adr2);
196                         } else if (base == get_irg_frame(irg)) {
197                                 /* the second one is a local variable so they are always
198                                    different (R1 b) */
199                                 return no_alias;
200                         } else if (base == get_irg_tls(irg)) {
201                                 /* the second one is a TLS variable so they are always
202                                    different (R1 c) */
203                                 return no_alias;
204                         }
205                 }
206
207                 /* Here we are: the first is a global var, the second some pointer. */
208                 ent1 = get_SymConst_entity(adr1);
209                 if (get_entity_address_taken(ent1) == ir_address_not_taken) {
210                         /* The address of the global variable was never taken, so
211                            the pointer cannot match (R2). */
212                         return no_alias;
213                 }
214         } else if (is_Sel(adr1)) {
215                 /* the first address is a Sel */
216                 ir_node *base1 = find_base_adr(adr1, &ent1);
217
218                 if (base1 == get_irg_frame(irg)) {
219                         /* the first is a local variable */
220                         if (is_Sel(adr2)) {
221                                 /* the second address is a Sel */
222                                 ir_node *base2 = find_base_adr(adr2, &ent2);
223
224                                 if (base2 == get_irg_frame(irg)) {
225                                         /* both addresses are local variables and we know
226                                            they are different (R1 a) */
227                                         if (ent1 != ent2)
228                                                 return no_alias;
229                                         else
230                                                 return different_offsets(adr1, adr2);
231                                 } else if (base2 == get_irg_tls(irg)) {
232                                         /* the second one is a TLS variable so they are always
233                                        different (R1 d) */
234                                         return no_alias;
235                                 }
236                         }
237                 } else if (base1 == get_irg_tls(irg)) {
238                         /* the first is a TLS variable */
239                         if (is_Sel(adr2)) {
240                                 /* the second address is a Sel */
241                                 ir_node *base2 = find_base_adr(adr2, &ent2);
242
243                                 if (base2 == get_irg_frame(irg)) {
244                                         /* the second one is a local variable so they are always
245                                        different (R1 d) */
246                                         return no_alias;
247                                 } else if (base2 == get_irg_tls(irg)) {
248                                         /* both addresses are TLS variables and we know
249                                            they are different (R1 a) */
250                                         if (ent1 != ent2)
251                                                 return no_alias;
252                                         else
253                                                 return different_offsets(adr1, adr2);
254                                 }
255                         }
256                 }
257         }
258
259         if (options & aa_opt_type_based) {
260                 ir_alias_relation rel;
261
262                 if (options & aa_opt_byte_type_may_alias) {
263                         if (get_mode_size_bits(mode1) == 8 || get_mode_size_bits(mode2) == 8) {
264                                 /* One of the modes address a byte. Assume a may_alias. */
265                                 return may_alias;
266                         }
267                 }
268                 /* cheap check: If the mode sizes did not match, the types MUST be different */
269                 if (get_mode_size_bits(mode1) != get_mode_size_bits(mode2))
270                         return no_alias;
271
272                 /* try rule R5 */
273                 rel = different_types(adr1, adr2);
274                 if (rel != may_alias)
275                         return rel;
276         }
277
278         /* do we have a language specific memory disambiguator? */
279         if (language_disambuigator) {
280                 ir_alias_relation rel = (*language_disambuigator)(irg, adr1, mode1, adr2, mode2);
281                 if (rel != may_alias)
282                         return rel;
283         }
284
285         /* access points-to information here */
286         return may_alias;
287 }  /* _get_alias_relation */
288
289 /*
290  * Determine the alias relation between two addresses.
291  */
292 ir_alias_relation get_alias_relation(
293         ir_graph *irg,
294         ir_node *adr1, ir_mode *mode1,
295         ir_node *adr2, ir_mode *mode2)
296 {
297         ir_alias_relation rel = _get_alias_relation(irg, adr1, mode1, adr2, mode2);
298         return rel;
299 }  /* get_alias_relation */
300
301 /* Set a source language specific memory disambiguator function. */
302 void set_language_memory_disambiguator(DISAMBIGUATOR_FUNC func) {
303         language_disambuigator = func;
304 }  /* set_language_memory_disambiguator */
305
306 /** The result cache for the memory disambiguator. */
307 static set *result_cache = NULL;
308
309 /** An entry in the relation cache. */
310 typedef struct mem_disambig_entry {
311         ir_node           *adr1;    /**< The first address. */
312         ir_node           *adr2;    /**< The second address. */
313         ir_alias_relation result;   /**< The alias relation result. */
314 } mem_disambig_entry;
315
316 #define HASH_ENTRY(adr1, adr2)  (HASH_PTR(adr1) ^ HASH_PTR(adr2))
317
318 /**
319  * Compare two relation cache entries.
320  */
321 static int cmp_mem_disambig_entry(const void *elt, const void *key, size_t size) {
322         const mem_disambig_entry *p1 = elt;
323         const mem_disambig_entry *p2 = key;
324
325         return p1->adr1 == p2->adr1 && p1->adr2 == p2->adr2;
326 }  /* cmp_mem_disambig_entry */
327
328 /**
329  * Initialize the relation cache.
330  */
331 void mem_disambig_init(void) {
332         result_cache = new_set(cmp_mem_disambig_entry, 8);
333 }  /* mem_disambig_init */
334
335 /*
336  * Determine the alias relation between two addresses.
337  */
338 ir_alias_relation get_alias_relation_ex(
339         ir_graph *irg,
340         ir_node *adr1, ir_mode *mode1,
341         ir_node *adr2, ir_mode *mode2)
342 {
343         mem_disambig_entry key, *entry;
344
345         if (! get_opt_alias_analysis())
346                 return may_alias;
347
348         if (get_irn_opcode(adr1) > get_irn_opcode(adr2)) {
349                 ir_node *t = adr1;
350                 adr1 = adr2;
351                 adr2 = t;
352         }
353
354         key.adr1 = adr1;
355         key.adr2 = adr2;
356         entry = set_find(result_cache, &key, sizeof(key), HASH_ENTRY(adr1, adr2));
357         if (entry)
358                 return entry->result;
359
360         key.result = get_alias_relation(irg, adr1, mode1, adr2, mode2);
361
362         set_insert(result_cache, &key, sizeof(key), HASH_ENTRY(adr1, adr2));
363         return key.result;
364 }  /* get_alias_relation_ex */
365
366 /* Free the relation cache. */
367 void mem_disambig_term(void) {
368         if (result_cache) {
369                 del_set(result_cache);
370                 result_cache = NULL;
371         }
372 }  /* mem_disambig_term */
373
374 /**
375  * Check the mode of a Load/Store with the mode of the entity
376  * that is accessed.
377  * If the mode of the entity and the Load/Store mode do not match, we
378  * have the bad reinterpret case:
379  *
380  * int i;
381  * char b = *(char *)&i;
382  *
383  * We do NOT count this as one value and return address_taken
384  * in that case.
385  * However, we support an often used case. If the mode is two-complement
386  * we allow casts between signed/unsigned.
387  *
388  * @param mode     the mode of the Load/Store
389  * @param ent_mode the mode of the accessed entity
390  *
391  * @return non-zero if the Load/Store is a hidden cast, zero else
392  */
393 static int is_hidden_cast(ir_mode *mode, ir_mode *ent_mode) {
394         if (ent_mode != mode) {
395                 if (ent_mode == NULL ||
396                         get_mode_size_bits(ent_mode) != get_mode_size_bits(mode) ||
397                         get_mode_sort(ent_mode) != get_mode_sort(mode) ||
398                         get_mode_arithmetic(ent_mode) != irma_twos_complement ||
399                         get_mode_arithmetic(mode) != irma_twos_complement)
400                         return 1;
401         }
402         return 0;
403 }  /* is_hidden_cast */
404
405 /**
406  * Determine the address_taken state of a node (or it's successor Sels).
407  *
408  * @param irn  the node
409  */
410 static ir_address_taken_state find_address_taken_state(ir_node *irn) {
411         int     i;
412         ir_mode *emode, *mode;
413         ir_node *value;
414         ir_entity *ent;
415
416         for (i = get_irn_n_outs(irn) - 1; i >= 0; --i) {
417                 ir_node *succ = get_irn_out(irn, i);
418
419                 switch (get_irn_opcode(succ)) {
420                 case iro_Load:
421                         /* check if this load is not a hidden conversion */
422                         mode = get_Load_mode(succ);
423                         ent = is_SymConst(irn) ? get_SymConst_entity(irn) : get_Sel_entity(irn);
424                         emode = get_type_mode(get_entity_type(ent));
425                         if (is_hidden_cast(mode, emode))
426                                 return ir_address_taken;
427                         break;
428
429                 case iro_Store:
430                         /* check that the node is not the Store's value */
431                         value = get_Store_value(succ);
432                         if (value == irn)
433                                 return ir_address_taken;
434                         /* check if this Store is not a hidden conversion */
435                         mode = get_irn_mode(value);
436                         ent = is_SymConst(irn) ? get_SymConst_entity(irn) : get_Sel_entity(irn);
437                         emode = get_type_mode(get_entity_type(ent));
438                         if (is_hidden_cast(mode, emode))
439                                 return ir_address_taken;
440                         break;
441
442                 case iro_Sel: {
443                         /* Check the successor of irn. */
444                         ir_address_taken_state res = find_address_taken_state(succ);
445                         if (res != ir_address_not_taken)
446                                 return res;
447                         break;
448                 }
449
450                 case iro_Call:
451                         /* Only the call address is not an address taker but
452                            this is an uninteresting case, so we ignore it here. */
453                         return ir_address_taken;
454
455                 default:
456                         /* another op, the address may be taken */
457                         return ir_address_taken_unknown;
458                 }
459         }
460         /* All successors finished, the address is not taken. */
461         return ir_address_not_taken;
462 }  /* find_address_taken_state */
463
464 /**
465  * Update the "address taken" flag of all frame entities.
466  */
467 static void analyse_irg_address_taken(ir_graph *irg) {
468         ir_type *ft = get_irg_frame_type(irg);
469         ir_node *irg_frame;
470         int i;
471
472         /* set initial state to not_taken, as this is the "smallest" state */
473         for (i = get_class_n_members(ft) - 1; i >= 0; --i) {
474                 ir_entity *ent = get_class_member(ft, i);
475
476                 set_entity_address_taken(ent, ir_address_not_taken);
477         }
478
479         assure_irg_outs(irg);
480
481         irg_frame = get_irg_frame(irg);
482
483         for (i = get_irn_n_outs(irg_frame) - 1; i >= 0; --i) {
484                 ir_node *succ = get_irn_out(irg_frame, i);
485                 ir_address_taken_state state;
486
487             if (is_Sel(succ)) {
488                         ir_entity *ent = get_Sel_entity(succ);
489
490                         if (get_entity_address_taken(ent) == ir_address_taken)
491                                 continue;
492
493                         state = find_address_taken_state(succ);
494                         if (state > get_entity_address_taken(ent))
495                                 set_entity_address_taken(ent, state);
496                 }
497         }
498         /* now computed */
499         irg->adr_taken_state = ir_address_taken_computed;
500 }  /* analyse_address_taken */
501
502 /* Returns the current address taken state of the graph. */
503 ir_address_taken_computed_state get_irg_address_taken_state(const ir_graph *irg) {
504         return irg->adr_taken_state;
505 }  /* get_irg_address_taken_state */
506
507 /* Sets the current address taken state of the graph. */
508 void set_irg_address_taken_state(ir_graph *irg, ir_address_taken_computed_state state) {
509         irg->adr_taken_state = state;
510 }  /* set_irg_address_taken_state */
511
512 /* Assure that the address taken flag is computed for the given graph. */
513 void assure_irg_address_taken_computed(ir_graph *irg) {
514         if (irg->adr_taken_state == ir_address_taken_not_computed)
515                 analyse_irg_address_taken(irg);
516 }  /* assure_irg_address_taken_computed */
517
518 /**
519  * Initialize the address_taken flag for a global type like type.
520  */
521 static void init_taken_flag(ir_type * tp) {
522         int i;
523
524         /* All external visible entities are at least
525            ir_address_taken_unknown. This is very conservative. */
526         for (i = get_compound_n_members(tp) - 1; i >= 0; --i) {
527                 ir_entity *ent = get_compound_member(tp, i);
528                 ir_address_taken_state state;
529
530                 state = get_entity_visibility(ent) == visibility_external_visible ?
531                                 ir_address_taken_unknown : ir_address_not_taken ;
532                 set_entity_address_taken(ent, state);
533         }
534 }  /* init_taken_flag */
535
536 /**
537  * Print the address taken state of all entities of a given type for debugging.
538  */
539 static void print_address_taken_state(ir_type *tp) {
540         int i;
541         for (i = get_compound_n_members(tp) - 1; i >= 0; --i) {
542                 ir_entity *ent = get_compound_member(tp, i);
543                 ir_address_taken_state state = get_entity_address_taken(ent);
544
545                 if (state != ir_address_not_taken) {
546                         assert(ir_address_not_taken <= state && state <= ir_address_taken);
547                         ir_printf("%+F: %s\n", ent, get_address_taken_state_name(state));
548                 }
549         }
550 }  /* print_address_taken_state */
551
552 /**
553  * Post-walker: check for global entity address
554  */
555 static void check_global_address(ir_node *irn, void *env) {
556         ir_node *tls = env;
557         ir_entity *ent;
558         ir_address_taken_state state;
559
560         if (is_SymConst(irn) && get_SymConst_kind(irn) == symconst_addr_ent) {
561                 /* A global. */
562                 ent = get_SymConst_entity(irn);
563         } else if (is_Sel(irn) && get_Sel_ptr(irn) == tls) {
564                 /* A TLS variable. */
565                 ent = get_SymConst_entity(irn);
566         } else
567                 return;
568
569         if (get_entity_address_taken(ent) == ir_address_not_taken) {
570                 /* Already at the maximum. */
571                 return;
572         }
573         state = find_address_taken_state(irn);
574         if (state > get_entity_address_taken(ent))
575                 set_entity_address_taken(ent, state);
576 }  /* check_global_address */
577
578 /**
579  * Update the "address taken" flag of all global entities.
580  */
581 static void analyse_irp_globals_address_taken(void) {
582         int i;
583
584         init_taken_flag(get_glob_type());
585         init_taken_flag(get_tls_type());
586
587         for (i = get_irp_n_irgs() - 1; i >= 0; --i) {
588                 ir_graph *irg = get_irp_irg(i);
589
590                 assure_irg_outs(irg);
591                 irg_walk_graph(irg, NULL, check_global_address, get_irg_tls(irg));
592         }
593         //print_address_taken_state(get_glob_type());
594         //print_address_taken_state(get_tls_type());
595
596         /* now computed */
597         irp->globals_adr_taken_state = ir_address_taken_computed;
598 }  /* analyse_irp_globals_address_taken */
599
600 /* Returns the current address taken state of the globals. */
601 ir_address_taken_computed_state get_irp_globals_address_taken_state(void) {
602         return irp->globals_adr_taken_state;
603 }  /* get_irp_globals_address_taken_state */
604
605 /* Sets the current address taken state of the graph. */
606 void set_irp_globals_address_taken_state(ir_address_taken_computed_state state) {
607         irp->globals_adr_taken_state = state;
608 }  /* set_irg_address_taken_state */
609
610 /* Assure that the address taken flag is computed for the globals. */
611 void assure_irp_globals_address_taken_computed(void) {
612         if (irp->globals_adr_taken_state == ir_address_taken_not_computed)
613                 analyse_irp_globals_address_taken();
614 }  /* assure_irp_globals_address_taken_computed */