fix a few warnings
[libfirm] / ir / opt / data_flow_scalar_replace.c
1 /*
2  * Copyright (C) 1995-2008 University of Karlsruhe.  All right reserved.
3  *
4  * This file is part of libFirm.
5  *
6  * This file may be distributed and/or modified under the terms of the
7  * GNU General Public License version 2 as published by the Free Software
8  * Foundation and appearing in the file LICENSE.GPL included in the
9  * packaging of this file.
10  *
11  * Licensees holding valid libFirm Professional Edition licenses may use
12  * this file in accordance with the libFirm Commercial License.
13  * Agreement provided with the Software.
14  *
15  * This file is provided AS IS with NO WARRANTY OF ANY KIND, INCLUDING THE
16  * WARRANTY OF DESIGN, MERCHANTABILITY AND FITNESS FOR A PARTICULAR
17  * PURPOSE.
18  */
19
20 /**
21  * @file
22  * @brief   scalar replacement of arrays and compounds
23  * @author  Beyhan Veliev, Michael Beck
24  * @version $Id$
25  */
26 #ifdef HAVE_CONFIG_H
27 #include "config.h"
28 #endif
29
30 #include "iroptimize.h"
31
32 #include <string.h>
33
34 #include "irflag_t.h"
35 #include "irouts.h"
36 #include "pset.h"
37 #include "ircons_t.h"
38 #include "hashptr.h"
39 #include "irgwalk.h"
40 #include "irnode_t.h"
41 #include "irtools.h"
42 #include "irdump.h"
43 #include "irloop.h"
44 #include "analyze_irg_args.h"
45 #include "irprintf.h"
46 #include "irgopt.h"
47 #include "xmalloc.h"
48
49 #define SET_ENT_VNUM(ent, vnum) set_entity_link(ent, INT_TO_PTR(vnum))
50 #define GET_ENT_VNUM(ent)       (unsigned)PTR_TO_INT(get_entity_link(ent))
51 #define SET_IRN_VNUM(irn, vnum) set_irn_link(irn, INT_TO_PTR(vnum))
52 #define GET_IRN_VNUM(irn)       (unsigned)PTR_TO_INT(get_irn_link(irn))
53 #define SYNCED    8
54
55
56 typedef struct _ent_leaves_t{
57   ir_entity *ent;             /**< An entity, that contains scalars for replace.*/
58   pset *leaves;               /**< All leaves of this entity.*/
59 } ent_leaves_t;
60
61 typedef struct _sels_t {
62   ir_node *sel;               /**< A sel node, thats entity have scalars.*/
63   ir_entity  *ent;            /**< The entity of this sel node.*/
64 }sels_t;
65
66 typedef struct _call_access_t {
67   ir_node *call;             /**< A call node, that have as parameter a scalar.*/
68   unsigned int access_type;  /**< The access type, with that this call access this scalar.*/
69 }call_access_t;
70
71 typedef struct _fixlist_entry_t {
72   ir_node *irn;             /**< An ir node, that must be fixed.*/
73   unsigned int vnum;        /**< The value number, that must became this ir node.*/
74 }fixlist_entry_t;
75
76 typedef struct _syncs_fixlist_entry_t {
77   ir_node *irn;             /**< A sync node that must be fixed.*/
78   int *accessed_vnum;       /**< A pointer to save an array with value numbers, that must became this sync.*/
79 }syncs_fixlist_entry_t;
80
81 /* A entry, that save the memory
82  * edge state and the access state for this leave
83  * int the array,that is created for every block.*/
84 typedef struct _leave_t {
85   ir_node *mem_edge_state;   /**< memory state for this scalar in this block.*/
86   unsigned int access_type;  /**< access state for this scalar in this block.*/
87   set *calls;                /**< call nodes,that change this scalar in this block.*/
88 }value_arr_entry_t;
89
90 /**
91  * A path element entry: it is either an entity
92  * or a tarval, because we evaluate only constant array
93  * accesses like a.b.c[8].d
94  */
95 typedef union {
96   ir_entity *ent;
97   tarval *tv;
98 } path_elem_t;
99
100 /**
101  * An access path, used to assign value numbers
102  * to variables that will be scalar replaced
103  */
104 typedef struct _path_t {
105   unsigned    vnum;      /**< the value number */
106   unsigned    path_len;  /**< the length of the access path */
107   path_elem_t path[1];   /**< the path */
108 } path_t;
109
110 /**
111  * environment for memory walker
112  */
113 typedef struct _env_t {
114   struct obstack obst;                   /**< a obstack for the memory edge */
115   set                   *set_sels;       /**< a set with all sels, that are reachable from an entity with a scalar.*/
116   set                   *set_ent;        /**< a set with all entities that have one or more scalars.*/
117   fixlist_entry_t       *fix_phis;       /**< list of all Phi nodes that must be fixed */
118   fixlist_entry_t       *fix_ls;         /**< list of all Load or Store nodes that must be fixed */
119   syncs_fixlist_entry_t *fix_syncs;      /**< list of all Sync nodes that must be fixed */
120   unsigned int          nvals;           /**< to save the number of scalars.*/
121   unsigned int          gl_mem_vnum;     /**< indicate the position of the globule memory edge state in var_arr.*/
122   unsigned int          vnum_state;      /**< indicate the position of the value number state in var_arr.*/
123   unsigned int          changes;         /**< to save if by anlyse_calls is changed anything.*/
124 } env_t;
125
126
127
128 /**
129  * Compare two elements of the ent_leaves_t set.
130  *
131  * @return 0 if they are identically
132  */
133 static int ent_leaves_t_cmp(const void *elt, const void *key, size_t size)
134 {
135   const ent_leaves_t *c1 = elt;
136   const ent_leaves_t *c2 = key;
137   (void) size;
138
139   return c1->ent != c2->ent;
140 }
141
142 /**
143  * Compare two elements of the ent_access_t set.
144  *
145  * @return 0 if they are identically
146  */
147 static int ent_cmp(const void *elt, const void *key)
148 {
149   const ir_entity *c1 = elt;
150   const ir_entity *c2 = key;
151
152   return c1 != c2;
153 }
154
155 /**
156  * Compare two elements of the sels_t set.
157  *
158  * @return 0 if they are identically
159  */
160 static int sels_cmp(const void *elt, const void *key, size_t size)
161 {
162   const sels_t *c1 = elt;
163   const sels_t *c2 = key;
164   (void) size;
165
166   return c1->sel != c2->sel;
167 }
168
169 /**
170  * Compare two elements of the leave_t set.
171  *
172  * @return 0 if they are identically
173  */
174 static int leave_cmp(const void *elt, const void *key)
175 {
176   ir_node *c1 = (ir_node *)elt;
177   ir_node *c2 = (ir_node *)key;
178
179   return get_Sel_entity(c1) != get_Sel_entity(c2);
180 }
181
182 /**
183  * Compare two elements of the call_access_t set.
184  *
185  * @return 0 if they are identically
186  */
187 static int call_cmp(const void *elt, const void *key, size_t size)
188 {
189   const call_access_t *c1 = elt;
190   const call_access_t *c2 = key;
191   (void) size;
192
193   return c1->call != c2->call;
194 }
195
196 /**
197  * Compare two paths.
198  *
199  * @return 0 if they are identically
200  */
201 static int path_cmp(const void *elt, const void *key, size_t size)
202 {
203   const path_t *p1 = elt;
204   const path_t *p2 = key;
205   (void) size;
206
207   /* we can use memcmp here, because identical tarvals should have identical addresses */
208   return memcmp(p1->path, p2->path, p1->path_len * sizeof(p1->path[0]));
209 }
210
211 /**
212  * Calculate a hash value for a path.
213  */
214 static unsigned path_hash(const path_t *path)
215 {
216   unsigned hash = 0;
217   unsigned i;
218
219   for (i = 0; i < path->path_len; ++i)
220     hash ^= (unsigned)PTR_TO_INT(path->path[i].ent);
221
222   return hash >> 4;
223 }
224
225 /**
226  * Returns non-zero, if all induces of a Sel node are constants.
227  *
228  * @param sel  the Sel node that will be checked
229  */
230 static int is_const_sel(ir_node *sel) {
231   int i, n = get_Sel_n_indexs(sel);
232
233   for (i = 0; i < n; ++i) {
234     ir_node *idx = get_Sel_index(sel, i);
235
236     if (get_irn_op(idx) != op_Const)
237       return 0;
238   }
239   return 1;
240 }
241
242 /**
243  * Returns non-zero, if the address of an entity
244  * represented by a Sel node (or it's successor Sels) is taken.
245  */
246 static int is_address_taken_2(ir_node *sel)
247 {
248   int i;
249
250   if (! is_const_sel(sel))
251     return 1;
252
253   for (i = get_irn_n_outs(sel) - 1; i >= 0; --i) {
254     ir_node *succ = get_irn_out(sel, i);
255
256     switch (get_irn_opcode(succ)) {
257     case iro_Load:
258       /* ok, we just load from that entity */
259       break;
260
261     case iro_Store:
262       /* check that Sel is not the Store's value */
263       if (get_Store_value(succ) == sel)
264         return 1;
265       break;
266
267     case iro_Sel: {
268       /* Check the Sel successor of Sel */
269       int res = is_address_taken_2(succ);
270
271       if (res)
272         return 1;
273       break;
274     }
275
276     case iro_Call:
277       /* The address of an entity is given as a parameter.
278        * We analyzes that later and optimizes this scalar
279        * if possible.
280        */
281       return 0;
282
283     default:
284       /* another op, the address is taken */
285       return 1;
286     }
287   }
288   return 0;
289 }
290
291 /**
292  * Link all Sels with the entity.
293  *
294  * @param ent  the entity that will be scalar replaced
295  * @param sel  a Sel node that selects some fields of this entity
296  */
297 static void link_all_leave_sels(ir_entity *ent, ir_node *sel)
298 {
299   int i, n;
300
301   n = get_irn_n_outs(sel);
302   for (i = 0; i < n; ++i) {
303     ir_node *succ = get_irn_out(sel, i);
304
305     if (get_irn_op(succ) == op_Sel)
306       link_all_leave_sels(ent, succ);
307
308   }
309
310    /* if Sel nodes with memory inputs are used, a entity can be
311     * visited more than once causing a ring here, so we use the
312     * node flag to mark linked nodes
313     */
314    if (irn_visited(sel))
315     return;
316
317   /*
318    * we link the sels to the entity.
319    */
320   set_irn_link(sel, get_entity_link(ent));
321   set_entity_link(ent, sel);
322
323   mark_irn_visited(sel);
324 }
325
326 /* we need a special address that serves as an address taken marker */
327 static char _x;
328 static void *ADDRESS_TAKEN = &_x;
329
330 /**
331  * Find possible scalar replacements.
332  *
333  * @param irg  an IR graph
334  *
335  * This function finds variables on the (members of the) frame type
336  * that can be scalar replaced, because their address is never taken.
337  * If such a variable is found, it's entity link will hold a list of all
338  * Sel nodes, that selects anythings of this entity.
339  * Otherwise, the link will be ADDRESS_TAKEN or NULL.
340  *
341  * @return  non-zero if at least one entity could be replaced
342  *          potentially
343  */
344 static int find_possible_replacements(ir_graph *irg)
345 {
346   ir_node *irg_frame = get_irg_frame(irg);
347   int i, n;
348   int res = 0;
349
350   inc_irg_visited(irg);
351
352   n = get_irn_n_outs(irg_frame);
353
354   /*
355    * First, clear the link field of all interestingentities.
356    * Note that we did not rely on the fact that there is only
357    * one Sel node per entity, so we might access one entity
358    * more than once here.
359    * That's why we have need two loops.
360    */
361   for (i = 0; i < n; ++i) {
362     ir_node *succ = get_irn_out(irg_frame, i);
363
364     if (get_irn_op(succ) == op_Sel) {
365       ir_entity *ent = get_Sel_entity(succ);
366       set_entity_link(ent, NULL);
367     }
368   }
369
370   /*
371    * Check the ir_graph for Sel nodes. If the entity of Sel
372    * isn't a scalar replacement set the link of this entity
373    * equal ADDRESS_TAKEN.
374    */
375   for (i = 0; i < n; ++i) {
376     ir_node *succ = get_irn_out(irg_frame, i);
377
378     if (get_irn_op(succ) == op_Sel) {
379       ir_entity *ent = get_Sel_entity(succ);
380       ir_type *ent_type;
381
382       if (get_entity_link(ent) == ADDRESS_TAKEN)
383         continue;
384
385       /*
386        * Beware: in rare cases even entities on the frame might be
387        * volatile. This might happen if the entity serves as a store
388        * to a value that must survive a exception. Do not optimize
389        * such entities away.
390        */
391       if (get_entity_volatility(ent) == volatility_is_volatile) {
392         set_entity_link(ent, ADDRESS_TAKEN);
393         continue;
394       }
395
396       ent_type = get_entity_type(ent);
397
398       /* we can handle arrays, structs and atomic types yet */
399       if (is_Array_type(ent_type) || is_Struct_type(ent_type) || is_atomic_type(ent_type)) {
400         if (is_address_taken_2(succ)) {
401           if (get_entity_link(ent)) /* killing one */
402             --res;
403           set_entity_link(ent, ADDRESS_TAKEN);
404         }
405         else {
406           /* possible found one */
407           if (get_entity_link(ent) == NULL)
408             ++res;
409           link_all_leave_sels(ent, succ);
410         }
411       }
412     }
413   }
414
415   return res;
416 }
417
418 static int is_leave_sel(ir_node *sel) {
419   int i;
420   ir_node *succ;
421
422   for(i = get_irn_n_outs(sel) - 1; i >= 0; i--) {
423     succ = get_irn_out(sel, i);
424     if(get_irn_op(succ) == op_Sel)
425       return 0;
426   }
427
428   return 1;
429 }
430
431 /**
432  * Return a path from the Sel node sel to it's root.
433  *
434  * @param sel  the Sel node
435  * @param len  the length of the path so far
436  */
437 static path_t *find_path(ir_node *sel, unsigned len)
438 {
439   int pos, i, n;
440   path_t *res;
441   ir_node *pred = get_Sel_ptr(sel);
442
443   /* the current Sel node will add some path elements */
444   n    = get_Sel_n_indexs(sel);
445   len += n + 1;
446
447   if (get_irn_op(pred) != op_Sel) {
448     /* we found the root */
449
450     res = xmalloc(sizeof(*res) + (len - 1) * sizeof(res->path));
451     res->path_len = len;
452   }
453   else
454     res = find_path(pred, len);
455
456   pos = res->path_len - len;
457
458   res->path[pos++].ent = get_Sel_entity(sel);
459   for (i = 0; i < n; ++i) {
460     ir_node *index = get_Sel_index(sel, i);
461
462     if(get_irn_op(index) == op_Const)
463       res->path[pos++].tv = get_Const_tarval(index);
464   }
465   return res;
466 }
467
468 /**
469  * Allocate value numbers for the leaves
470  * in our found entities.
471  *
472  * @param sels  a set that will contain all Sels that have a value number
473  * @param ent   the entity that will be scalar replaced
474  * @param vnum  the first value number we can assign
475  * @param modes a flexible array, containing all the modes of
476  *              the value numbers.
477  *
478  * @return the next free value number
479  */
480 static unsigned allocate_value_numbers(set *set_sels, pset *leaves, ir_entity *ent, unsigned vnum)
481 {
482   ir_node *sel, *next;
483   path_t *key, *path;
484   sels_t       key_sels;
485   set *pathes = new_set(path_cmp, 8);
486
487   /* visit all Sel nodes in the chain of the entity */
488   for (sel = get_entity_link(ent); sel; sel = next) {
489     next = get_irn_link(sel);
490
491     /* we save for every sel it root entity, why
492      * we need this information, when we split the memory edge,
493      * and we must mark this sel for later. */
494      key_sels.ent = ent;
495      key_sels.sel = sel;
496      set_insert(set_sels, &key_sels, sizeof(key_sels), HASH_PTR(sel));
497
498     if(! is_leave_sel(sel))
499       continue;
500     /* We have found a leave and we add it to the pset of this entity.*/
501     pset_insert(leaves, sel, HASH_PTR(get_Sel_entity(sel)));
502
503     key  = find_path(sel, 0);
504     path = set_find(pathes, key, sizeof(*key) + sizeof(key->path[0]) * key->path_len, path_hash(key));
505
506     if (path)
507       SET_IRN_VNUM(sel, path->vnum);
508     else {
509
510       key->vnum = vnum++;
511
512       set_insert(pathes, key, sizeof(*key) + sizeof(key->path[0]) * key->path_len, path_hash(key));
513
514       SET_IRN_VNUM(sel, key->vnum);
515     }
516     free(key);
517   }
518
519   del_set(pathes);
520   set_entity_link(ent, NULL);
521   return vnum;
522 }
523 /**
524  * Add a sync node to it fix list.
525  *
526  * @param sync     The sync node, that myst be addet to the fix list.
527  * @param unk_vnum An array whit the value number, that are synced with this sync node.
528  * @param env      The enviroment pinter.
529  */
530 static void add_sync_to_fixlist(ir_node *sync, int *unk_vnum, env_t *env) {
531
532    syncs_fixlist_entry_t *s;
533
534    s = obstack_alloc(&env->obst, sizeof(*s));
535    s->irn  = sync;
536    s->accessed_vnum = unk_vnum;
537    set_irn_link(sync, env->fix_syncs);
538    env->fix_syncs = s;
539 }
540 /**
541  * Add a ir node to it fix list.
542  *
543  * @param irn     The ir node, that myst be addet to the fix list.
544  * @param vnum    The value number, that must baceme this ir node as predecessor later.
545  * @param env     The enviroment pinter.
546  */
547 static void add_ls_to_fixlist(ir_node *irn, int vnum, env_t *env) {
548
549   fixlist_entry_t *l;
550
551   l = obstack_alloc(&env->obst, sizeof(*l));
552   l->irn  = irn;
553   l->vnum = vnum;
554
555   if(get_irn_op(irn) == op_Phi) {
556     set_irn_link(l->irn, env->fix_phis);
557     env->fix_phis = l;
558   }else {
559     set_irn_link(l->irn, env->fix_ls);
560     env->fix_ls = l;
561   }
562 }
563
564 static void add_mem_edge(value_arr_entry_t *val_arr, int vnum, ir_node ***in, int **accessed_vnum) {
565
566   if(val_arr[vnum].mem_edge_state != NULL)
567     ARR_APP1(ir_node *, *in, val_arr[vnum].mem_edge_state);
568   else {
569     ARR_APP1(int, *accessed_vnum, vnum);
570     ARR_APP1(ir_node *, *in, new_Unknown(mode_M));
571   }
572 }
573 /**
574  * The function handles the scalars, that wase stored
575  * in this block.
576  *
577  * @param blk    The block, that must be handled.
578  * @param env    The enviroment pinter.
579  */
580
581 /* Return the memory successor of the call node.*/
582 static ir_node *get_Call_mem_out(ir_node *call) {
583
584   int i;
585   ir_node *mem;
586
587   for(i = get_irn_n_outs(call) - 1; i >= 0; i--) {
588     mem = get_irn_out(call, i);
589     if(get_irn_mode(mem) == mode_M)
590       return mem;
591   }
592   /* is not reachable*/
593   return NULL;
594 }
595
596
597 static void sync_stored_scalars(ir_node *blk, env_t *env) {
598
599   int                   i;
600   int                   *unk_vnum;                   /**< An arraw, where are saved the value number, that
601                                                           are synced from this sync node.*/
602   ent_leaves_t          *value_ent;
603   value_arr_entry_t     *val_arr_blk, *val_arr;
604   ir_node               *pred, *leave, *sync, **in;
605   ir_node               *sync_blk;                     /**< The block, where the sync node must be created.*/
606
607
608   val_arr_blk = get_irn_link(blk);
609
610   for(value_ent = set_first(env->set_ent); value_ent; value_ent = set_next(env->set_ent)) {
611
612
613     if(val_arr_blk[GET_ENT_VNUM(value_ent->ent)].access_type <= 3)
614       /* This entity is not stored in this block.*/
615       continue;
616
617     for(i = get_Block_n_cfgpreds(blk) - 1; i >= 0; i--) {
618
619       pred = get_Block_cfgpred(blk, i);
620       pred = get_nodes_block(pred);
621       val_arr = get_irn_link(pred);
622
623       if(val_arr[GET_ENT_VNUM(value_ent->ent)].access_type == SYNCED)
624         /* This entity was synced.*/
625         continue;
626
627       if(val_arr[GET_ENT_VNUM(value_ent->ent)].access_type <= 3) {
628
629         /* To avoid repeated sync of this entity in this block.*/
630         val_arr[GET_ENT_VNUM(value_ent->ent)].access_type = SYNCED;
631         /* In this predecessor block is this entity not acessed.
632          * We must sync in the end ot this block.*/
633         if(get_Block_n_cfgpreds(blk) > 1)
634           sync_blk = get_nodes_block(get_Block_cfgpred(blk, i));
635         else
636           sync_blk = blk;
637
638         val_arr = get_irn_link(sync_blk);
639         /* An array to save the memory edges, that must be
640          * synced.*/
641         in = NEW_ARR_F(ir_node *, 1);
642
643         /* An array to save the value numbers,
644          * that must be repaired.*/
645         unk_vnum = NEW_ARR_F(int, 0);
646         /* The global memory edge.*/
647         if(val_arr[env->gl_mem_vnum].mem_edge_state == NULL)
648          in[0] = new_Unknown(mode_M);
649         else
650          in[0] = val_arr[env->gl_mem_vnum].mem_edge_state;
651
652         for(leave = pset_first(value_ent->leaves); leave; leave = pset_next(value_ent->leaves))
653           /* All this memory edges must be synced.*/
654           add_mem_edge(val_arr, GET_IRN_VNUM(leave), &in, &unk_vnum);
655
656         /* We create the sync and set it in the global memory state.*/
657         sync = new_r_Sync(current_ir_graph, sync_blk, ARR_LEN(in), in);
658         /* We must check this, why it is possible to get a Bad node
659          * form new_r_Sync(), when the node can be optimized.
660          * In this case we must do nothing.*/
661         if(get_irn_op(sync) == op_Sync)  {
662           val_arr[env->gl_mem_vnum].mem_edge_state = sync;
663           /* We add this sync node to the sync's fix list.*/
664           add_sync_to_fixlist(val_arr[env->gl_mem_vnum].mem_edge_state, unk_vnum, env);
665         }
666         DEL_ARR_F(in);
667       }
668     }
669   }
670 }
671 /**
672  * The function split the memory edge of load and store nodes, that have
673  * as predecessor a scalar
674  *
675  * @param irn   The node, that memory edge must be spleted.
676  * @param env   The enviroment pinter.
677  */
678 static void split_ls_mem_edge(ir_node *irn, env_t *env) {
679
680   ir_op              *op;
681   ir_node            *leave, *irn_blk, *mem_state, *new_mem_state;
682   unsigned           ent_vnum, sel_vnum, i;
683   value_arr_entry_t  *val_arr;
684   sels_t             key_sels, *value_sels;
685   ent_leaves_t       key_ent, *value_ent;
686
687   op = get_irn_op(irn);
688
689   if(op == op_Load)
690     key_sels.sel = get_Load_ptr(irn);
691   else
692     key_sels.sel = get_Store_ptr(irn);
693
694   value_sels = set_find(env->set_sels, &key_sels, sizeof(key_sels), HASH_PTR(key_sels.sel));
695
696   if(value_sels != NULL) {
697     /* we have found a load or store, that use a sel of our set
698      * and we must split or extend, if the memory edge have been
699      * split for this sel, the memory edge.*/
700
701     key_ent.ent = value_sels->ent;
702     value_ent = set_find(env->set_ent, &key_ent, sizeof(key_ent), HASH_PTR(key_ent.ent));
703     /*To check if the enities set is right filled. */
704     assert(value_ent && " This sel's entity isn't int the entity set.");
705
706     leave = pset_find(value_ent->leaves, key_sels.sel, HASH_PTR(get_Sel_entity(key_sels.sel)));
707     /*To check if the leaves set is right filled. */
708     assert(leave && "Anything in data_flow_scalar_replacment algorithm is wrong.");
709
710     ent_vnum = GET_ENT_VNUM(value_ent->ent);
711     sel_vnum = GET_IRN_VNUM(leave);
712     irn_blk = get_nodes_block(irn);
713     val_arr   = get_irn_link(irn_blk);
714
715     if(val_arr[ent_vnum].access_type == 0)
716       /* We have found a scalar, that address is not stored as jet.*/
717       i = sel_vnum;
718     else
719       /* This scalar have been stored.*/
720       i = env->gl_mem_vnum;
721
722     if(val_arr[i].mem_edge_state == NULL) {
723       /* We split now for this sel the memory edge in this block.*/
724       mem_state = new_Unknown(mode_M);
725       /* We must mark this node to fix later*/
726       add_ls_to_fixlist(irn, i, env);
727     }
728     else
729       /* We have split the memory edge and the current state is saved.*/
730       mem_state = val_arr[i].mem_edge_state;
731
732     /* We set this Load or Store to the memory edge of this
733      * sel.*/
734     if(op == op_Load)
735       set_Load_mem(irn, mem_state);
736     else
737       set_Store_mem(irn, mem_state);
738
739     /* When we have split or extended the memory edge we must
740      * update the memory_edge_state of this sel*/
741     new_mem_state = get_irn_out(irn, 0);
742     if(get_irn_mode(new_mem_state) == mode_M)
743       val_arr[i].mem_edge_state = new_mem_state;
744     else
745       val_arr[i].mem_edge_state = get_irn_out(irn, 1);
746   }
747 }
748
749 /**
750  * The function split the memory edge of phi nodes, that have
751  * as predecessor a scalar
752  *
753  * @param irn   The phi node, that memory edge must be spleted.
754  * @param env   The enviroment pinter.
755  */
756 static void split_phi_mem_edge(ir_node *irn, env_t *env) {
757
758   ir_node            *irn_blk, *unk, *leave, **in;
759   int                n, j;
760   ent_leaves_t       *value_ent;
761   value_arr_entry_t  *val_arr;
762
763   irn_blk = get_nodes_block(irn);
764   val_arr = get_irn_link(irn_blk);
765
766   n = get_Block_n_cfgpreds(irn_blk);
767
768   in = alloca(sizeof(*in) * n);
769
770   for(value_ent = set_first(env->set_ent); value_ent; value_ent = set_next(env->set_ent))
771      if(val_arr[GET_ENT_VNUM(value_ent->ent)].access_type < 3)
772        /* This scalar wasn't be saved and we need to produce a phi for it.*/
773        for(leave = pset_first(value_ent->leaves); leave; leave = pset_next(value_ent->leaves)){
774
775          unk = new_Unknown(mode_M);
776          for (j = n - 1; j >= 0; --j)
777            in[j] = unk;
778
779          val_arr[GET_IRN_VNUM(leave)].mem_edge_state = new_r_Phi(current_ir_graph, irn_blk, n, in, mode_M);
780
781          add_ls_to_fixlist(val_arr[GET_IRN_VNUM(leave)].mem_edge_state, GET_IRN_VNUM(leave), env);
782        }
783
784   /* We use for the global memory the phi node, that
785    * is already available.*/
786   val_arr[env->gl_mem_vnum].mem_edge_state = irn;
787 }
788
789 /**
790  * The function handles the call nodes, that have
791  * as parameter a scalar
792  *
793  * @param env                The enviroment pinter.
794  * @param call               The call node, that must be handled.
795  * @param accessed_entities  A set wit all entities, that are accessed from this call node.*/
796 static void split_call_mem_edge(env_t *env, ir_node *call, pset *accessed_entities) {
797
798   ent_leaves_t            key_ent, *value_ent;
799   value_arr_entry_t       *val_arr;
800   call_access_t           key_call, *value_call;
801   ir_node                 *call_blk, *new_mem_state, *leave;
802   ir_node                 *sync, **in;
803   ir_entity               *ent;
804   unsigned                ent_vnum;
805   int                     fix_irn = 0;                  /**< Set to 1 if we must add this call to it fix list.*/
806   int                     *accessed_leaves_vnum = NULL; /**< An arraw, where are saved the value number, that
807                                                              are synced from call's sync node, if we need it.*/
808
809   call_blk = get_nodes_block(call);
810   val_arr  = get_irn_link(call_blk);
811   /* An array to save the memory edges, that must be
812    * synced.*/
813   in       = NEW_ARR_F(ir_node *, 1);
814   /* An array to save the value numbers of the memory
815    * edges that must be repaired.*/
816   accessed_leaves_vnum = NEW_ARR_F(int, 0);
817
818   /* We get the memory successor of the call node.
819    * It is the new memory state for all synced memory
820    * edges.*/
821   new_mem_state = get_Call_mem_out(call);
822
823   /* The global memory is the first predecessor of the create sync node.*/
824   if(val_arr[env->gl_mem_vnum].mem_edge_state == NULL) {
825     in[0] = new_Unknown(mode_M);
826     fix_irn = 1;
827   }
828   else
829     in[0] = val_arr[env->gl_mem_vnum].mem_edge_state;
830
831
832   for(ent = pset_first(accessed_entities); ent; ent = pset_next(accessed_entities)) {
833     /* Whit this loop we iterate all accessed entities from this call and collect
834      * all memory edges, that we must sync.*/
835     ent_vnum = GET_ENT_VNUM(ent);
836
837     key_call.call = call;
838     value_call    = set_find(val_arr[ent_vnum].calls, &key_call, sizeof(key_call), HASH_PTR(key_call.call));
839
840     key_ent.ent   = ent;
841     value_ent     = set_find(env->set_ent, &key_ent, sizeof(key_ent), HASH_PTR(key_ent.ent));
842
843     if(val_arr[ent_vnum].access_type <= 3) {
844       /* This scalar's address wasn't stored in this block.*/
845       switch(value_call->access_type) {
846
847       case ptr_access_none :
848         /* In this case we have nothing to do.*/
849       break;
850
851       case ptr_access_read:
852       case ptr_access_write:
853       case ptr_access_rw:
854         /* All this cases must be traded equal.*/
855
856         for(leave = pset_first(value_ent->leaves); leave; leave = pset_next(value_ent->leaves)){
857           /* All this memory edges must be synced.*/
858           add_mem_edge(val_arr, GET_IRN_VNUM(leave), &in, &accessed_leaves_vnum);
859
860           /* We update the memory state of this leave.*/
861           if(value_call->access_type != ptr_access_read)
862            val_arr[GET_IRN_VNUM(leave)].mem_edge_state = new_mem_state;
863         }
864
865       /* We are ready.*/
866       break;
867       }
868     }
869   }
870
871   /* We must update the global memory state.*/
872   val_arr[env->gl_mem_vnum].mem_edge_state = new_mem_state;
873
874   if(ARR_LEN(in) == 1) {
875     /* we must set the call memory to gobale momory*/
876     set_Call_mem(call,in[0]);
877
878     if(fix_irn)
879       /* We add this call node to the call fix list..*/
880       add_ls_to_fixlist(call, env->gl_mem_vnum, env);
881
882   } else {
883    /* We create the sync and set it as memory predecessor of the call node.*/
884       sync = new_r_Sync(current_ir_graph, call_blk, ARR_LEN(in), in);
885       /* We must check this, why it is possible to get a Bad node
886        * form new_r_Sync(), when the node can be optimized.
887        * In this case we must do nothing.*/
888       if(get_irn_op(sync) == op_Sync) {
889
890         set_Call_mem(call, sync);
891         if(ARR_LEN(accessed_leaves_vnum))
892           /* We add this sync node to the sync's fix list.*/
893           add_sync_to_fixlist(sync, accessed_leaves_vnum, env);
894       }
895   }
896   DEL_ARR_F(in);
897 }
898
899 /**
900  * The function split the memory edge from the passed
901  * ir node if this is needed
902  *
903  * @param irn   The node, that memory edge must be spleted.
904  * @param env   The enviroment pinter.
905  */
906 static void split_memory_edge(ir_node *irn, void *ctx) {
907
908    env_t              *env = ctx;
909    ir_node            *sel, *irn_blk;
910    ir_op              *op;
911    sels_t             key_sels, *value_sels;
912    value_arr_entry_t  *val_arr;
913    pset               *accessed_entities;  /**< A set to save all entities accessed from a call.*/
914    int                i;
915
916
917    op = get_irn_op(irn);
918
919    if(op == op_Block)
920      irn_blk = irn;
921    else
922      irn_blk = get_nodes_block(irn);
923
924    if (Block_not_block_visited(irn_blk)) {
925     /* We sync first the stored scalar address in this block.*/
926     mark_Block_block_visited(irn_blk);
927     sync_stored_scalars(irn_blk, env);
928    }
929
930    if(op == op_Load || op == op_Store)
931
932       split_ls_mem_edge(irn, env);
933
934    else {
935       if (op == op_Phi && get_irn_mode(irn) == mode_M) {
936         /*
937          * found a memory Phi: Here, we must create new Phi nodes
938          */
939         split_phi_mem_edge(irn, env);
940       }
941       else {
942         if(op == op_Call) {
943
944           /* Calls that have a NoMem input do neither read nor write memory.
945              We can completely ignore them here. */
946           if (get_irn_op(get_Call_mem(irn)) == op_NoMem)
947             return;
948
949           /* We save in this set all entities,
950            * that are accessed from this call node.*/
951           accessed_entities = new_pset(ent_cmp, 8);
952           val_arr = get_irn_link(get_nodes_block(irn));
953
954           for ( i = get_Call_n_params(irn) - 1; i >= 0; i--) {
955
956             sel = get_Call_param(irn, i);
957             value_sels = NULL;
958             if(get_irn_op(sel) == op_Sel) {
959               key_sels.sel = sel;
960               value_sels   = set_find(env->set_sels, &key_sels, sizeof(key_sels), HASH_PTR(key_sels.sel));
961
962             if(value_sels != NULL && val_arr[GET_ENT_VNUM(value_sels->ent)].access_type <= 3)
963               /* We save in this set all accessed entities from this call node whit
964                * access none, read, write or rw..*/
965               pset_insert(accessed_entities, value_sels->ent, HASH_PTR(value_sels->ent));
966             }
967           }
968
969           if(pset_count(accessed_entities))
970              split_call_mem_edge(env, irn, accessed_entities);
971
972           del_pset(accessed_entities);
973         }
974       }
975    }
976 }
977
978 /**
979  * searches through blocks beginning from block for value
980  * vnum and return it.
981  *
982  * @param block A block from the current ir graph.
983  * @param vnum  The value number, that must be found.
984  */
985 static ir_node *find_vnum_value(ir_node *block, unsigned vnum)
986 {
987   value_arr_entry_t *val_arr;
988   int               i;
989   ir_node           *res;
990
991   if (Block_not_block_visited(block)) {
992     mark_Block_block_visited(block);
993
994     val_arr = get_irn_link(block);
995
996     if (val_arr[vnum].mem_edge_state)
997       return val_arr[vnum].mem_edge_state;
998
999     for (i = get_Block_n_cfgpreds(block) - 1; i >= 0; --i) {
1000       ir_node *pred = get_Block_cfgpred(block, i);
1001
1002       res = find_vnum_value(get_nodes_block(pred), vnum);
1003       if (res)
1004         return res;
1005     }
1006   }
1007   return NULL;
1008 }
1009
1010 /**
1011  * fix the Load/Store or Call list
1012  *
1013  * @param The enviroment pinter.
1014  */
1015 static void fix_ls(env_t *env)
1016 {
1017   fixlist_entry_t *l;
1018   ir_node      *irn, *block, *pred, *val = NULL;
1019   ir_op        *op;
1020   int          i;
1021
1022   for (l = env->fix_ls; l; l = get_irn_link(irn)) {
1023     irn = l->irn;
1024
1025     op     = get_irn_op(irn);
1026     block  = get_nodes_block(irn);
1027     for (i = get_Block_n_cfgpreds(block) - 1; i >= 0; --i) {
1028       pred = get_Block_cfgpred(block, i);
1029       pred = get_nodes_block(pred);
1030
1031       inc_irg_block_visited(current_ir_graph);
1032       val = find_vnum_value(pred, l->vnum);
1033
1034       if (val)
1035         break;
1036     }
1037
1038     if(val) {
1039       if(op == op_Store)
1040         set_Store_mem(irn, val);
1041       else
1042         if(op == op_Load)
1043           set_Load_mem(irn, val);
1044         else
1045           set_Call_mem(irn, val);
1046     }
1047   }
1048 }
1049
1050 /**
1051  * fix the Phi list
1052  *
1053  * @param The enviroment pinter.
1054  */
1055 static void fix_phis(env_t *env)
1056 {
1057   fixlist_entry_t *l;
1058   ir_node         *phi, *block, *pred, *val;
1059   int             i;
1060
1061   for (l = env->fix_phis; l; l = get_irn_link(phi)) {
1062     phi = l->irn;
1063
1064     block = get_nodes_block(phi);
1065     for (i = get_Block_n_cfgpreds(block) - 1; i >= 0; --i) {
1066
1067       pred = get_Block_cfgpred(block, i);
1068       pred = get_nodes_block(pred);
1069
1070       inc_irg_block_visited(current_ir_graph);
1071       val = find_vnum_value(pred, l->vnum);
1072
1073       if (val)
1074         set_irn_n(phi, i, val);
1075     }
1076   }
1077 }
1078
1079
1080 /**
1081  * fix the Sync list
1082  *
1083  * @param The enviroment pinter.
1084  */
1085 static void fix_syncs(env_t *env)
1086 {
1087   syncs_fixlist_entry_t *l;
1088   ir_node               *sync, *block, *pred, *val;
1089   int                   i, k;
1090
1091
1092   for (l = env->fix_syncs; l; l = get_irn_link(sync)) {
1093     sync = l->irn;
1094     k = 0;
1095
1096     /* The sync block must have one predecessor, when it
1097        have unknown nodes as predecessor.*/
1098     block = get_nodes_block(sync);
1099     pred  = get_Block_cfgpred(block, 0);
1100     pred  = get_nodes_block(pred);
1101
1102     /* We first repair the global memory edge at the first position of sync predecessors.*/
1103     if(get_irn_op(get_irn_n(sync, 0)) == op_Unknown) {
1104       inc_irg_block_visited(current_ir_graph);
1105       val = find_vnum_value(pred, env->gl_mem_vnum);
1106
1107       if(val)
1108         set_irn_n(sync, 0, val);
1109     }
1110
1111     for (i = get_irn_arity(sync) - 1; i >= 1; --i) {
1112       /* We repair the leaves*/
1113
1114       assert(k <= ARR_LEN(l->accessed_vnum) && "The algorythm for sync repair is wron");
1115       if(get_irn_op(get_irn_n(sync, i)) == op_Unknown) {
1116         inc_irg_block_visited(current_ir_graph);
1117         val = find_vnum_value(pred, l->accessed_vnum[k++]);
1118
1119         if(val)
1120           set_irn_n(sync, i, val);
1121       }
1122     }
1123     DEL_ARR_F(l->accessed_vnum);
1124   }
1125 }
1126 /**
1127  * For the end node we must sync all memory edges.
1128  *
1129  * @param The enviroment pinter.
1130  */
1131 static void sync_mem_edges(env_t *env) {
1132
1133   value_arr_entry_t *val_arr;
1134   ir_node           **in, *sync, *Return, *Return_blk;
1135   int               i, vnum, vnum_state;
1136
1137   Return     = get_Block_cfgpred(get_irg_end_block(current_ir_graph), 0);
1138   Return_blk = get_nodes_block(Return);
1139   val_arr    = get_irn_link(Return_blk);
1140
1141   vnum_state = 0;
1142
1143   for(i = 0; i <= (int)env->gl_mem_vnum; i++)
1144     /* we get the current state of non saved scalars.*/
1145     if(val_arr[i].access_type <= 3)
1146       vnum_state++;
1147
1148   /* We allocate the memory, that we need for the predecessors of the sync.*/
1149   in     = xmalloc(sizeof(ir_node*) *vnum_state);
1150
1151   /* The global memory edge is the first predecessor of this sync node.*/
1152   if(val_arr[env->gl_mem_vnum].mem_edge_state == NULL) {
1153     /* We must search through blocks for this memory state.*/
1154     inc_irg_block_visited(current_ir_graph);
1155     in[0] = find_vnum_value(Return_blk, env->gl_mem_vnum);
1156   }
1157   else
1158     in[0] = val_arr[env->gl_mem_vnum].mem_edge_state;
1159
1160
1161   for(i = 1, vnum = 0; vnum < (int)env->gl_mem_vnum; vnum++) {
1162
1163     if(val_arr[vnum].access_type <= 3) {
1164       /* we add the non saved scalars as predecessors of the sync.*/
1165
1166       if(val_arr[vnum].mem_edge_state == NULL) {
1167         /* We must search through blocks for this memory state.*/
1168         inc_irg_block_visited(current_ir_graph);
1169         in[i] = find_vnum_value(Return_blk, vnum);
1170       }
1171       else
1172         in[i] = val_arr[vnum].mem_edge_state;
1173       i++;
1174     }
1175   }
1176
1177   sync = new_r_Sync(current_ir_graph, Return_blk, vnum_state, in);
1178   set_Return_mem(Return, sync);
1179
1180   free(in);
1181 }
1182
1183 /**
1184  * Walker: allocate the value array for every block.
1185  *
1186  * @param block  A block from the current ir graph for that must be allocated a value array.
1187  * @param ctx    The enviroment pinter.
1188  */
1189 static void alloc_value_arr(ir_node *block, void *ctx)
1190 {
1191   env_t *env = ctx;
1192   int   i;
1193
1194   value_arr_entry_t *var_arr = obstack_alloc(&env->obst, sizeof(value_arr_entry_t) *(env->nvals + set_count(env->set_ent) + 1));
1195
1196   /* the value array is empty at start */
1197   memset(var_arr, 0, sizeof(value_arr_entry_t) * (env->nvals + set_count(env->set_ent) + 1));
1198   set_irn_link(block, var_arr);
1199
1200  /* We set the block value number state to optimal and later we update this.*/
1201   var_arr[env->vnum_state].access_type = env->nvals;
1202
1203   if(get_irg_start_block(current_ir_graph) == block)
1204     /* We initilize the startblocks array with the irg initilize memory, why
1205      * it must be the start point of all memory edges.*/
1206     for(i = (env->nvals + set_count(env->set_ent)) ; i >=0; i--)
1207       var_arr[i].mem_edge_state = get_irg_initial_mem(current_ir_graph);
1208
1209 }
1210
1211 /* Analyze call nodes to get information, if they store the address of a scalar.
1212  *
1213  * @param *irn   An ir node from the current_ir_graph.
1214  * @param *env   The enviroment pointer.
1215 */
1216 static void analyse_calls(ir_node *irn, void *ctx) {
1217
1218   int                 i, vnum;
1219   unsigned int        acces_type;
1220   ir_node             *param, *call_ptr, *blk;
1221   ir_op               *op;
1222   ir_entity           *meth_ent;
1223   sels_t              key_sels, *value_sels;
1224   call_access_t       key_call, *value_call;
1225   value_arr_entry_t   *val_arr;
1226   env_t               *env;
1227
1228   env = ctx;
1229   if(get_irn_op(irn) != op_Call)
1230     return;
1231
1232   /* Calls that have a NoMem input do neither read nor write memory.
1233      We can completely ignore them here. */
1234   if (get_irn_op(get_Call_mem(irn)) == op_NoMem)
1235     return;
1236
1237   /* We iterate over the parameters of this call nodes.*/
1238   for ( i = get_Call_n_params(irn) - 1; i >= 0; i--) {
1239     param = get_Call_param(irn, i);
1240     if(get_irn_op(param) == op_Sel) {
1241       /* We have found a parameter with operation sel.*/
1242       key_sels.sel = param;
1243       value_sels   = set_find(env->set_sels, &key_sels, sizeof(key_sels), HASH_PTR(key_sels.sel));
1244       if(value_sels != NULL ) {
1245
1246         /* We have found a call, that have as parameter a sel from our set_sels.*/
1247         call_ptr = get_Call_ptr(irn);
1248         op = get_irn_op(call_ptr);
1249
1250         if(op == op_SymConst && get_SymConst_kind(call_ptr) == symconst_addr_ent) {
1251           meth_ent = get_SymConst_entity(call_ptr);
1252           /* we get the access type for our sel.*/
1253           acces_type = get_method_param_access(meth_ent, i);
1254         } else
1255           /* We can't analyze this function and we asume, that it store the address.*/
1256           acces_type = ptr_access_store;
1257
1258         /* we save the access type and this call in the array allocated for this block.
1259          * The value number of this entity get us the position in the array to save this
1260          * information. Why we expect more calls as one we allocate a set.*/
1261         vnum    = GET_ENT_VNUM(value_sels->ent);
1262         blk     = get_nodes_block(irn);
1263         val_arr = get_irn_link(blk);
1264
1265         if(val_arr[vnum].access_type > 3)
1266           /* The address of this entity have been stored.*/
1267           continue;
1268
1269         if(val_arr[vnum].calls == NULL)
1270           /* for this entity i have found the firs call in this block and we must allocate the set.*/
1271           val_arr[vnum].calls = new_set(call_cmp, 8);
1272
1273           /* This call performs anything with the scalar and we must mark it.*/
1274           key_call.call = irn;
1275           key_call.access_type = acces_type;
1276           value_call = set_insert(val_arr[vnum].calls, &key_call, sizeof(key_call), HASH_PTR(key_call.call));
1277
1278         if(value_call->access_type < acces_type)
1279           /* this case tread, when a call access an entity more at once.
1280            * Than we must save the highest access type.*/
1281           value_call->access_type = acces_type;
1282
1283         if(acces_type > 3)
1284           /* This call save the address of our scalar and we can't
1285            * use the scalars of this entity for optimization as from now.
1286            * we mark this.*/
1287           val_arr[vnum].access_type = acces_type;
1288       }
1289     }
1290   }
1291 }
1292
1293 static int set_block_dominated_first_access(ir_node *blk, int vnum, unsigned int access) {
1294
1295   ir_node *idom, *succ;
1296   value_arr_entry_t *val_arr;
1297   int i, changes = 0;
1298
1299   idom = get_Block_idom(blk);
1300   for(i = get_Block_n_cfg_outs(idom) - 1; i >=1; i--) {
1301     succ = get_Block_cfg_out(idom, i);
1302     val_arr  = get_irn_link(succ);
1303     if(val_arr[vnum].access_type < 3) {
1304       val_arr[vnum].access_type = access;
1305       changes++;
1306     }
1307   }
1308   return changes;
1309 }
1310 /* Update the access information of a block if a predecessor of
1311  * this black have a higher access for an entity.
1312  *
1313  * @param *irn   An ir node from the current_ir_graph.
1314  * @param *env   The enviroment pointer.
1315  */
1316 static void set_block_access(ir_node *irn, void *ctx){
1317
1318   value_arr_entry_t *val_arr, *val_arr_pred;
1319   ent_leaves_t      *value_leaves;
1320   ir_node           *pred, *pred_blk, *leave;
1321   env_t             *env;
1322   int               i, vnum;
1323
1324   env     = ctx;
1325   val_arr = get_irn_link(irn);
1326
1327   for( i = get_Block_n_cfgpreds(irn) - 1; i >= 0; i--) {
1328     /* We analyze the predecessors of this block to see if this block must
1329      * be updated.*/
1330     pred = get_Block_cfgpred(irn, i);
1331     pred_blk = get_nodes_block(pred);
1332
1333     val_arr_pred = get_irn_link(pred_blk);
1334
1335     for(value_leaves = set_first(env->set_ent); value_leaves; value_leaves = set_next(env->set_ent)) {
1336       vnum = GET_ENT_VNUM(value_leaves->ent);
1337
1338       if((get_Block_n_cfgpreds(irn) > 1) && (val_arr[vnum].access_type > 3))
1339         env->changes =  set_block_dominated_first_access(irn, vnum, val_arr[vnum].access_type);
1340
1341       if((val_arr_pred[vnum].access_type > 3) && (val_arr[vnum].access_type < 3)) {
1342         /* We have found a block for update it access and value number information.*/
1343         val_arr[vnum].access_type = val_arr_pred[vnum].access_type;
1344         /* We update the access information of all leave, that belong to
1345          * this entity.*/
1346
1347         for(leave = pset_first(value_leaves->leaves); leave; leave = pset_next(value_leaves->leaves))
1348           val_arr[GET_IRN_VNUM(leave)].access_type = val_arr[vnum].access_type;
1349
1350         /* In this way can't be got the actuall number of value numbers.
1351         val_arr[env->vnum_state].access_type = val_arr_pred[env->vnum_state].access_type; */
1352         env->changes++;
1353       }
1354     }
1355   }
1356 }
1357 /* Free the allocated call sets.
1358  *
1359  * @param irn  A block form the ir graph.
1360  * @param env  The enviroment pinter.
1361  */
1362 static void free_call_info(ir_node *irn, void *ctx) {
1363
1364   int i;
1365   env_t             *env;
1366   value_arr_entry_t *val_arr;
1367
1368   env     = ctx;
1369   val_arr = get_irn_link(irn);
1370
1371   for(i = env->nvals + set_count(env->set_ent); i >= 0; i--) {
1372     if(val_arr[i].calls != NULL)
1373
1374       del_set(val_arr[i].calls);
1375   }
1376 }
1377
1378 static void print_block_state(ir_node *irn, void *ctx) {
1379
1380   value_arr_entry_t  *val_arr;
1381   ent_leaves_t       *value_leaves;
1382   call_access_t      *value_calls;
1383   env_t              *env;
1384   int                vnum;
1385
1386   env     = ctx;
1387   val_arr = get_irn_link(irn);
1388   ir_printf("\n\nThe actual value number state of this block is: %i \n",
1389             val_arr[env->vnum_state].access_type - 1);
1390
1391   for(value_leaves = set_first(env->set_ent); value_leaves; value_leaves = set_next(env->set_ent)) {
1392
1393     vnum = GET_ENT_VNUM(value_leaves->ent);
1394     ir_printf("The entity %F access type in the block with nr %u is %i \n",
1395               value_leaves->ent, get_irn_node_nr(irn), val_arr[vnum].access_type);
1396
1397     if(val_arr[vnum].calls != NULL)
1398       for(value_calls = set_first(val_arr[vnum].calls); value_calls; value_calls = set_next(val_arr[vnum].calls))
1399
1400         ir_printf("A call with nr %i acess a element of this entity with access %u \n",
1401                   get_irn_node_nr(value_calls->call), value_calls->access_type);
1402   }
1403
1404 }
1405
1406 /** Optimize the found scalar replacements.
1407 *
1408 * @param set_sels  A set with all entities, that
1409 *                  have scala(s).
1410 * @param set_ent   A set with all sels nodes,
1411 *                  that belong to our scalars.
1412 * @param vnum      The number of scalars.
1413 */
1414 static void do_data_flow_scalar_replacement(set *set_ent, set *set_sels, int vnum) {
1415
1416   env_t env;
1417
1418   obstack_init(&env.obst);
1419   env.set_ent     = set_ent;
1420   env.set_sels    = set_sels;
1421   env.fix_ls      = NULL;
1422   env.fix_phis    = NULL;
1423   env.fix_syncs   = NULL;
1424   env.gl_mem_vnum = vnum - 2;
1425   env.vnum_state  = vnum - 1;
1426   /* nvals are vnum - 1, why we indicate with nvals the number
1427    * of memory edges we will produce. For vnum_state we don't
1428    * need to produce a memory edge.*/
1429   env.nvals       = vnum - 1;
1430   env.changes     = 1;
1431
1432   /* first step: allocate the value arrays for every block */
1433   irg_block_walk_graph(current_ir_graph, NULL, alloc_value_arr, &env);
1434
1435   /* second step: we analyze all calls, that have as parameter scalar(s).
1436    * We mark the calls, that save the address of a scalar and we
1437    * mark the entity owner of this scalar as not optimizeble by now.*/
1438   irg_walk_graph(current_ir_graph, NULL, analyse_calls, &env);
1439
1440   while(env.changes) {
1441
1442
1443     env.changes  = 0;
1444     /*
1445     * third step: walk over the blocks of a graph and update
1446     * the information for the access of our scalars.
1447     */
1448     irg_block_walk_graph(current_ir_graph, NULL, set_block_access, &env);
1449
1450   }
1451
1452   // if(get_firm_verbosity())
1453     /* Debug info to see if analyse_calls work properly.*/
1454     irg_block_walk_graph(current_ir_graph, NULL, print_block_state, &env);
1455
1456   /*
1457    * fourth step: walk over the graph blockwise in topological order
1458    * and split the memrory edge.
1459    */
1460   inc_irg_block_visited(current_ir_graph);
1461   irg_walk_blkwise_graph(current_ir_graph, NULL, split_memory_edge, &env);
1462
1463
1464
1465   /* fifth step: fix all nodes, that have as predecessor Unknown.*/
1466   fix_ls(&env);
1467   fix_phis(&env);
1468   fix_syncs(&env);
1469
1470   /* sixth step: sync memory enges for the end block.*/
1471   sync_mem_edges(&env);
1472
1473   /*seventh step: free the allocated memory*/
1474   irg_block_walk_graph(current_ir_graph, NULL, free_call_info, &env);
1475   obstack_free(&env.obst, NULL);
1476 }
1477
1478 /*
1479  * Find possible scalar replacements
1480  *
1481  * @param irg  The current ir graph.
1482  */
1483 void data_flow_scalar_replacement_opt(ir_graph *irg) {
1484
1485   int          i, vnum = 0;
1486   ir_node      *irg_frame;
1487   set          *set_sels;
1488   set          *set_ent;
1489   ent_leaves_t key_leaves, *value_leaves;
1490
1491
1492   if (! get_opt_scalar_replacement())
1493     return;
1494
1495   set_sels = new_set(sels_cmp, 8);
1496   set_ent  = new_set(ent_leaves_t_cmp, 8);
1497
1498   /* Call algorithm that remove the critical edges of a ir graph. */
1499   remove_critical_cf_edges(irg);
1500
1501   /* Call algorithm that computes the out edges.*/
1502   assure_irg_outs(irg);
1503
1504   /* Call algorithm that computes the loop information.*/
1505   construct_cf_backedges(irg);
1506
1507   /* Call algorithm that computes the dominance information.*/
1508   assure_doms(irg);
1509
1510   /* Find possible scalar replacements */
1511   if (find_possible_replacements(irg)) {
1512
1513     /* Insert in set the scalar replacements. */
1514     irg_frame = get_irg_frame(irg);
1515
1516     for (i = 0 ; i < get_irn_n_outs(irg_frame); i++) {
1517       ir_node *succ = get_irn_out(irg_frame, i);
1518
1519       if (get_irn_op(succ) == op_Sel) {
1520         ir_entity *ent = get_Sel_entity(succ);
1521
1522         if (get_entity_link(ent) == NULL || get_entity_link(ent) == ADDRESS_TAKEN)
1523           continue;
1524         /* we have found a entity, that have scalars and we insert it to our set_ent*/
1525         key_leaves.ent = ent;
1526         key_leaves.leaves = new_pset(leave_cmp, 8);
1527         value_leaves = set_insert(set_ent, &key_leaves, sizeof(key_leaves), HASH_PTR(ent));
1528
1529         /* We allocate for every leave sel a vnum.*/
1530         vnum = allocate_value_numbers(set_sels, value_leaves->leaves, ent, vnum);
1531       }
1532     }
1533
1534     /* Allocate value number for the globule memory edge.
1535      * and a value number for the value numbers state.*/
1536     vnum = vnum + 2;
1537
1538     /* Allocate value numbers for the entities .*/
1539     for(i = vnum,value_leaves = set_first(set_ent); value_leaves; i++, value_leaves = set_next(set_ent))
1540       SET_ENT_VNUM(value_leaves->ent, i);
1541
1542     if (vnum)
1543       do_data_flow_scalar_replacement(set_ent, set_sels, vnum);
1544
1545     /*free the allocated memory.*/
1546     for(value_leaves = set_first(set_ent); value_leaves; value_leaves = set_next(set_ent))
1547       del_pset(value_leaves->leaves);
1548     del_set(set_ent);
1549     del_set(set_sels);
1550   }
1551 }