- more work on the Unknown problems: the only
[libfirm] / ir / opt / data_flow_scalar_replace.c
1 /*
2  * Copyright (C) 1995-2008 University of Karlsruhe.  All right reserved.
3  *
4  * This file is part of libFirm.
5  *
6  * This file may be distributed and/or modified under the terms of the
7  * GNU General Public License version 2 as published by the Free Software
8  * Foundation and appearing in the file LICENSE.GPL included in the
9  * packaging of this file.
10  *
11  * Licensees holding valid libFirm Professional Edition licenses may use
12  * this file in accordance with the libFirm Commercial License.
13  * Agreement provided with the Software.
14  *
15  * This file is provided AS IS with NO WARRANTY OF ANY KIND, INCLUDING THE
16  * WARRANTY OF DESIGN, MERCHANTABILITY AND FITNESS FOR A PARTICULAR
17  * PURPOSE.
18  */
19
20 /**
21  * @file
22  * @brief   scalar replacement of arrays and compounds
23  * @author  Beyhan Veliev, Michael Beck
24  * @version $Id$
25  */
26 #include "config.h"
27
28 #include "iroptimize.h"
29
30 #include <string.h>
31
32 #include "irflag_t.h"
33 #include "irouts.h"
34 #include "pset.h"
35 #include "ircons_t.h"
36 #include "hashptr.h"
37 #include "irgwalk.h"
38 #include "irnode_t.h"
39 #include "irtools.h"
40 #include "irdump.h"
41 #include "irloop.h"
42 #include "analyze_irg_args.h"
43 #include "irprintf.h"
44 #include "irgopt.h"
45 #include "xmalloc.h"
46
47 #define SET_ENT_VNUM(ent, vnum) set_entity_link(ent, INT_TO_PTR(vnum))
48 #define GET_ENT_VNUM(ent)       (unsigned)PTR_TO_INT(get_entity_link(ent))
49 #define SET_IRN_VNUM(irn, vnum) set_irn_link(irn, INT_TO_PTR(vnum))
50 #define GET_IRN_VNUM(irn)       (unsigned)PTR_TO_INT(get_irn_link(irn))
51 #define SYNCED    8
52
53
54 typedef struct _ent_leaves_t{
55   ir_entity *ent;             /**< An entity, that contains scalars for replace.*/
56   pset *leaves;               /**< All leaves of this entity.*/
57 } ent_leaves_t;
58
59 typedef struct _sels_t {
60   ir_node *sel;               /**< A sel node, thats entity have scalars.*/
61   ir_entity  *ent;            /**< The entity of this sel node.*/
62 }sels_t;
63
64 typedef struct _call_access_t {
65   ir_node *call;             /**< A call node, that have as parameter a scalar.*/
66   unsigned int access_type;  /**< The access type, with that this call access this scalar.*/
67 }call_access_t;
68
69 typedef struct _fixlist_entry_t {
70   ir_node *irn;             /**< An ir node, that must be fixed.*/
71   unsigned int vnum;        /**< The value number, that must became this ir node.*/
72 }fixlist_entry_t;
73
74 typedef struct _syncs_fixlist_entry_t {
75   ir_node *irn;             /**< A sync node that must be fixed.*/
76   int *accessed_vnum;       /**< A pointer to save an array with value numbers, that must became this sync.*/
77 }syncs_fixlist_entry_t;
78
79 /* A entry, that save the memory
80  * edge state and the access state for this leave
81  * int the array,that is created for every block.*/
82 typedef struct _leave_t {
83   ir_node *mem_edge_state;   /**< memory state for this scalar in this block.*/
84   unsigned int access_type;  /**< access state for this scalar in this block.*/
85   set *calls;                /**< call nodes,that change this scalar in this block.*/
86 }value_arr_entry_t;
87
88 /**
89  * A path element entry: it is either an entity
90  * or a tarval, because we evaluate only constant array
91  * accesses like a.b.c[8].d
92  */
93 typedef union {
94   ir_entity *ent;
95   tarval *tv;
96 } path_elem_t;
97
98 /**
99  * An access path, used to assign value numbers
100  * to variables that will be scalar replaced
101  */
102 typedef struct _path_t {
103   unsigned    vnum;      /**< the value number */
104   unsigned    path_len;  /**< the length of the access path */
105   path_elem_t path[1];   /**< the path */
106 } path_t;
107
108 /**
109  * environment for memory walker
110  */
111 typedef struct _env_t {
112   struct obstack obst;                   /**< a obstack for the memory edge */
113   set                   *set_sels;       /**< a set with all sels, that are reachable from an entity with a scalar.*/
114   set                   *set_ent;        /**< a set with all entities that have one or more scalars.*/
115   fixlist_entry_t       *fix_phis;       /**< list of all Phi nodes that must be fixed */
116   fixlist_entry_t       *fix_ls;         /**< list of all Load or Store nodes that must be fixed */
117   syncs_fixlist_entry_t *fix_syncs;      /**< list of all Sync nodes that must be fixed */
118   unsigned int          nvals;           /**< to save the number of scalars.*/
119   unsigned int          gl_mem_vnum;     /**< indicate the position of the globule memory edge state in var_arr.*/
120   unsigned int          vnum_state;      /**< indicate the position of the value number state in var_arr.*/
121   unsigned int          changes;         /**< to save if by anlyse_calls is changed anything.*/
122 } env_t;
123
124
125
126 /**
127  * Compare two elements of the ent_leaves_t set.
128  *
129  * @return 0 if they are identically
130  */
131 static int ent_leaves_t_cmp(const void *elt, const void *key, size_t size)
132 {
133   const ent_leaves_t *c1 = elt;
134   const ent_leaves_t *c2 = key;
135   (void) size;
136
137   return c1->ent != c2->ent;
138 }
139
140 /**
141  * Compare two elements of the ent_access_t set.
142  *
143  * @return 0 if they are identically
144  */
145 static int ent_cmp(const void *elt, const void *key)
146 {
147   const ir_entity *c1 = elt;
148   const ir_entity *c2 = key;
149
150   return c1 != c2;
151 }
152
153 /**
154  * Compare two elements of the sels_t set.
155  *
156  * @return 0 if they are identically
157  */
158 static int sels_cmp(const void *elt, const void *key, size_t size)
159 {
160   const sels_t *c1 = elt;
161   const sels_t *c2 = key;
162   (void) size;
163
164   return c1->sel != c2->sel;
165 }
166
167 /**
168  * Compare two elements of the leave_t set.
169  *
170  * @return 0 if they are identically
171  */
172 static int leave_cmp(const void *elt, const void *key)
173 {
174   ir_node *c1 = (ir_node *)elt;
175   ir_node *c2 = (ir_node *)key;
176
177   return get_Sel_entity(c1) != get_Sel_entity(c2);
178 }
179
180 /**
181  * Compare two elements of the call_access_t set.
182  *
183  * @return 0 if they are identically
184  */
185 static int call_cmp(const void *elt, const void *key, size_t size)
186 {
187   const call_access_t *c1 = elt;
188   const call_access_t *c2 = key;
189   (void) size;
190
191   return c1->call != c2->call;
192 }
193
194 /**
195  * Compare two paths.
196  *
197  * @return 0 if they are identically
198  */
199 static int path_cmp(const void *elt, const void *key, size_t size)
200 {
201   const path_t *p1 = elt;
202   const path_t *p2 = key;
203   (void) size;
204
205   /* we can use memcmp here, because identical tarvals should have identical addresses */
206   return memcmp(p1->path, p2->path, p1->path_len * sizeof(p1->path[0]));
207 }
208
209 /**
210  * Calculate a hash value for a path.
211  */
212 static unsigned path_hash(const path_t *path)
213 {
214   unsigned hash = 0;
215   unsigned i;
216
217   for (i = 0; i < path->path_len; ++i)
218     hash ^= (unsigned)PTR_TO_INT(path->path[i].ent);
219
220   return hash >> 4;
221 }
222
223 /**
224  * Returns non-zero, if all induces of a Sel node are constants.
225  *
226  * @param sel  the Sel node that will be checked
227  */
228 static int is_const_sel(ir_node *sel) {
229   int i, n = get_Sel_n_indexs(sel);
230
231   for (i = 0; i < n; ++i) {
232     ir_node *idx = get_Sel_index(sel, i);
233
234     if (!is_Const(idx))
235       return 0;
236   }
237   return 1;
238 }
239
240 /**
241  * Returns non-zero, if the address of an entity
242  * represented by a Sel node (or it's successor Sels) is taken.
243  */
244 static int is_address_taken_2(ir_node *sel)
245 {
246   int i;
247
248   if (! is_const_sel(sel))
249     return 1;
250
251   for (i = get_irn_n_outs(sel) - 1; i >= 0; --i) {
252     ir_node *succ = get_irn_out(sel, i);
253
254     switch (get_irn_opcode(succ)) {
255     case iro_Load:
256       /* ok, we just load from that entity */
257       break;
258
259     case iro_Store:
260       /* check that Sel is not the Store's value */
261       if (get_Store_value(succ) == sel)
262         return 1;
263       break;
264
265     case iro_Sel: {
266       /* Check the Sel successor of Sel */
267       int res = is_address_taken_2(succ);
268
269       if (res)
270         return 1;
271       break;
272     }
273
274     case iro_Call:
275       /* The address of an entity is given as a parameter.
276        * We analyzes that later and optimizes this scalar
277        * if possible.
278        */
279       return 0;
280
281     default:
282       /* another op, the address is taken */
283       return 1;
284     }
285   }
286   return 0;
287 }
288
289 /**
290  * Link all Sels with the entity.
291  *
292  * @param ent  the entity that will be scalar replaced
293  * @param sel  a Sel node that selects some fields of this entity
294  */
295 static void link_all_leave_sels(ir_entity *ent, ir_node *sel)
296 {
297   int i, n;
298
299   n = get_irn_n_outs(sel);
300   for (i = 0; i < n; ++i) {
301     ir_node *succ = get_irn_out(sel, i);
302
303     if (is_Sel(succ))
304       link_all_leave_sels(ent, succ);
305   }
306
307    /* if Sel nodes with memory inputs are used, a entity can be
308     * visited more than once causing a ring here, so we use the
309     * node flag to mark linked nodes
310     */
311    if (irn_visited_else_mark(sel))
312     return;
313
314   /*
315    * we link the sels to the entity.
316    */
317   set_irn_link(sel, get_entity_link(ent));
318   set_entity_link(ent, sel);
319 }
320
321 /* we need a special address that serves as an address taken marker */
322 static char _x;
323 static void *ADDRESS_TAKEN = &_x;
324
325 /**
326  * Find possible scalar replacements.
327  *
328  * @param irg  an IR graph
329  *
330  * This function finds variables on the (members of the) frame type
331  * that can be scalar replaced, because their address is never taken.
332  * If such a variable is found, it's entity link will hold a list of all
333  * Sel nodes, that selects anythings of this entity.
334  * Otherwise, the link will be ADDRESS_TAKEN or NULL.
335  *
336  * @return  non-zero if at least one entity could be replaced
337  *          potentially
338  */
339 static int find_possible_replacements(ir_graph *irg)
340 {
341   ir_node *irg_frame = get_irg_frame(irg);
342   int i, n;
343   int res = 0;
344
345   inc_irg_visited(irg);
346
347   n = get_irn_n_outs(irg_frame);
348
349   /*
350    * First, clear the link field of all interestingentities.
351    * Note that we did not rely on the fact that there is only
352    * one Sel node per entity, so we might access one entity
353    * more than once here.
354    * That's why we have need two loops.
355    */
356   for (i = 0; i < n; ++i) {
357     ir_node *succ = get_irn_out(irg_frame, i);
358
359     if (is_Sel(succ)) {
360       ir_entity *ent = get_Sel_entity(succ);
361       set_entity_link(ent, NULL);
362     }
363   }
364
365   /*
366    * Check the ir_graph for Sel nodes. If the entity of Sel
367    * isn't a scalar replacement set the link of this entity
368    * equal ADDRESS_TAKEN.
369    */
370   for (i = 0; i < n; ++i) {
371     ir_node *succ = get_irn_out(irg_frame, i);
372
373     if (is_Sel(succ)) {
374       ir_entity *ent = get_Sel_entity(succ);
375       ir_type *ent_type;
376
377       if (get_entity_link(ent) == ADDRESS_TAKEN)
378         continue;
379
380       /*
381        * Beware: in rare cases even entities on the frame might be
382        * volatile. This might happen if the entity serves as a store
383        * to a value that must survive a exception. Do not optimize
384        * such entities away.
385        */
386       if (get_entity_volatility(ent) == volatility_is_volatile) {
387         set_entity_link(ent, ADDRESS_TAKEN);
388         continue;
389       }
390
391       ent_type = get_entity_type(ent);
392
393       /* we can handle arrays, structs and atomic types yet */
394       if (is_Array_type(ent_type) || is_Struct_type(ent_type) || is_atomic_type(ent_type)) {
395         if (is_address_taken_2(succ)) {
396           if (get_entity_link(ent)) /* killing one */
397             --res;
398           set_entity_link(ent, ADDRESS_TAKEN);
399         }
400         else {
401           /* possible found one */
402           if (get_entity_link(ent) == NULL)
403             ++res;
404           link_all_leave_sels(ent, succ);
405         }
406       }
407     }
408   }
409
410   return res;
411 }
412
413 static int is_leave_sel(ir_node *sel) {
414   int i;
415   ir_node *succ;
416
417   for(i = get_irn_n_outs(sel) - 1; i >= 0; i--) {
418     succ = get_irn_out(sel, i);
419     if (is_Sel(succ))
420       return 0;
421   }
422
423   return 1;
424 }
425
426 /**
427  * Return a path from the Sel node sel to it's root.
428  *
429  * @param sel  the Sel node
430  * @param len  the length of the path so far
431  */
432 static path_t *find_path(ir_node *sel, unsigned len)
433 {
434   int pos, i, n;
435   path_t *res;
436   ir_node *pred = get_Sel_ptr(sel);
437
438   /* the current Sel node will add some path elements */
439   n    = get_Sel_n_indexs(sel);
440   len += n + 1;
441
442   if (!is_Sel(pred)) {
443     /* we found the root */
444     res = XMALLOCF(path_t, path, len);
445     res->path_len = len;
446   }
447   else
448     res = find_path(pred, len);
449
450   pos = res->path_len - len;
451
452   res->path[pos++].ent = get_Sel_entity(sel);
453   for (i = 0; i < n; ++i) {
454     ir_node *index = get_Sel_index(sel, i);
455
456     if (is_Const(index))
457       res->path[pos++].tv = get_Const_tarval(index);
458   }
459   return res;
460 }
461
462 /**
463  * Allocate value numbers for the leaves
464  * in our found entities.
465  *
466  * @param sels  a set that will contain all Sels that have a value number
467  * @param ent   the entity that will be scalar replaced
468  * @param vnum  the first value number we can assign
469  * @param modes a flexible array, containing all the modes of
470  *              the value numbers.
471  *
472  * @return the next free value number
473  */
474 static unsigned allocate_value_numbers(set *set_sels, pset *leaves, ir_entity *ent, unsigned vnum)
475 {
476   ir_node *sel, *next;
477   path_t *key, *path;
478   sels_t       key_sels;
479   set *pathes = new_set(path_cmp, 8);
480
481   /* visit all Sel nodes in the chain of the entity */
482   for (sel = get_entity_link(ent); sel; sel = next) {
483     next = get_irn_link(sel);
484
485     /* we save for every sel it root entity, why
486      * we need this information, when we split the memory edge,
487      * and we must mark this sel for later. */
488      key_sels.ent = ent;
489      key_sels.sel = sel;
490      set_insert(set_sels, &key_sels, sizeof(key_sels), HASH_PTR(sel));
491
492     if(! is_leave_sel(sel))
493       continue;
494     /* We have found a leave and we add it to the pset of this entity.*/
495     pset_insert(leaves, sel, HASH_PTR(get_Sel_entity(sel)));
496
497     key  = find_path(sel, 0);
498     path = set_find(pathes, key, sizeof(*key) + sizeof(key->path[0]) * key->path_len, path_hash(key));
499
500     if (path)
501       SET_IRN_VNUM(sel, path->vnum);
502     else {
503
504       key->vnum = vnum++;
505
506       set_insert(pathes, key, sizeof(*key) + sizeof(key->path[0]) * key->path_len, path_hash(key));
507
508       SET_IRN_VNUM(sel, key->vnum);
509     }
510     free(key);
511   }
512
513   del_set(pathes);
514   set_entity_link(ent, NULL);
515   return vnum;
516 }
517 /**
518  * Add a sync node to it fix list.
519  *
520  * @param sync     The sync node, that myst be addet to the fix list.
521  * @param unk_vnum An array whit the value number, that are synced with this sync node.
522  * @param env      The enviroment pinter.
523  */
524 static void add_sync_to_fixlist(ir_node *sync, int *unk_vnum, env_t *env) {
525
526    syncs_fixlist_entry_t *s;
527
528    s = obstack_alloc(&env->obst, sizeof(*s));
529    s->irn  = sync;
530    s->accessed_vnum = unk_vnum;
531    set_irn_link(sync, env->fix_syncs);
532    env->fix_syncs = s;
533 }
534 /**
535  * Add a ir node to it fix list.
536  *
537  * @param irn     The ir node, that myst be addet to the fix list.
538  * @param vnum    The value number, that must baceme this ir node as predecessor later.
539  * @param env     The enviroment pinter.
540  */
541 static void add_ls_to_fixlist(ir_node *irn, int vnum, env_t *env) {
542
543   fixlist_entry_t *l;
544
545   l = obstack_alloc(&env->obst, sizeof(*l));
546   l->irn  = irn;
547   l->vnum = vnum;
548
549   if(get_irn_op(irn) == op_Phi) {
550     set_irn_link(l->irn, env->fix_phis);
551     env->fix_phis = l;
552   }else {
553     set_irn_link(l->irn, env->fix_ls);
554     env->fix_ls = l;
555   }
556 }
557
558 static void add_mem_edge(value_arr_entry_t *val_arr, int vnum, ir_node ***in, int **accessed_vnum) {
559
560   if(val_arr[vnum].mem_edge_state != NULL)
561     ARR_APP1(ir_node *, *in, val_arr[vnum].mem_edge_state);
562   else {
563     ARR_APP1(int, *accessed_vnum, vnum);
564     ARR_APP1(ir_node *, *in, new_Unknown(mode_M));
565   }
566 }
567 /**
568  * The function handles the scalars, that wase stored
569  * in this block.
570  *
571  * @param blk    The block, that must be handled.
572  * @param env    The enviroment pinter.
573  */
574
575 /* Return the memory successor of the call node.*/
576 static ir_node *get_Call_mem_out(ir_node *call) {
577
578   int i;
579   ir_node *mem;
580
581   for(i = get_irn_n_outs(call) - 1; i >= 0; i--) {
582     mem = get_irn_out(call, i);
583     if(get_irn_mode(mem) == mode_M)
584       return mem;
585   }
586   /* is not reachable*/
587   return NULL;
588 }
589
590
591 static void sync_stored_scalars(ir_node *blk, env_t *env) {
592
593   int                   i;
594   int                   *unk_vnum;                   /**< An arraw, where are saved the value number, that
595                                                           are synced from this sync node.*/
596   ent_leaves_t          *value_ent;
597   value_arr_entry_t     *val_arr_blk, *val_arr;
598   ir_node               *pred, *leave, *sync, **in;
599   ir_node               *sync_blk;                     /**< The block, where the sync node must be created.*/
600
601
602   val_arr_blk = get_irn_link(blk);
603
604   for(value_ent = set_first(env->set_ent); value_ent; value_ent = set_next(env->set_ent)) {
605
606
607     if(val_arr_blk[GET_ENT_VNUM(value_ent->ent)].access_type <= 3)
608       /* This entity is not stored in this block.*/
609       continue;
610
611     for(i = get_Block_n_cfgpreds(blk) - 1; i >= 0; i--) {
612
613       pred = get_Block_cfgpred(blk, i);
614       pred = get_nodes_block(pred);
615       val_arr = get_irn_link(pred);
616
617       if(val_arr[GET_ENT_VNUM(value_ent->ent)].access_type == SYNCED)
618         /* This entity was synced.*/
619         continue;
620
621       if(val_arr[GET_ENT_VNUM(value_ent->ent)].access_type <= 3) {
622
623         /* To avoid repeated sync of this entity in this block.*/
624         val_arr[GET_ENT_VNUM(value_ent->ent)].access_type = SYNCED;
625         /* In this predecessor block is this entity not acessed.
626          * We must sync in the end ot this block.*/
627         if(get_Block_n_cfgpreds(blk) > 1)
628           sync_blk = get_nodes_block(get_Block_cfgpred(blk, i));
629         else
630           sync_blk = blk;
631
632         val_arr = get_irn_link(sync_blk);
633         /* An array to save the memory edges, that must be
634          * synced.*/
635         in = NEW_ARR_F(ir_node *, 1);
636
637         /* An array to save the value numbers,
638          * that must be repaired.*/
639         unk_vnum = NEW_ARR_F(int, 0);
640         /* The global memory edge.*/
641         if(val_arr[env->gl_mem_vnum].mem_edge_state == NULL)
642          in[0] = new_Unknown(mode_M);
643         else
644          in[0] = val_arr[env->gl_mem_vnum].mem_edge_state;
645
646         for(leave = pset_first(value_ent->leaves); leave; leave = pset_next(value_ent->leaves))
647           /* All this memory edges must be synced.*/
648           add_mem_edge(val_arr, GET_IRN_VNUM(leave), &in, &unk_vnum);
649
650         /* We create the sync and set it in the global memory state.*/
651         sync = new_r_Sync(current_ir_graph, sync_blk, ARR_LEN(in), in);
652         /* We must check this, why it is possible to get a Bad node
653          * form new_r_Sync(), when the node can be optimized.
654          * In this case we must do nothing.*/
655         if (is_Sync(sync))  {
656           val_arr[env->gl_mem_vnum].mem_edge_state = sync;
657           /* We add this sync node to the sync's fix list.*/
658           add_sync_to_fixlist(val_arr[env->gl_mem_vnum].mem_edge_state, unk_vnum, env);
659         }
660         DEL_ARR_F(in);
661       }
662     }
663   }
664 }
665 /**
666  * The function split the memory edge of load and store nodes, that have
667  * as predecessor a scalar
668  *
669  * @param irn   The node, that memory edge must be spleted.
670  * @param env   The enviroment pinter.
671  */
672 static void split_ls_mem_edge(ir_node *irn, env_t *env) {
673
674   ir_op              *op;
675   ir_node            *leave, *irn_blk, *mem_state, *new_mem_state;
676   unsigned           ent_vnum, sel_vnum, i;
677   value_arr_entry_t  *val_arr;
678   sels_t             key_sels, *value_sels;
679   ent_leaves_t       key_ent, *value_ent;
680
681   op = get_irn_op(irn);
682
683   if(op == op_Load)
684     key_sels.sel = get_Load_ptr(irn);
685   else
686     key_sels.sel = get_Store_ptr(irn);
687
688   value_sels = set_find(env->set_sels, &key_sels, sizeof(key_sels), HASH_PTR(key_sels.sel));
689
690   if(value_sels != NULL) {
691     /* we have found a load or store, that use a sel of our set
692      * and we must split or extend, if the memory edge have been
693      * split for this sel, the memory edge.*/
694
695     key_ent.ent = value_sels->ent;
696     value_ent = set_find(env->set_ent, &key_ent, sizeof(key_ent), HASH_PTR(key_ent.ent));
697     /*To check if the enities set is right filled. */
698     assert(value_ent && " This sel's entity isn't int the entity set.");
699
700     leave = pset_find(value_ent->leaves, key_sels.sel, HASH_PTR(get_Sel_entity(key_sels.sel)));
701     /*To check if the leaves set is right filled. */
702     assert(leave && "Anything in data_flow_scalar_replacment algorithm is wrong.");
703
704     ent_vnum = GET_ENT_VNUM(value_ent->ent);
705     sel_vnum = GET_IRN_VNUM(leave);
706     irn_blk = get_nodes_block(irn);
707     val_arr   = get_irn_link(irn_blk);
708
709     if(val_arr[ent_vnum].access_type == 0)
710       /* We have found a scalar, that address is not stored as jet.*/
711       i = sel_vnum;
712     else
713       /* This scalar have been stored.*/
714       i = env->gl_mem_vnum;
715
716     if(val_arr[i].mem_edge_state == NULL) {
717       /* We split now for this sel the memory edge in this block.*/
718       mem_state = new_Unknown(mode_M);
719       /* We must mark this node to fix later*/
720       add_ls_to_fixlist(irn, i, env);
721     }
722     else
723       /* We have split the memory edge and the current state is saved.*/
724       mem_state = val_arr[i].mem_edge_state;
725
726     /* We set this Load or Store to the memory edge of this
727      * sel.*/
728     if(op == op_Load)
729       set_Load_mem(irn, mem_state);
730     else
731       set_Store_mem(irn, mem_state);
732
733     /* When we have split or extended the memory edge we must
734      * update the memory_edge_state of this sel*/
735     new_mem_state = get_irn_out(irn, 0);
736     if(get_irn_mode(new_mem_state) == mode_M)
737       val_arr[i].mem_edge_state = new_mem_state;
738     else
739       val_arr[i].mem_edge_state = get_irn_out(irn, 1);
740   }
741 }
742
743 /**
744  * The function split the memory edge of phi nodes, that have
745  * as predecessor a scalar
746  *
747  * @param irn   The phi node, that memory edge must be spleted.
748  * @param env   The enviroment pinter.
749  */
750 static void split_phi_mem_edge(ir_node *irn, env_t *env) {
751
752   ir_node            *irn_blk, *unk, *leave, **in;
753   int                n, j;
754   ent_leaves_t       *value_ent;
755   value_arr_entry_t  *val_arr;
756
757   irn_blk = get_nodes_block(irn);
758   val_arr = get_irn_link(irn_blk);
759
760   n  = get_Block_n_cfgpreds(irn_blk);
761   in = ALLOCAN(ir_node*, n);
762
763   for(value_ent = set_first(env->set_ent); value_ent; value_ent = set_next(env->set_ent))
764      if(val_arr[GET_ENT_VNUM(value_ent->ent)].access_type < 3)
765        /* This scalar wasn't be saved and we need to produce a phi for it.*/
766        for(leave = pset_first(value_ent->leaves); leave; leave = pset_next(value_ent->leaves)){
767
768          unk = new_Unknown(mode_M);
769          for (j = n - 1; j >= 0; --j)
770            in[j] = unk;
771
772          val_arr[GET_IRN_VNUM(leave)].mem_edge_state = new_r_Phi(current_ir_graph, irn_blk, n, in, mode_M);
773
774          add_ls_to_fixlist(val_arr[GET_IRN_VNUM(leave)].mem_edge_state, GET_IRN_VNUM(leave), env);
775        }
776
777   /* We use for the global memory the phi node, that
778    * is already available.*/
779   val_arr[env->gl_mem_vnum].mem_edge_state = irn;
780 }
781
782 /**
783  * The function handles the call nodes, that have
784  * as parameter a scalar
785  *
786  * @param env                The enviroment pinter.
787  * @param call               The call node, that must be handled.
788  * @param accessed_entities  A set wit all entities, that are accessed from this call node.*/
789 static void split_call_mem_edge(env_t *env, ir_node *call, pset *accessed_entities) {
790
791   ent_leaves_t            key_ent, *value_ent;
792   value_arr_entry_t       *val_arr;
793   call_access_t           key_call, *value_call;
794   ir_node                 *call_blk, *new_mem_state, *leave;
795   ir_node                 *sync, **in;
796   ir_entity               *ent;
797   unsigned                ent_vnum;
798   int                     fix_irn = 0;                  /**< Set to 1 if we must add this call to it fix list.*/
799   int                     *accessed_leaves_vnum = NULL; /**< An arraw, where are saved the value number, that
800                                                              are synced from call's sync node, if we need it.*/
801
802   call_blk = get_nodes_block(call);
803   val_arr  = get_irn_link(call_blk);
804   /* An array to save the memory edges, that must be
805    * synced.*/
806   in       = NEW_ARR_F(ir_node *, 1);
807   /* An array to save the value numbers of the memory
808    * edges that must be repaired.*/
809   accessed_leaves_vnum = NEW_ARR_F(int, 0);
810
811   /* We get the memory successor of the call node.
812    * It is the new memory state for all synced memory
813    * edges.*/
814   new_mem_state = get_Call_mem_out(call);
815
816   /* The global memory is the first predecessor of the create sync node.*/
817   if(val_arr[env->gl_mem_vnum].mem_edge_state == NULL) {
818     in[0] = new_Unknown(mode_M);
819     fix_irn = 1;
820   }
821   else
822     in[0] = val_arr[env->gl_mem_vnum].mem_edge_state;
823
824
825   for(ent = pset_first(accessed_entities); ent; ent = pset_next(accessed_entities)) {
826     /* Whit this loop we iterate all accessed entities from this call and collect
827      * all memory edges, that we must sync.*/
828     ent_vnum = GET_ENT_VNUM(ent);
829
830     key_call.call = call;
831     value_call    = set_find(val_arr[ent_vnum].calls, &key_call, sizeof(key_call), HASH_PTR(key_call.call));
832
833     key_ent.ent   = ent;
834     value_ent     = set_find(env->set_ent, &key_ent, sizeof(key_ent), HASH_PTR(key_ent.ent));
835
836     if(val_arr[ent_vnum].access_type <= 3) {
837       /* This scalar's address wasn't stored in this block.*/
838       switch(value_call->access_type) {
839
840       case ptr_access_none :
841         /* In this case we have nothing to do.*/
842       break;
843
844       case ptr_access_read:
845       case ptr_access_write:
846       case ptr_access_rw:
847         /* All this cases must be traded equal.*/
848
849         for(leave = pset_first(value_ent->leaves); leave; leave = pset_next(value_ent->leaves)){
850           /* All this memory edges must be synced.*/
851           add_mem_edge(val_arr, GET_IRN_VNUM(leave), &in, &accessed_leaves_vnum);
852
853           /* We update the memory state of this leave.*/
854           if(value_call->access_type != ptr_access_read)
855            val_arr[GET_IRN_VNUM(leave)].mem_edge_state = new_mem_state;
856         }
857
858       /* We are ready.*/
859       break;
860       }
861     }
862   }
863
864   /* We must update the global memory state.*/
865   val_arr[env->gl_mem_vnum].mem_edge_state = new_mem_state;
866
867   if(ARR_LEN(in) == 1) {
868     /* we must set the call memory to gobale momory*/
869     set_Call_mem(call,in[0]);
870
871     if(fix_irn)
872       /* We add this call node to the call fix list..*/
873       add_ls_to_fixlist(call, env->gl_mem_vnum, env);
874
875   } else {
876    /* We create the sync and set it as memory predecessor of the call node.*/
877       sync = new_r_Sync(current_ir_graph, call_blk, ARR_LEN(in), in);
878       /* We must check this, why it is possible to get a Bad node
879        * form new_r_Sync(), when the node can be optimized.
880        * In this case we must do nothing.*/
881       if (is_Sync(sync)) {
882         set_Call_mem(call, sync);
883         if(ARR_LEN(accessed_leaves_vnum))
884           /* We add this sync node to the sync's fix list.*/
885           add_sync_to_fixlist(sync, accessed_leaves_vnum, env);
886       }
887   }
888   DEL_ARR_F(in);
889 }
890
891 /**
892  * The function split the memory edge from the passed
893  * ir node if this is needed
894  *
895  * @param irn   The node, that memory edge must be spleted.
896  * @param env   The enviroment pinter.
897  */
898 static void split_memory_edge(ir_node *irn, void *ctx) {
899
900    env_t              *env = ctx;
901    ir_node            *sel, *irn_blk;
902    ir_op              *op;
903    sels_t             key_sels, *value_sels;
904    value_arr_entry_t  *val_arr;
905    pset               *accessed_entities;  /**< A set to save all entities accessed from a call.*/
906    int                i;
907
908
909    op = get_irn_op(irn);
910
911    if(op == op_Block)
912      irn_blk = irn;
913    else
914      irn_blk = get_nodes_block(irn);
915
916    if (!Block_block_visited(irn_blk)) {
917     /* We sync first the stored scalar address in this block.*/
918     mark_Block_block_visited(irn_blk);
919     sync_stored_scalars(irn_blk, env);
920    }
921
922    if(op == op_Load || op == op_Store)
923
924       split_ls_mem_edge(irn, env);
925
926    else {
927       if (op == op_Phi && get_irn_mode(irn) == mode_M) {
928         /*
929          * found a memory Phi: Here, we must create new Phi nodes
930          */
931         split_phi_mem_edge(irn, env);
932       }
933       else {
934         if(op == op_Call) {
935
936           /* Calls that have a NoMem input do neither read nor write memory.
937              We can completely ignore them here. */
938           if (is_NoMem(get_Call_mem(irn)))
939             return;
940
941           /* We save in this set all entities,
942            * that are accessed from this call node.*/
943           accessed_entities = new_pset(ent_cmp, 8);
944           val_arr = get_irn_link(get_nodes_block(irn));
945
946           for ( i = get_Call_n_params(irn) - 1; i >= 0; i--) {
947
948             sel = get_Call_param(irn, i);
949             value_sels = NULL;
950             if (is_Sel(sel)) {
951               key_sels.sel = sel;
952               value_sels   = set_find(env->set_sels, &key_sels, sizeof(key_sels), HASH_PTR(key_sels.sel));
953
954             if(value_sels != NULL && val_arr[GET_ENT_VNUM(value_sels->ent)].access_type <= 3)
955               /* We save in this set all accessed entities from this call node whit
956                * access none, read, write or rw..*/
957               pset_insert(accessed_entities, value_sels->ent, HASH_PTR(value_sels->ent));
958             }
959           }
960
961           if(pset_count(accessed_entities))
962              split_call_mem_edge(env, irn, accessed_entities);
963
964           del_pset(accessed_entities);
965         }
966       }
967    }
968 }
969
970 /**
971  * searches through blocks beginning from block for value
972  * vnum and return it.
973  *
974  * @param block A block from the current ir graph.
975  * @param vnum  The value number, that must be found.
976  */
977 static ir_node *find_vnum_value(ir_node *block, unsigned vnum)
978 {
979   value_arr_entry_t *val_arr;
980   int               i;
981   ir_node           *res;
982
983   if (!Block_block_visited(block)) {
984     mark_Block_block_visited(block);
985
986     val_arr = get_irn_link(block);
987
988     if (val_arr[vnum].mem_edge_state)
989       return val_arr[vnum].mem_edge_state;
990
991     for (i = get_Block_n_cfgpreds(block) - 1; i >= 0; --i) {
992       ir_node *pred = get_Block_cfgpred(block, i);
993
994       res = find_vnum_value(get_nodes_block(pred), vnum);
995       if (res)
996         return res;
997     }
998   }
999   return NULL;
1000 }
1001
1002 /**
1003  * fix the Load/Store or Call list
1004  *
1005  * @param The enviroment pinter.
1006  */
1007 static void fix_ls(env_t *env)
1008 {
1009   fixlist_entry_t *l;
1010   ir_node      *irn, *block, *pred, *val = NULL;
1011   ir_op        *op;
1012   int          i;
1013
1014   for (l = env->fix_ls; l; l = get_irn_link(irn)) {
1015     irn = l->irn;
1016
1017     op     = get_irn_op(irn);
1018     block  = get_nodes_block(irn);
1019     for (i = get_Block_n_cfgpreds(block) - 1; i >= 0; --i) {
1020       pred = get_Block_cfgpred(block, i);
1021       pred = get_nodes_block(pred);
1022
1023       inc_irg_block_visited(current_ir_graph);
1024       val = find_vnum_value(pred, l->vnum);
1025
1026       if (val)
1027         break;
1028     }
1029
1030     if(val) {
1031       if(op == op_Store)
1032         set_Store_mem(irn, val);
1033       else
1034         if(op == op_Load)
1035           set_Load_mem(irn, val);
1036         else
1037           set_Call_mem(irn, val);
1038     }
1039   }
1040 }
1041
1042 /**
1043  * fix the Phi list
1044  *
1045  * @param The enviroment pinter.
1046  */
1047 static void fix_phis(env_t *env)
1048 {
1049   fixlist_entry_t *l;
1050   ir_node         *phi, *block, *pred, *val;
1051   int             i;
1052
1053   for (l = env->fix_phis; l; l = get_irn_link(phi)) {
1054     phi = l->irn;
1055
1056     block = get_nodes_block(phi);
1057     for (i = get_Block_n_cfgpreds(block) - 1; i >= 0; --i) {
1058
1059       pred = get_Block_cfgpred(block, i);
1060       pred = get_nodes_block(pred);
1061
1062       inc_irg_block_visited(current_ir_graph);
1063       val = find_vnum_value(pred, l->vnum);
1064
1065       if (val)
1066         set_irn_n(phi, i, val);
1067     }
1068   }
1069 }
1070
1071
1072 /**
1073  * fix the Sync list
1074  *
1075  * @param The enviroment pinter.
1076  */
1077 static void fix_syncs(env_t *env)
1078 {
1079   syncs_fixlist_entry_t *l;
1080   ir_node               *sync, *block, *pred, *val;
1081   int                   i, k;
1082
1083
1084   for (l = env->fix_syncs; l; l = get_irn_link(sync)) {
1085     sync = l->irn;
1086     k = 0;
1087
1088     /* The sync block must have one predecessor, when it
1089        have unknown nodes as predecessor.*/
1090     block = get_nodes_block(sync);
1091     pred  = get_Block_cfgpred(block, 0);
1092     pred  = get_nodes_block(pred);
1093
1094     /* We first repair the global memory edge at the first position of sync predecessors.*/
1095     if (is_Unknown(get_irn_n(sync, 0))) {
1096       inc_irg_block_visited(current_ir_graph);
1097       val = find_vnum_value(pred, env->gl_mem_vnum);
1098
1099       if(val)
1100         set_irn_n(sync, 0, val);
1101     }
1102
1103     for (i = get_irn_arity(sync) - 1; i >= 1; --i) {
1104       /* We repair the leaves*/
1105
1106       assert(k <= ARR_LEN(l->accessed_vnum) && "The algorythm for sync repair is wron");
1107       if (is_Unknown(get_irn_n(sync, i))) {
1108         inc_irg_block_visited(current_ir_graph);
1109         val = find_vnum_value(pred, l->accessed_vnum[k++]);
1110
1111         if(val)
1112           set_irn_n(sync, i, val);
1113       }
1114     }
1115     DEL_ARR_F(l->accessed_vnum);
1116   }
1117 }
1118 /**
1119  * For the end node we must sync all memory edges.
1120  *
1121  * @param The enviroment pinter.
1122  */
1123 static void sync_mem_edges(env_t *env) {
1124
1125   value_arr_entry_t *val_arr;
1126   ir_node           **in, *sync, *Return, *Return_blk;
1127   int               i, vnum, vnum_state;
1128
1129   Return     = get_Block_cfgpred(get_irg_end_block(current_ir_graph), 0);
1130   Return_blk = get_nodes_block(Return);
1131   val_arr    = get_irn_link(Return_blk);
1132
1133   vnum_state = 0;
1134
1135   for(i = 0; i <= (int)env->gl_mem_vnum; i++)
1136     /* we get the current state of non saved scalars.*/
1137     if(val_arr[i].access_type <= 3)
1138       vnum_state++;
1139
1140   /* We allocate the memory, that we need for the predecessors of the sync.*/
1141   in = XMALLOCN(ir_node*, vnum_state);
1142
1143   /* The global memory edge is the first predecessor of this sync node.*/
1144   if(val_arr[env->gl_mem_vnum].mem_edge_state == NULL) {
1145     /* We must search through blocks for this memory state.*/
1146     inc_irg_block_visited(current_ir_graph);
1147     in[0] = find_vnum_value(Return_blk, env->gl_mem_vnum);
1148   }
1149   else
1150     in[0] = val_arr[env->gl_mem_vnum].mem_edge_state;
1151
1152
1153   for(i = 1, vnum = 0; vnum < (int)env->gl_mem_vnum; vnum++) {
1154
1155     if(val_arr[vnum].access_type <= 3) {
1156       /* we add the non saved scalars as predecessors of the sync.*/
1157
1158       if(val_arr[vnum].mem_edge_state == NULL) {
1159         /* We must search through blocks for this memory state.*/
1160         inc_irg_block_visited(current_ir_graph);
1161         in[i] = find_vnum_value(Return_blk, vnum);
1162       }
1163       else
1164         in[i] = val_arr[vnum].mem_edge_state;
1165       i++;
1166     }
1167   }
1168
1169   sync = new_r_Sync(current_ir_graph, Return_blk, vnum_state, in);
1170   set_Return_mem(Return, sync);
1171
1172   free(in);
1173 }
1174
1175 /**
1176  * Walker: allocate the value array for every block.
1177  *
1178  * @param block  A block from the current ir graph for that must be allocated a value array.
1179  * @param ctx    The enviroment pinter.
1180  */
1181 static void alloc_value_arr(ir_node *block, void *ctx)
1182 {
1183   env_t *env = ctx;
1184   int   i;
1185
1186   value_arr_entry_t *var_arr = obstack_alloc(&env->obst, sizeof(value_arr_entry_t) *(env->nvals + set_count(env->set_ent) + 1));
1187
1188   /* the value array is empty at start */
1189   memset(var_arr, 0, sizeof(value_arr_entry_t) * (env->nvals + set_count(env->set_ent) + 1));
1190   set_irn_link(block, var_arr);
1191
1192  /* We set the block value number state to optimal and later we update this.*/
1193   var_arr[env->vnum_state].access_type = env->nvals;
1194
1195   if(get_irg_start_block(current_ir_graph) == block)
1196     /* We initilize the startblocks array with the irg initilize memory, why
1197      * it must be the start point of all memory edges.*/
1198     for(i = (env->nvals + set_count(env->set_ent)) ; i >=0; i--)
1199       var_arr[i].mem_edge_state = get_irg_initial_mem(current_ir_graph);
1200
1201 }
1202
1203 /* Analyze call nodes to get information, if they store the address of a scalar.
1204  *
1205  * @param *irn   An ir node from the current_ir_graph.
1206  * @param *env   The enviroment pointer.
1207 */
1208 static void analyse_calls(ir_node *irn, void *ctx) {
1209
1210   int                 i, vnum;
1211   unsigned int        acces_type;
1212   ir_node             *param, *call_ptr, *blk;
1213   ir_entity           *meth_ent;
1214   sels_t              key_sels, *value_sels;
1215   call_access_t       key_call, *value_call;
1216   value_arr_entry_t   *val_arr;
1217   env_t               *env;
1218
1219   env = ctx;
1220   if (!is_Call(irn))
1221     return;
1222
1223   /* Calls that have a NoMem input do neither read nor write memory.
1224      We can completely ignore them here. */
1225   if (is_NoMem(get_Call_mem(irn)))
1226     return;
1227
1228   /* We iterate over the parameters of this call nodes.*/
1229   for ( i = get_Call_n_params(irn) - 1; i >= 0; i--) {
1230     param = get_Call_param(irn, i);
1231     if (is_Sel(param)) {
1232       /* We have found a parameter with operation sel.*/
1233       key_sels.sel = param;
1234       value_sels   = set_find(env->set_sels, &key_sels, sizeof(key_sels), HASH_PTR(key_sels.sel));
1235       if(value_sels != NULL ) {
1236
1237         /* We have found a call, that have as parameter a sel from our set_sels.*/
1238         call_ptr = get_Call_ptr(irn);
1239
1240         if (is_SymConst(call_ptr) && get_SymConst_kind(call_ptr) == symconst_addr_ent) {
1241           meth_ent = get_SymConst_entity(call_ptr);
1242           /* we get the access type for our sel.*/
1243           acces_type = get_method_param_access(meth_ent, i);
1244         } else
1245           /* We can't analyze this function and we asume, that it store the address.*/
1246           acces_type = ptr_access_store;
1247
1248         /* we save the access type and this call in the array allocated for this block.
1249          * The value number of this entity get us the position in the array to save this
1250          * information. Why we expect more calls as one we allocate a set.*/
1251         vnum    = GET_ENT_VNUM(value_sels->ent);
1252         blk     = get_nodes_block(irn);
1253         val_arr = get_irn_link(blk);
1254
1255         if(val_arr[vnum].access_type > 3)
1256           /* The address of this entity have been stored.*/
1257           continue;
1258
1259         if(val_arr[vnum].calls == NULL)
1260           /* for this entity i have found the firs call in this block and we must allocate the set.*/
1261           val_arr[vnum].calls = new_set(call_cmp, 8);
1262
1263           /* This call performs anything with the scalar and we must mark it.*/
1264           key_call.call = irn;
1265           key_call.access_type = acces_type;
1266           value_call = set_insert(val_arr[vnum].calls, &key_call, sizeof(key_call), HASH_PTR(key_call.call));
1267
1268         if(value_call->access_type < acces_type)
1269           /* this case tread, when a call access an entity more at once.
1270            * Than we must save the highest access type.*/
1271           value_call->access_type = acces_type;
1272
1273         if(acces_type > 3)
1274           /* This call save the address of our scalar and we can't
1275            * use the scalars of this entity for optimization as from now.
1276            * we mark this.*/
1277           val_arr[vnum].access_type = acces_type;
1278       }
1279     }
1280   }
1281 }
1282
1283 static int set_block_dominated_first_access(ir_node *blk, int vnum, unsigned int access) {
1284
1285   ir_node *idom, *succ;
1286   value_arr_entry_t *val_arr;
1287   int i, changes = 0;
1288
1289   idom = get_Block_idom(blk);
1290   for(i = get_Block_n_cfg_outs(idom) - 1; i >=1; i--) {
1291     succ = get_Block_cfg_out(idom, i);
1292     val_arr  = get_irn_link(succ);
1293     if(val_arr[vnum].access_type < 3) {
1294       val_arr[vnum].access_type = access;
1295       changes++;
1296     }
1297   }
1298   return changes;
1299 }
1300 /* Update the access information of a block if a predecessor of
1301  * this black have a higher access for an entity.
1302  *
1303  * @param *irn   An ir node from the current_ir_graph.
1304  * @param *env   The enviroment pointer.
1305  */
1306 static void set_block_access(ir_node *irn, void *ctx){
1307
1308   value_arr_entry_t *val_arr, *val_arr_pred;
1309   ent_leaves_t      *value_leaves;
1310   ir_node           *pred, *pred_blk, *leave;
1311   env_t             *env;
1312   int               i, vnum;
1313
1314   env     = ctx;
1315   val_arr = get_irn_link(irn);
1316
1317   for( i = get_Block_n_cfgpreds(irn) - 1; i >= 0; i--) {
1318     /* We analyze the predecessors of this block to see if this block must
1319      * be updated.*/
1320     pred = get_Block_cfgpred(irn, i);
1321     pred_blk = get_nodes_block(pred);
1322
1323     val_arr_pred = get_irn_link(pred_blk);
1324
1325     for(value_leaves = set_first(env->set_ent); value_leaves; value_leaves = set_next(env->set_ent)) {
1326       vnum = GET_ENT_VNUM(value_leaves->ent);
1327
1328       if((get_Block_n_cfgpreds(irn) > 1) && (val_arr[vnum].access_type > 3))
1329         env->changes =  set_block_dominated_first_access(irn, vnum, val_arr[vnum].access_type);
1330
1331       if((val_arr_pred[vnum].access_type > 3) && (val_arr[vnum].access_type < 3)) {
1332         /* We have found a block for update it access and value number information.*/
1333         val_arr[vnum].access_type = val_arr_pred[vnum].access_type;
1334         /* We update the access information of all leave, that belong to
1335          * this entity.*/
1336
1337         for(leave = pset_first(value_leaves->leaves); leave; leave = pset_next(value_leaves->leaves))
1338           val_arr[GET_IRN_VNUM(leave)].access_type = val_arr[vnum].access_type;
1339
1340         /* In this way can't be got the actuall number of value numbers.
1341         val_arr[env->vnum_state].access_type = val_arr_pred[env->vnum_state].access_type; */
1342         env->changes++;
1343       }
1344     }
1345   }
1346 }
1347 /* Free the allocated call sets.
1348  *
1349  * @param irn  A block form the ir graph.
1350  * @param env  The enviroment pinter.
1351  */
1352 static void free_call_info(ir_node *irn, void *ctx) {
1353
1354   int i;
1355   env_t             *env;
1356   value_arr_entry_t *val_arr;
1357
1358   env     = ctx;
1359   val_arr = get_irn_link(irn);
1360
1361   for(i = env->nvals + set_count(env->set_ent); i >= 0; i--) {
1362     if(val_arr[i].calls != NULL)
1363
1364       del_set(val_arr[i].calls);
1365   }
1366 }
1367
1368 static void print_block_state(ir_node *irn, void *ctx) {
1369
1370   value_arr_entry_t  *val_arr;
1371   ent_leaves_t       *value_leaves;
1372   call_access_t      *value_calls;
1373   env_t              *env;
1374   int                vnum;
1375
1376   env     = ctx;
1377   val_arr = get_irn_link(irn);
1378   ir_printf("\n\nThe actual value number state of this block is: %i \n",
1379             val_arr[env->vnum_state].access_type - 1);
1380
1381   for(value_leaves = set_first(env->set_ent); value_leaves; value_leaves = set_next(env->set_ent)) {
1382
1383     vnum = GET_ENT_VNUM(value_leaves->ent);
1384     ir_printf("The entity %F access type in the block with nr %u is %i \n",
1385               value_leaves->ent, get_irn_node_nr(irn), val_arr[vnum].access_type);
1386
1387     if(val_arr[vnum].calls != NULL)
1388       for(value_calls = set_first(val_arr[vnum].calls); value_calls; value_calls = set_next(val_arr[vnum].calls))
1389
1390         ir_printf("A call with nr %i acess a element of this entity with access %u \n",
1391                   get_irn_node_nr(value_calls->call), value_calls->access_type);
1392   }
1393
1394 }
1395
1396 /** Optimize the found scalar replacements.
1397 *
1398 * @param set_sels  A set with all entities, that
1399 *                  have scala(s).
1400 * @param set_ent   A set with all sels nodes,
1401 *                  that belong to our scalars.
1402 * @param vnum      The number of scalars.
1403 */
1404 static void do_data_flow_scalar_replacement(set *set_ent, set *set_sels, int vnum) {
1405
1406   env_t env;
1407
1408   obstack_init(&env.obst);
1409   env.set_ent     = set_ent;
1410   env.set_sels    = set_sels;
1411   env.fix_ls      = NULL;
1412   env.fix_phis    = NULL;
1413   env.fix_syncs   = NULL;
1414   env.gl_mem_vnum = vnum - 2;
1415   env.vnum_state  = vnum - 1;
1416   /* nvals are vnum - 1, why we indicate with nvals the number
1417    * of memory edges we will produce. For vnum_state we don't
1418    * need to produce a memory edge.*/
1419   env.nvals       = vnum - 1;
1420   env.changes     = 1;
1421
1422   /* first step: allocate the value arrays for every block */
1423   irg_block_walk_graph(current_ir_graph, NULL, alloc_value_arr, &env);
1424
1425   /* second step: we analyze all calls, that have as parameter scalar(s).
1426    * We mark the calls, that save the address of a scalar and we
1427    * mark the entity owner of this scalar as not optimizeble by now.*/
1428   irg_walk_graph(current_ir_graph, NULL, analyse_calls, &env);
1429
1430   while(env.changes) {
1431
1432
1433     env.changes  = 0;
1434     /*
1435     * third step: walk over the blocks of a graph and update
1436     * the information for the access of our scalars.
1437     */
1438     irg_block_walk_graph(current_ir_graph, NULL, set_block_access, &env);
1439
1440   }
1441
1442   // if(get_firm_verbosity())
1443     /* Debug info to see if analyse_calls work properly.*/
1444     irg_block_walk_graph(current_ir_graph, NULL, print_block_state, &env);
1445
1446   /*
1447    * fourth step: walk over the graph blockwise in topological order
1448    * and split the memrory edge.
1449    */
1450   inc_irg_block_visited(current_ir_graph);
1451   irg_walk_blkwise_graph(current_ir_graph, NULL, split_memory_edge, &env);
1452
1453
1454
1455   /* fifth step: fix all nodes, that have as predecessor Unknown.*/
1456   fix_ls(&env);
1457   fix_phis(&env);
1458   fix_syncs(&env);
1459
1460   /* sixth step: sync memory enges for the end block.*/
1461   sync_mem_edges(&env);
1462
1463   /*seventh step: free the allocated memory*/
1464   irg_block_walk_graph(current_ir_graph, NULL, free_call_info, &env);
1465   obstack_free(&env.obst, NULL);
1466 }
1467
1468 /*
1469  * Find possible scalar replacements
1470  *
1471  * @param irg  The current ir graph.
1472  */
1473 void data_flow_scalar_replacement_opt(ir_graph *irg) {
1474
1475   int          i, vnum = 0;
1476   ir_node      *irg_frame;
1477   set          *set_sels;
1478   set          *set_ent;
1479   ent_leaves_t key_leaves, *value_leaves;
1480
1481
1482   if (! get_opt_scalar_replacement())
1483     return;
1484
1485   set_sels = new_set(sels_cmp, 8);
1486   set_ent  = new_set(ent_leaves_t_cmp, 8);
1487
1488   /* Call algorithm that remove the critical edges of a ir graph. */
1489   remove_critical_cf_edges(irg);
1490
1491   /* Call algorithm that computes the out edges.*/
1492   assure_irg_outs(irg);
1493
1494   /* Call algorithm that computes the loop information.*/
1495   construct_cf_backedges(irg);
1496
1497   /* Call algorithm that computes the dominance information.*/
1498   assure_doms(irg);
1499
1500   /* Find possible scalar replacements */
1501   if (find_possible_replacements(irg)) {
1502
1503     /* Insert in set the scalar replacements. */
1504     irg_frame = get_irg_frame(irg);
1505
1506     for (i = 0 ; i < get_irn_n_outs(irg_frame); i++) {
1507       ir_node *succ = get_irn_out(irg_frame, i);
1508
1509       if (is_Sel(succ)) {
1510         ir_entity *ent = get_Sel_entity(succ);
1511
1512         if (get_entity_link(ent) == NULL || get_entity_link(ent) == ADDRESS_TAKEN)
1513           continue;
1514         /* we have found a entity, that have scalars and we insert it to our set_ent*/
1515         key_leaves.ent = ent;
1516         key_leaves.leaves = new_pset(leave_cmp, 8);
1517         value_leaves = set_insert(set_ent, &key_leaves, sizeof(key_leaves), HASH_PTR(ent));
1518
1519         /* We allocate for every leave sel a vnum.*/
1520         vnum = allocate_value_numbers(set_sels, value_leaves->leaves, ent, vnum);
1521       }
1522     }
1523
1524     /* Allocate value number for the globule memory edge.
1525      * and a value number for the value numbers state.*/
1526     vnum = vnum + 2;
1527
1528     /* Allocate value numbers for the entities .*/
1529     for(i = vnum,value_leaves = set_first(set_ent); value_leaves; i++, value_leaves = set_next(set_ent))
1530       SET_ENT_VNUM(value_leaves->ent, i);
1531
1532     if (vnum)
1533       do_data_flow_scalar_replacement(set_ent, set_sels, vnum);
1534
1535     /*free the allocated memory.*/
1536     for(value_leaves = set_first(set_ent); value_leaves; value_leaves = set_next(set_ent))
1537       del_pset(value_leaves->leaves);
1538     del_set(set_ent);
1539     del_set(set_sels);
1540   }
1541 }