CRIHAN  - Mars 2001
Outils d’optimisation - Page 19
3- D. perfex : application
•but :
•Montrer les pertes de performances lorsque les données sont hors des caches
•principe :
•Calcul d’un produit matrice-matrice
•démarche :
•1) compilation : -O2;
•2) étude des performances pour n tel que les 3 tableaux rentrent dans les caches L1, L2 ou la mémoire;
–cache L1 : 32ko, cache L2 : 1Mo; 4Mo, 8Mo (dépend de l’architecture => hinv)
–3 tableaux en double précision : 3x8xnxn octets
•3) étude des performances en modifiants l’ordre des boucles;
•4) compilation : -O3;
•5) refaire les étapes 2) et 3).