3- D. perfex : application
but :
Montrer les pertes de performances lorsque les données sont hors des caches
principe :
Calcul d’un produit matrice-matrice
démarche :
1) compilation : -O2;
2) étude des performances pour n tel que les 3 tableaux rentrent dans les
caches L1, L2 ou la mémoire;
cache L1 : 32ko, cache L2 : 1Mo; 4Mo, 8Mo (dépend de l’architecture => hinv)
3 tableaux en double précision : 3x8xnxn octets
3) étude des performances en modifiants l’ordre des boucles;
4) compilation : -O3;
5) refaire les étapes 2) et 3).