 |
 |
 |
 |
 |
 |
 |
 |
 |
 |
 |
 |
but :
|
|
|
Montrer les
pertes de performances lorsque les données sont hors des caches
|
|
principe :
|
|
|
Calcul d’un
produit matrice-matrice
|
|
|
démarche :
|
|
|
1) compilation
: -O2;
|
|
|
2) étude des
performances pour n tel que les 3 tableaux rentrent dans les
|
|
caches L1, L2
ou la mémoire;
|
|
|
|
cache L1 : 32ko,
cache L2 : 1Mo; 4Mo, 8Mo (dépend de l’architecture => hinv)
|
|
|
|
3 tableaux en
double précision : 3x8xnxn octets
|
|
|
3) étude des
performances en modifiants l’ordre des boucles;
|
|
|
4) compilation
: -O3;
|
|
|
5) refaire les
étapes 2) et 3).
|
|