I3CPAC+-+Exercise+10

=Exercise 10 - Cache=

Vi skal lave en matrix multiplikator på to forskellige måder.

Først på en "langsom" måde hvor man går gennem det ene matrix sekventielt, og det andet gennemløbes non-sekventielt:

Forskellen på de to:
Vi skulle benytte en funktion i linux systemet hvorved vi kunne time vores applikationer og se forskellen på de to.
 * real angiver den samlede tid
 * user angiver den eksekveringtid CPU'en bruger ifbm. processen.
 * sys angiver den tid det tager at hente data

Det går absolut hurtigere ved at benytte cachen fuldt up, men vi er langt fra at det bliver 4 gange bedre.

COMPILERENS OPTIMERINGSPARAMETRE
Vi skulle nu prøve at se om der var en forskel ved at ændre på optimeringsparametrene:

Konklusion:
Det er tydeligt at se at det går meget hurtigere at eksekvere programmet når vi compiler det med optimeringsparametre.