AMD APU Kaveri Trottle CPU, explications

AMD APU Kaveri Trottle CPU, explications - CPU - Overclocking, Cooling & Modding

Marsh Posté le 15-11-2015 à 17:56:13    

Bonjour à tous.
 
En m'amusant avec mon A8-7650K (overclock tout ca) j'ai constaté une chose surprenante.
 
Comme beaucoup d'utilisateurs l'ont remarqué, quand le GPU passe à >95 %, le CPU est sous-cadencé à 2,8 Ghz (ce qui correspond au P-State P5 sur le 7650K)
Dans le cas du A10-7850K, le CPU est sous-cadencé à 3 Ghz.
 
A l'aide de AmdMsrTweaker en version 1.1, on peut fixer les P-State:
 
Avant la modification:
 
http://s21.postimg.org/a0zodtlbn/P_State_avant.jpg
 
Après la modification:
 
http://s2.postimg.org/g5hn397id/P_State_apres.jpg
 
En faisant cette modification, même quand le GPU est à 100 % (Ex: PCI-Express Render Test de GPU-Z), le CPU reste à sa fréquence initiale.  
Cool, on a enfin le comportement "normal".
 
Sauf qu'en lancant plusieurs benchmarks et jeux, j'ai remarqué la chose suivante: L'impact sur les performances est quasiment nul ! Dans mon cas, le fait de laisser à 2.8 Ghz ou à 3.8 Ghz ne change absolument pas le framerate !
Le seul cas ou on observe une perte, c'est quand les 4 coeurs (CPU) et le GPU sont à 100 % (LuxMark p.ex).  
 
Dans une utilisation jeu, les performances ne sont pas impactées, en tout cas c'est pas visible.
Dans une utilisation benchmark, à part dans LuxMark , les performances sont légèrement en retrait (quelques points dans 3d mark).  
 
Intrigué par cela, j'ai décidé de me lancer à la recherche d'explication.
 
En fouinant sur le forum d'overclock.net, j'ai trouvé une explication à cela de la part de l'utilisateur The Stilt (overclocker notable pour ceux qui connaissent)
En fait, c'est un mécanisme de power management:  
 

Citation :

They do.
 
However like I said earlier the power management is very fast and the performance penalty from the power balancing actions is neglectable.
As long as the application doesn´t fully stress both of the domains simultaneously (which basically never happens in normal workloads) there is no real performance difference.
 
The difference is 3DMarks (11, Fire Strike, Skydiver) is less than 1% between the default (GeApm On) and the workaround (GeApm Off) conditions.
Similar differences can be observed in games.
 
If both of the domains are fully loaded then the power management will not be able to balance the available resources properly.
This does happen is applications such as LuxMark (combined mode, CPU + GPU) however I´m yet to find a single real workload or game which would show a similar difference. Running a CPU stress test (e.g. Prime95) and GPU stress test (e.g. Furmark) at the same time would do the same but really is that relevant?
 
Quote:
Originally Posted by The Stilt View Post

 
The 3GHz throttling in Kaveri doesn´t have the effect it appears to have based only on the difference in frequency.
 
If the CPU domain requires greater power envelope while the CPU throttles to 3GHz frequency the power management will burst the CPU frequency back up to meet the new requirements. Steamroller can change it´s frequency state 500 000 times per second (minus the "dead time" from Pll release). This is the reason why you don´t see any performance difference in most applications or benchmarks between the stock condition and "throttling disabled" condition. The only benchmark I´ve personally seen the difference in is Luxmark (in CPU + GPU) mode as it fully utilizes the CPU but also requires CPU processing power to feed the GPU.


 
 :ouch:  
 
Dans son post, y a un terme qui sort du lot, c'est ce fameux GeApm.
 
Une petite recherche sur Google (GeApm AMD APU), on tombe sur par grand chose (poste sur overclock.net) et sur ca:
 
http://ieeexplore.ieee.org/xpl/log [...] %3D6946043
 

Citation :

This paper presents an analysis of four runtime power management features implemented in AMD's recent 28nM APU. These features optimize SOC performance by shifting power and frequency resources in response to workload characteristics. The Global Efficient APM (GEAPM), Core-Bound Boost (CBB) and Memory-Bound Boost (MBB) features are shown to provide a performance improvement of up to 76%, 4.3% and 12.5% respectively. The Local Efficient APM (LEAPM) feature is shown to reduce average CPU power consumption by 34% while reducing performance by less than 1%.


 
Voilà ou j'en suis en ce moment ! Ça serait intéressant de mesurer la consommation (à la prise) dans le cas ou le GeApm est sur on (P-State non fixé) et le cas ou le GeApm est sur off (P-State fixé via AmdMsrTweaker)
 
En tout cas, cela explique bien le ressenti que j'ai eu: Le throttle n'impacte pas (ou pas énormément) les performances dans les jeux !  
 
 :jap:
 
Edit: Ajout des sources
 
http://www.overclock.net/t/1555615 [...] t_23972309
 
http://ieeexplore.ieee.org/xpl/log [...] %3D6946043


Message édité par Moumoule le 16-11-2015 à 00:42:26
Reply

Marsh Posté le 15-11-2015 à 17:56:13   

Reply

Marsh Posté le 01-03-2016 à 01:26:40    

Merci beaucoup moumoule, ce post est très utile. J'ai exactement le même processeur que toi et je cherchais des informations à propos de la baisse de fréquence du CPU que j'ai pu observer dans certains jeux, tu m'as donc permis de gagner du temps.

 

C'est une bonne nouvelle d'apprendre que ce throttling du CPU n'impacte presque pas les performances. C'est également un peu surprenant, mais si j'ai bien compris les posts que tu as cités le CPU peut revenir a sa fréquence "normale" en cas de besoin même si le GeAPM est activé :

Citation :

If the CPU domain requires greater power envelope while the CPU throttles to 3GHz frequency the power management will burst the CPU frequency back up to meet the new requirements.

 

Cela signifie donc qu'il n'est pas inutile d'overclocker la partie CPU en plus de l' iGPU, on aura des gains en perfs dans les jeux qui ont besoin de ressources CPU importantes. Après il faut voir ce que ça donnerait niveau températures.


Message édité par zozo1er le 01-03-2016 à 01:35:38
Reply

Marsh Posté le 02-03-2016 à 15:30:17    

Nice!
 
Bravo moumoule, je suis sur que ton topic sera utile à ceux qui comme toi cherchent à comprendre comment faire marcher leur CPU de façon optimale :jap:


Message édité par SiZZiGETTE le 02-03-2016 à 15:31:57

---------------
BANNI de HFR
Reply

Marsh Posté le 04-03-2016 à 18:12:22    

Bon, j'ai trouvé de nouvelles informations et je me rends compte que je n'avais pas bien compris, mais je crois que j'y vois plus clair maintenant.

 

J'avais raison en disant qu'il n'est pas inutile d'overclocker la partie CPU en plus de l' iGPU, mais s'il en est ainsi c'est simplement parce qu'en utilisation courante il est extrêmement rare que l'iGPU et le CPU soient simultanément en pleine charge. Par contre, si l'iGPU est en pleine charge, la fréquence du CPU est obligatoirement diminuée (alors que je pensais qu'elle pouvait remonter au besoin). Le CPU est alors mis en état P5 (en tout cas pour l'A8-7650K, je ne sais pas si c'est pareil pour tous les Kaveri), soit 2.8Ghz pour mon processeur. J'ai remarqué par ailleurs que lorsque je joue il arrive au CPU de se mettre en état P4 (3.1Ghz pour l'A8-7650K). Je ne suis pas tout à fait sûr mais je pense que le P4 a une fonction analogue au P5.

 

La seule façon d'éviter une baisse de fréquence du CPU lorsque l'iGPU est en pleine charge semble être de modifier les P-States, par exemple avec AmdMsrTweaker. Il y a un tuto très utile mais en anglais ici :

 

http://www.overclock.net/t/1499562 [...] mini-guide

 


The Stilt propose également des BIOS modifiés pour désactiver le GeAPM, mais seulement pour certaines cartes mères. Ils sont ici :

 

http://www.overclock.net/t/1588994 [...] oller-apus

 


Personnellement je ne pense pas que je vais effectuer cette modification pour l'instant étant donné que plusieurs sources dont The Stilt s'accordent à dire que cela ne peut avoir qu'un impact très limité sur les perfs, à part pour certaines utilisations très particulières ou dans certains benchmarks. Mais je serais quand même curieux de voir ce que cela donnerait pour des jeux très gourmands en ressources CPU+GPU. D'autre part, s'il semble que le GeAPM ne diminue presque pas les performances des jeux actuels, je me demande ce qu'il en sera d'ici quelques années quand des jeux plus gourmands seront sortis.

 

Autre interrogation, je me demande si le GeAPM n'est pas susceptible de poser des problèmes d'instabilité en overclocking. En effet, il est généralement recommandé aux overclockers de désactiver le turbo et toutes les options du même genre qui modifient sans cesse la fréquence du CPU. Mais enfin il faut essayer, peut-être que ça ne pose pas vraiment problème.

 

Je ne pense pas modifier la fréquence du P4 et du P5 pour l'instant, par contre je pense qu'AmdMsrTweaker pourrait me servir à modifier la tension du P4 et du P5 voire de tous les états dont le P7 (activé très souvent en idle, multiplicateur à 19). J'ai en effet constaté qu'en overclockant et en augmentant la tension maximale fournie au CPU (bref le Vcore), la tension est également augmentée pour les autres états, ce qui me paraît inutile, à moins que quelque chose ne m'échappe. Cette modification permet d'obtenir de légers gains en ce qui concerne les températures et la consommation (voire des gains significatifs si on a beaucoup augmenté le Vcore mais je pense que c'est généralement inutile voire risqué, en tout cas sur ma config cela ne permet vraiment pas d'overclocker beaucoup plus et je préfère éviter de pousser jusqu'à 1.5 ou 1.55V).

 

Message cité 1 fois
Message édité par zozo1er le 07-03-2016 à 13:45:53
Reply

Marsh Posté le 08-03-2016 à 20:11:00    

Merci pour ton retour
 

zozo1er a écrit :

Mais je serais quand même curieux de voir ce que cela donnerait pour des jeux très gourmands en ressources CPU+GPU. D'autre part, s'il semble que le GeAPM ne diminue presque pas les performances des jeux actuels, je me demande ce qu'il en sera d'ici quelques années quand des jeux plus gourmands seront sortis.


 
Tu ne trouveras pas de workload courant stimulant le GPU et le CPU au maximum. En jeu, le GPU sera toujours le facteur limitant du fait de sa "faible" puissance (à comparer à un dGPU). J'ai déjà essayé en lancant des jeux comme Crysis 3 et autres, le CPU n'est jamais chargé en 100 %
 

Citation :


Je ne pense pas modifier la fréquence du P4 et du P5 pour l'instant, par contre je pense qu'AmdMsrTweaker pourrait me servir à modifier la tension du P4 et du P5 voire de tous les états dont le P7 (activé très souvent en idle, multiplicateur à 19). J'ai en effet constaté qu'en overclockant et en augmentant la tension maximale fournie au CPU (bref le Vcore), la tension est également augmentée pour les autres états, ce qui me paraît inutile, à moins que quelque chose ne m'échappe. Cette modification permet d'obtenir de légers gains en ce qui concerne les températures et la consommation (voire des gains significatifs si on a beaucoup augmenté le Vcore mais je pense que c'est généralement inutile voire risqué, en tout cas sur ma config cela ne permet vraiment pas d'overclocker beaucoup plus et je préfère éviter de pousser jusqu'à 1.5 ou 1.55V).


 
C'est ce que j'ai fait avec le 7650k. J'ai testé et modifié chaque p-state histoire d'optimiser la tension de ceux-ci.
 
En parlant de ça, j'ai entendu qu'il existe une carte mère de la marque Biostar qui permet de modifier les p-states directement dans le BIOS. J'ai jamais vu ca sur une autre carte mère "AMD". Malheureusement, si mes souvenirs sont bons, c'est une carte mère AM3+ (Biostar TA 970/plus)


Message édité par Moumoule le 08-03-2016 à 20:11:31
Reply

Marsh Posté le 14-03-2016 à 22:41:15    

Citation :

Tu ne trouveras pas de workload courant stimulant le GPU et le CPU au maximum. En jeu, le GPU sera toujours le facteur limitant du fait de sa "faible" puissance (à comparer à un dGPU). J'ai déjà essayé en lancant des jeux comme Crysis 3 et autres, le CPU n'est jamais chargé en 100 %


 
Ah ok, c'est bien possible et à vrai dire je suis un néophyte. Cependant j'ai fait le test avec Starcraft 2 et j'ai quand même obtenu des gains de perfs de l'ordre de 7.5% en modifiant le P4 et le P5 (overclock à 4.3 Ghz). Ce n'est pas énormissime mais ce n'est quand même pas rien, et je n'ai essayé que dans de petits combats, il se peut que lors de grandes batailles les gains soient plus importants. Si je ne me trompe pas les jeux de stratégie sont très gourmands en ressources CPU. Par contre un FPS comme Crysis 3 est très gourmand en ressources GPU mais peut probablement se contenter d'un processeur relativement modeste.
 
Ce résultat me fait penser qu'il faudrait nuancer ce que tu dis en précisant que pour certains jeux la partie CPU d'un Kaveri peut également être un facteur limitant, peut-être pas sur le plan graphique mais au moins sur les autres plans (mécanismes du jeu, IA, physique...).
 
Quoi qu'il en soit ce n'est pas très difficile de modifier le P4 et le P5 avant de lancer un jeu pour voir si ça change les perfs  :)

Message cité 1 fois
Message édité par zozo1er le 15-03-2016 à 18:33:59
Reply

Marsh Posté le 18-03-2016 à 10:57:05    

zozo1er a écrit :

Citation :

Tu ne trouveras pas de workload courant stimulant le GPU et le CPU au maximum. En jeu, le GPU sera toujours le facteur limitant du fait de sa "faible" puissance (à comparer à un dGPU). J'ai déjà essayé en lancant des jeux comme Crysis 3 et autres, le CPU n'est jamais chargé en 100 %


 
Ah ok, c'est bien possible et à vrai dire je suis un néophyte. Cependant j'ai fait le test avec Starcraft 2 et j'ai quand même obtenu des gains de perfs de l'ordre de 7.5% en modifiant le P4 et le P5 (overclock à 4.3 Ghz). Ce n'est pas énormissime mais ce n'est quand même pas rien, et je n'ai essayé que dans de petits combats, il se peut que lors de grandes batailles les gains soient plus importants. Si je ne me trompe pas les jeux de stratégie sont très gourmands en ressources CPU. Par contre un FPS comme Crysis 3 est très gourmand en ressources GPU mais peut probablement se contenter d'un processeur relativement modeste.
 
Ce résultat me fait penser qu'il faudrait nuancer ce que tu dis en précisant que pour certains jeux la partie CPU d'un Kaveri peut également être un facteur limitant, peut-être pas sur le plan graphique mais au moins sur les autres plans (mécanismes du jeu, IA, physique...).
 
Quoi qu'il en soit ce n'est pas très difficile de modifier le P4 et le P5 avant de lancer un jeu pour voir si ça change les perfs  :)


 
Encore une fois, merci pour ton retour :)
 
Concernant SC2, c'est très difficile de mesurer les performances de façon raisonnable et systématique car pas de benchmark intégré. Il faudrait utilisé une méthodologie bien précise, comme par exemple expliqué ici (https://www.youtube.com/watch?v=S1za-dmDMjQ) et comparer avec GeApm on et GeApm off (overclock ou pas).
 
Mais même à ce moment là, une variation des performances peut-être noté. Je peux par contre m'imaginer qu'effectivement, avec un nombre irréaliste d'unités, il se peut que le processeur n'arrive pas à suivre quand l'iGPU n'a aucun problème. De ce fait, les 7.5 % (pour un overclock de 53%, 2.8 GeApm on => 4.3 GeApm off) sont, amha, plutôt dû à la différence de charge CPU lors de différentes scènes. Je sais pas si c'est très clair ce que je dis :D
 
 

Reply

Marsh Posté le 19-03-2016 à 01:24:30    

Citation :

Encore une fois, merci pour ton retour :)  
 
Concernant SC2, c'est très difficile de mesurer les performances de façon raisonnable et systématique car pas de benchmark intégré. Il faudrait utilisé une méthodologie bien précise, comme par exemple expliqué ici (https://www.youtube.com/watch?v=S1za-dmDMjQ) et comparer avec GeApm on et GeApm off (overclock ou pas).  
 
Mais même à ce moment là, une variation des performances peut-être noté. Je peux par contre m'imaginer qu'effectivement, avec un nombre irréaliste d'unités, il se peut que le processeur n'arrive pas à suivre quand l'iGPU n'a aucun problème. De ce fait, les 7.5 % (pour un overclock de 53%, 2.8 GeApm on => 4.3 GeApm off) sont, amha, plutôt dû à la différence de charge CPU lors de différentes scènes. Je sais pas si c'est très clair ce que je dis :D  
 


 
Non, j'avoue que je ne suis pas certain d'avoir bien compris ce que tu dis sur la fin :) Mais en gros j'ai l'impression que tu penses que j'ai sans doute employé une mauvaise méthodologie de benchmark sinon je ne devrais pas remarquer une si grosse différence entre GeApm off et GeApm on.
 
Alors en fait j'ai utilisé une méthode simple et très imprécise mais qui me semble pas trop mal pour avoir un ordre d'idée des performances. J'ai lançé plusieurs fois la même sauvegarde du jeu et j'ai fait des benchmark avec Fraps sur une minute à chaque fois pour avoir la moyenne du framerate. Pendant chaque mesure j'ai effectué les mêmes déplacements avec mes unités et ai ciblé les mêmes ennemis.
 
Cependant tu m'as mis le doute alors j'ai refait le test pour voir, et grosso modo ça confirme que tu as raison. Voici les résultats, comme ça tu jugeras par toi-même :  
 
GeApm on    GeApm off     Evolution moyenne (%)
 
28,75           30,917           +5,7
29,717          31,983          
30,700          31,367          
   
30,683          28,683           -0,79  
29,567          32,450          
30,800          29,917          
30,967          29,983          
   
29,350          29,333           +0,81
27,500          27,567          
28,717          29,700          
27,800          27,683          
 
Les trois premiers résultats ont été obtenus en faisant de petits combats. Idem pour les quatre résultats suivants, mais avec une sauvegarde différente, et bizarrement l'évolution a été négative cette fois-ci. Les quatre derniers résultats ont été obtenus en faisant un grand combat et en ayant construit le nombre maximal d'unités (200).
 
Il faudrait faire beaucoup plus de tests pour avoir des résultats plus précis et plus fiables mais ces résultats suffisent pour penser qu'il n'est pas utile de désactiver le GeApm pour Starcraft 2.
 
D'autre part j'ai remarqué qu'avec le GeApm activé, lorsque je n'avais construit que quelques unités le multiplicateur restait à 28 mais qu'après avoir construit une grande armée le multiplicateur était à 43 en permanence, ce qui suggère que le GeApm est bien fichu et sait répartir la charge intelligemment entre le CPU et le GPU.
 
Je crois qu'on aura pas mal fait le tour de la question en tout cas !


Message édité par zozo1er le 19-03-2016 à 01:52:38
Reply

Sujets relatifs:

Leave a Replay

Make sure you enter the(*)required information where indicate.HTML code is not allowed