Focus : Core i7-7820X : Un Skylake-X mieux placé ? [HFR] - HFR - Hardware
Marsh Posté le 12-09-2017 à 16:04:03 5
focus intéressant, en attendant le TR 1900x qui devrait être du même acabit et placé en concurrent direct! Il sera intéressant de completer cet article avec le test de ce TR1900x.
Il est fort probable que le 7820x conservera l avantage de l OC à 4.5Ghz, peu imaginable sur un Zen.
Marsh Posté le 12-09-2017 à 16:04:24 0
Sur Chrome Version 60.0.3112.113 la légende du graphe a point cache une partie des résultats.
Sinon dossier intéressant comme d'habitude.
On sais si intel va généraliser cette architecture mesh pour faire des économies de design ou garder les ring bus pour les petit coeurs ?
Pour l'apres CofeeLake
Marsh Posté le 12-09-2017 à 16:11:00 0
Merci !
Ce test permettra de bien comparer l'archi mesh Intel par rapport aux "CPUs glues" d'AMD !
Chose etrange par contre en applicatif, l'I7 7820X n'a que 9.3% de plus qu'un I7 6900K.
Sachant que Skylake apporte environ 10% de plus par rapport a Haswell, mais que l'I7 7820X est quand meme cadence 500Mhz de plus que l'I7 6900K; l'ecart aurait etre aux environs de 20%.
D'un autre cote, je viens de remarquer la meme chose avec l'I9 7900X et l'I7 6950X.
Mesh n'est donc pas si efficace que ca en fait par rapport a un double ring bus, meme en applicatif...
Il vaut mieux se pencher sur Haswell/Broadwell-E qui restent les rois de la performance globale... Pour peu qu'on les trouve au pire des cas au meme prix que Skylake-X et qu'on y applique la meme frequence...
Marsh Posté le 12-09-2017 à 16:13:43 2
SirGallahad a écrit : |
Ben on en sait rien... Mais il est probable que intel n'utilise le mesh que pour ses xeon et donc leur plateforme haut de gamme.
La gamme grand public est à part, avec IGP intégré. Intel n'a aucun raison de passer au mesh sur cette gamme, surtout qu'ils savent pertinemment que ça fait perdre des performance pour les jeux et que c'est là-dessus que ces processeur sont surtout jugés.
Marsh Posté le 12-09-2017 à 16:21:12 0
Exact,
Apres on est pas a l'abri d'une logique economique a l'Intel.
Le joint en indium en moins et le PCB plus fin des CPUs depuis Skylake nous l'ont deja montre...
Marsh Posté le 12-09-2017 à 16:21:57 0
J'ai beaucoup hésité a partir dessus car je virtualise mais j'attends la sortie des 8ème génération avant de choisir.
Car je geek aussi
Merci pour ce dossier.
Marsh Posté le 12-09-2017 à 16:23:05 0
Crosslink a écrit : Exact, |
Oui c'est bien a cela que je pensais. D’où la question.
Marsh Posté le 12-09-2017 à 16:41:07 1
SirGallahad a écrit : Sur Chrome Version 60.0.3112.113 la légende du graphe a point cache une partie des résultats. |
Quelle légende ? Quand on balade la souris, la légende traque les 5 cpu les plus proches et se met en haut a gauche ou en bas a droite en fonction de l'emplacement. Normalement ca ne cache rien ici ?
SirGallahad a écrit : |
Officiellement on ne sait rien.
Maintenant, il est probable que le ring bus soit moins couteux en transistors que le mesh.
Ensuite, un mesh avec 4 coeurs, ca n'est pas vraiment un mesh, donc je doute qu'ils se lancent la dedans, mais on ne sait jamais. L'intérêt du mesh c'est scaler vers le haut.
Marsh Posté le 12-09-2017 à 16:43:13 1
Crosslink a écrit : |
Le mesh est moins innefficace sur les apps que sur les jeux oui, mais peut avoir ponctuellement un impact genre 7-Zip/WinRAR (en gros les apps ou l'interconnexion/ram joue, et donc les mêmes apps ou Ryzen/Threadripper fait moins bien que BDW-E en moyenne vs autres apps), c'est quelque chose que l'on avait relevé dans le dossier du 7900X oui.
Sur beaucoup d'apps l'impact est nul cependant.
Crosslink a écrit : |
Mais ils ne sont pas du tout au même prix, Intel ne baisse pas (plus) ses tarifs. Cf notre graph tout en bas ou l'on voit les BDW-E très a droite
Marsh Posté le 12-09-2017 à 16:55:09 0
C_Wiz a écrit : |
Comme ca.
Je viens de tester j'ai le droit de décocher des processeurs mais après impossible de les re-selectionner.
C_Wiz a écrit : |
Ok merci.
Marsh Posté le 12-09-2017 à 17:12:36 0
SirGallahad a écrit : |
Et après un Ctrl+F5 ?
Marsh Posté le 12-09-2017 à 17:21:08 0
Et les CM pour i7-7820X sont-elles au même prix que celles qu'on trouve pour Ryzen 7 ou bien faut-il compter un "surcoût" d'environ 200€ ?
Marsh Posté le 12-09-2017 à 17:36:58 3
vincenmar a écrit : Et les CM pour i7-7820X sont-elles au même prix que celles qu'on trouve pour Ryzen 7 ou bien faut-il compter un "surcoût" d'environ 200€ ? |
Et pas de support ECC pour Intel sauf prendre des Xeon, et pas autant de lignes PCIe que le Threadripper 1900x... la fréquence turbo en mono-core c'est pas tout.
Donc d'après les specs, le 7820 serait entièrement dédié aux gamers... sauf que pour l'instant le gaming préfère les 4c/8t à haute fréquence donc en restant chez Intel, nettement moins cher pour plus de perfs.
Les Intels sur base X et 3xx seraient intéressant s'ils étaient vendus moins cher que les AMD, or c'est le contraire. Intel segmente le marché avec ses CPU et plateformes pour les orienter vers un seul type d'usage, alors il faut qu'il vende moins cher qu'AMD qui vend des configurations multi-tâche.
Marsh Posté le 12-09-2017 à 17:40:57 3
vincenmar a écrit : Et les CM pour i7-7820X sont-elles au même prix que celles qu'on trouve pour Ryzen 7 ou bien faut-il compter un "surcoût" d'environ 200€ ? |
Les CM des plateformes HEDT sont plus chères que celles des plateformes grand public des deux constructeurs, c'est vrai des deux côtés. Les CM X299 (Intel) sont plutôt moins chères que les CM X399 (Threadripper).
Marsh Posté le 12-09-2017 à 17:57:53 0
valeoscoot a écrit : |
C'est ce qui me fait dire que le 8700K aura très probablement un rapport perf/prix/nombre de coeur très intéressant, surtout s'il a en plus une bonne tolérance à l'overclocking.
Marsh Posté le 12-09-2017 à 18:09:20 0
C_Wiz a écrit : |
Sinon à partir de combien de cœurs, le ring bus devient un goulet d'étranglement ? Car j'ai pas vraiment l'impression que pour des processeurs 10/12 cœurs le MESH voir un peu plus soit vraiment intéressant ... Mais bon il est sûrement plus économique pour intel de faire une lignes de processeur identique utilisant le mesh que de faire un DIE LLC en Ring Bus et les autres en MESH ...
Marsh Posté le 12-09-2017 à 18:19:15 0
havoc_28 a écrit : |
Pas oublier que les HCC utilisaient 2 ring bus interconnectés déjà :
Intel a voulu simplifier avec un mesh pour éviter d'en mettre 3 j'imagine (le HCC monte a 28C). Ils avaient en prime l'expérience sur Knights Landing & co. Leurs simulations devaient montrer que c'était mieux ou que la perte était justifiable.
Je ne sais pas si leurs simulations collent avec les résultats que l'on obtient dans nos tests pratiques
Marsh Posté le 12-09-2017 à 18:28:41 0
C_Wiz a écrit : |
Pour le DIE HCC ça semble logique d'un point de vue complexité oui, mais pour le LCC voir MCC ...
http://www.hardware.fr/articles/96 [...] 3-ghz.html
Citation : D'abord si l'on regarde l'indice applicatif, on peut voir que globalement, Skylake-X fait légèrement mieux que Broadwell-E. L'écart est cependant infime, on parle de 1.5% de gain ce qui n'est pas exceptionnel. [...] |
Y a la fréquence supérieur de SKL-X pour compenser, et le fait que la plateforme vise avant tout l'applicatif, mais le MESH pour du LCC, à part le fait de ne pas multiplier les disigns ... je vois pas trop l’intérêt.
En tout cas c'est ce que montre votre protocole de test, pour le die LCC, MESH est contre productif.
Marsh Posté le 12-09-2017 à 19:35:24 0
Merci pour les précisions.
Comme dit plus haut, attendons l'offre six coeurs d'Intel (8700K et autres) pour se faire une idée plus nette.
Marsh Posté le 12-09-2017 à 21:07:01 1
C_Wiz a écrit : |
J'ai réouvert la page pour prendre le screenShot mais je n'ai pas essayer le CTRL+F5.
Par contre sur le Firefox de la maison cela marche parfaitement.
Je testerais a nouveau demain du travail.
Marsh Posté le 12-09-2017 à 21:09:44 0
Vous n'avez pas pris en compte le prix de la plateforme non ? car cela change pas mal la donne niveau positionnement dans le dernier graphe.
Ou pouvez-vous intréger les deux du coup ?
Marsh Posté le 12-09-2017 à 21:11:32 0
SirGallahad a écrit : |
Thx ! A coup sur c'est un problème de cache, Chrome + notre serveur ne rapporte pas les MAJ sur les scripts correctement, mais aucun problème sous Firefox bizzarement. Ca fait partie des trucs que je dois investiguer un jour si j'ai le temps.
Marsh Posté le 12-09-2017 à 21:27:00 1
rmartin a écrit : Vous n'avez pas pris en compte le prix de la plateforme non ? car cela change pas mal la donne niveau positionnement dans le dernier graphe. |
Le prix des cartes mères varie grandement selon les modèles. Choisir un prix unique est délicat donc on évite.
Comme dit plus haut, les CM Threadripper sont les plus chères, suivies des Skylake-X, les CM Ryzen/7700K sont moins chères avec beaucoup de variabilité en fonction des fonctionnalités que l'on veut (plusieurs "tiers" de chipsets dans chaque cas).
Marsh Posté le 12-09-2017 à 22:25:13 0
C_Wiz a écrit : Thx ! A coup sur c'est un problème de cache, Chrome + notre serveur ne rapporte pas les MAJ sur les scripts correctement, mais aucun problème sous Firefox bizzarement. Ca fait partie des trucs que je dois investiguer un jour si j'ai le temps. |
j avais le meme pb sous edge cet aprem au bureau, mais pas de pb à la maison, tjs sous edge de win10 1703.
d ailleurs, il serait AMHA préférable de désélectionner le 6950x par défaut car il déforme à lui seul trop le graphique et le rends moins lisible (puisque seul cpu de la liste > $1200)
incroyable de voir à quel prix farfelu il faut proposé, faute de concurrence, alors que ce 7820x fait quasi aussi bien en applicatif pour 3 fois moins cher!
Marsh Posté le 12-09-2017 à 23:31:05 1
havoc_28 a écrit : |
Officiellement pour assurer un comportement identique entre tous les xeon.
Marsh Posté le 13-09-2017 à 00:16:28 0
Citation : C'est là que commencent les premières segmentations, comme nous vous l'indiquions à l'époque, Intel effectue une segmentation sur les unités AVX en désactivant une unité AVX-512 sur les modèles 6 et 8 coeurs (7800X et le 7820X qui nous intéresse aujourd'hui). On ne peut effectuer qu'un FMA par cycle contre deux sur ces modèles, une segmentation dont l'impact n'est pas vraiment mesurable aujourd'hui dans notre protocole. |
Bon pour l'AVX-512 y'a sans doute pas grand-chose à part des tests synthétiques très spécifiques.
Pour l'AVX/AVX2 c'est possible d'en montrer l'impact assez facilement avec le x265.
core i9 OC à 4.5 Ghz all core
R7 1800X OC à 4.0 Ghz all core
R9 1950X OC à 3.9 Ghz all core
Citation : | CPU | x264 | x265 | LAVC | auto | MMX2 | SSE | SSE2 | SSE3 | SSE4 | AVX | AVX2 | |
Par contre l'histoire du x265 étant récente, le code a sans doute surtout été particulièrement optimisé en AVX/AVX2 au détriment du SSE4. Le x264 dont le code est plus ancien mais tout de même optimisé pour utiliser les instructions AVX/AVX2 ne montre pas un tel écart d'efficacité entre SSE4 et AVX2. Mais en tout cas les SIMD AVX2 sur Intel pour un encodage x265 sont bien plus rapides que celles d'AMD. Un i9-7900X 10C/20T à 4.5 Ghz est presque au même niveau de perf sur x265 qu'un 1950X 16C/32T à 3.9 Ghz.
Marsh Posté le 13-09-2017 à 00:23:49 0
Crosslink a écrit : Chose etrange par contre en applicatif, l'I7 7820X n'a que 9.3% de plus qu'un I7 6900K. |
Skylake-X n'a plus grand chose de Skylake : L2 gonflé et L3 réduit.
L'interconnexion employée n'est pas vraiment en cause, par contre il y a pas mal de sauts (latence) et les problèmes de contextes (forcément plus lourds à cause du L2 gonflé) trop mobiles peuvent ruiner l'efficacité... je pense qu'on a quelque chose de ce goût là, vu à quel point W10 fait n'importe quoi avec les threads.
Marsh Posté le 13-09-2017 à 00:48:32 1
Bonsoir et merci pour ce focus intéressant.
Est-il envisager un jour de retester de processeur sous d'autres conditions?
Il parait qu'il s'exprime pleinement avec de la mémoire rapide (3200 / 3600 voir plus) accompagné d'un overclocking de la vitesse Uncore.
En gros, j'ai lu qu'il été au moins aussi performant qu'un 7740X en jeu et évidemment très à l'aise en multithreading.
Il y a vraiment peu de reviewer qui ont joué sur ces paramètres, je trouve ça très dommage qu'on n'ait pas une review dessus.
Un espoir de voir ça un jour ou on peut oublier de voir un tel test sur HFR?
Marsh Posté le 13-09-2017 à 07:19:16 0
bigboss69 a écrit : Bonsoir et merci pour ce focus intéressant. |
sur que tout les cpu sont plus performant avec des paramètres avantageux
Marsh Posté le 13-09-2017 à 07:57:03 0
Certes, mais ça n'intéresse personne de voir quelle performance on peut tirer d'un CPU?
De savoir l'écart qu'il y a lorsque l'on touche à tel ou tel paramètres?
Mémoire, uncore ou autres.
Je serais content de savoir tout ça pour faire mon choix en conséquence, au vu des performances que je vise.
Savoir aussi la consommation et les températures atteinte en watercooling chez HFR serait intéressant.
Avant et après delid pendant qu'on y est.
Avoir un tableau comparatif avec les CPU overclocké proche de leur limite raisonnable en terme de consommation serait très riche en enseignement plutôt que de se contenter des performances @stock.
Bref, excuse moi de demander au staff d'HFR d'éventuellement se pencher sur la question s'il trouve ça pertinent ou pas.
Marsh Posté le 13-09-2017 à 08:04:30 1
C_Wiz a écrit : Thx ! A coup sur c'est un problème de cache, Chrome + notre serveur ne rapporte pas les MAJ sur les scripts correctement, mais aucun problème sous Firefox bizzarement. Ca fait partie des trucs que je dois investiguer un jour si j'ai le temps. |
Cela fonctionne correctement maintenant
Marsh Posté le 13-09-2017 à 08:09:15 0
bigboss69 a écrit : Certes, mais ça n'intéresse personne de voir quelle performance on peut tirer d'un CPU? |
Un overclock de 5/10/15/20% donnera a peu près les même gains chez les 2 marques. Idem pour la consommation qui va forcement monter.
Pour le coup du delid, je trouve que c'est une pratique folle qui fait sauter la garantie du processeur. A réserver a ceux qui peuvent changer de processeur sans réfléchir.
Marsh Posté le 13-09-2017 à 11:52:32 1
bigboss69 a écrit : Certes, mais ça n'intéresse personne de voir quelle performance on peut tirer d'un CPU? |
C'est une question qui revient périodiquement, et que l'on traite périodiquement : http://www.hardware.fr/articles/95 [...] 6900k.html
Réponse courte, non ca ne change pas grand chose d'une marque à l'autre, et l'on teste dans des conditions identiques tous les CPU pour de bonnes raisons.
Marsh Posté le 13-09-2017 à 12:46:18 1
sagittaire a écrit :
Bon pour l'AVX-512 y'a sans doute pas grand-chose à part des tests synthétiques très spécifiques. Pour l'AVX/AVX2 c'est possible d'en montrer l'impact assez facilement avec le x265. core i9 OC à 4.5 Ghz all core
|
...ou les compilateurs actuels sont mieux optimisés pour l avx2 Intel que l avx2 AMD!
Test intéressant mais pas sur de bien comprendre les résultats: toutes les colones à droite de x265 concernent elles l encodage x265 avec la seule instruction sus cité authorisée??
On parle bien d images/sec compressées? (fps)
Le test hfr x264 est dans les mêmes perfs sur le x264 avec autour de 30fps, mais celui x265 obtient des résultats dans les 11 fps, cad quasi x2.
Par ailleurs, meme en fréquence stock, sur hfr/x265, le i7-7820x 8C fait aussi bien que le TR 1920X 12C, et le i9 7900 10c pas loin du TR 1950X 16C.
Marsh Posté le 13-09-2017 à 21:23:23 1
Eric B a écrit :
|
Compilateur GCC 7.1 avec des profils optimisés en SSE4. Mais je doute que cela soit l'explication. Le câblage SIMD AVX2 d'Intel est simplement physiquement beaucoup plus rapide que celui d'AMD. Cela s'explique très bien avec les débits théoriques maximum.
Citation : Test intéressant mais pas sur de bien comprendre les résultats: toutes les colones à droite de x265 concernent elles l encodage x265 avec la seule instruction sus cité authorisée?? |
Cela défini le niveau de complexité SIMD maximum: par exemple un encodage avec SSE 4.2 permet aussi l'utilisation de toutes les instructions de plus faibles niveaux.
Faire un encodage x264 ou x265 uniquement en AVX2 est impossible car toute les parties du code ne peuvent pas fonctionner en AVX2. Cela serait de toute façon souvent inutile: certaines fonctions ne nécessitent pas d'être optimisées spécifiquement en AVX2 car elle ne seront pas plus rapides que celles optimisées avec des instructions moins complexes.
Citation : On parle bien d images/sec compressées? (fps) |
oui c'est ça.
Citation : Le test hfr x264 est dans les mêmes perfs sur le x264 avec autour de 30fps, mais celui x265 obtient des résultats dans les 11 fps, cad quasi x2. |
- Le test x264 est exactement le même que celui de HFR même si ici le bench x264 est un peu moins rapide que celui de HFR avec un 1950X@stock. Celui qui a fait le test avec un 1950X OC à 3.9 Ghz a juste rapporté que son CPU n'était pas à 100% full charge en x264. Alors que HFR n'avait pas ce problème. Peut-être que l'OC n'était pas correctement fait ou mal refroidi et que cela générait du throttling.
- Le test x265 n'est pas le même: il est fait ici en 4K. Celui de HFR est en 2K. Le problème c'est que le x265 n'est plus capable de saturer correctement un CPU de plus de 16 Threads en 2K à cause de problème d'interdépendances. Et cela se voit très bien dans les résultats de HFR puisque les i7-6900K, i7-6950K, R7 1800X, 1920X, 1950X, i7-7820X ou autres i9-7900X obtiennent des résultats finalement assez proches (les différences s'expliquent surtout par les fréquences max atteintes sur le bench x265 HFR). d'ailleurs dans ce bench en 2K, les i9-7960X et i9-7980XE ne feront pas mieux qu'un i7-7820X ou un i9-7900X. Un 1950X devrait aussi presque avoir le double de performance face au 1800X (c'est le cas dans le bench x264 en 2K de HFR). On a plus le bon scaling en 2K avec le x265. Pour pouvoir saturer le codec x265 sur 32 threads, il faut donc faire un encodage en 4K.
D'ailleurs pour aller plus loin, le protocole HFR dans son ensemble peine à évaluer des CPU avec 32 Threads. Plein d'applications n'arrivent plus à suivre:
- Winrar ne supportent pas plus de 16 threads: à mon avis faudrait le remplacer par un test unique de compression et de décompression 7zip
- x265 en 2K ne supporte pas plus de 16 ou 20 threads: faudrait le remplacer par un test en 4K
- curieusement Mental-Ray et V-ray ne semblent pas non plus suivre sur 32 threads. Alors que pour le calcul 3D, le scaling devrait être quasiment parfait. En tout cas c'est un problème que ne rencontre pas d'autre bench de calcul 3D tel que POV-Ray, cinebench ou blender par exemple.
Il serait d'ailleurs intéressant de voir ce que donnerait certains benchs avec SMT désactivé avec le 1950X puisque théoriquement on devrait avoir ça en terme d'indice de perf avec un scaling parfait à fréquences identiques:
Rysen 8C/8T: 100
Rysen 8C/16T: 125
Rysen 16C/16T: 200
Rysen 16C/32T: 250
Il est donc probable que certaines applications aient de meilleurs perfs sur 1950X SMT Off que sur 1950 SMT On: winrar, x265 2K, Mental-Ray et V-ray par exemple.
Marsh Posté le 13-09-2017 à 21:37:44 0
cela a tout son sens: le x264/h264/avc est en 1er lieu utilisé par les bluray et autres media en 2k, alors que le x265/h265/hevc est bcp utilisé par les media 4k (bluray 4k, streaming ultra hd)
Marsh Posté le 12-09-2017 à 15:37:23 0
**Après le lancement des Threadripper qui a fortement secoué le tout frais Core i9-7900X, prenons un peu de temps pour revenir sur le cas d'un autre modèle de la gamme HEDT
Lire la suite ...