RAGEmem (Os4 memtest, OS4emu)
-
Il est tout à fait normal que l’écriture soit notablement plus rapide que la lecture
Pourquoi les tests sur processeurs x86 ou ceux sur mon ancien 603e donnent-ils des résultats inverses dans ce cas ?
PowerMac - G5 2.0 GHz - 1.7 Go RAM - Radeon 9600P 128 Mo - MorphOs 3.13 et Peg2 - G4 RIP
Mac mini - G4 1.42 GHz - 1 Go RAM - Radeon 9200 32 Mo - MorphOs 3.9
WinUAE sur HP Core2 Quad 8200
Epave de Mist FPGA remplacé par un Sidi
A1200 malade 😉 et A500 512+512Ko RAM Kickstart 1.3Pourquoi les tests sur processeurs x86 ou ceux sur mon ancien 603e donnent-ils des résultats inverses dans ce cas ?
C’est une façon polie de remettre en doute ce que j’explique ?
Si oui, il aurait été plus sage d’essayer de comprendre comment ça fonctionne (ce que j’explique plus haut), et d’éviter de comparer les performances d’un G4 avec celles d’un x86 ou d’un 603e, qui plus est sur des plateformes fondamentalement différentes.
Je veux bien être gentil et faire avancer le débat calmement, si possible. Ces interventions stupides, sans aucune valeur technique ni argumentation valable, n’apportent rien de concret. J’ai franchement mieux à faire que de participer à ces gamineries. 😡
Je veux bien être gentil et faire avancer le débat calmement, si possible. Ces interventions stupides, sans aucune valeur technique ni argumentation valable, n’apportent rien de concret. J’ai franchement mieux à faire que de participer à ces gamineries.
Trop drôle !
Ca va le melon ?
Tu veux pas expliquer, et bah pas de problème tu expliques pas, même si cela ne t’aurait pas pris plus de lignes que ce commentaire sensé me snober. A moins que tu ne maîtrises pas le sujet autant que tu essayes de le faire croire, et que tu préfères passer pour un sage penseur distant, plutôt que de voir ton argumentation détruite par quelqu’un de mieux renseigné que toi. Si, si, ces personnes existent…
PowerMac - G5 2.0 GHz - 1.7 Go RAM - Radeon 9600P 128 Mo - MorphOs 3.13 et Peg2 - G4 RIP
Mac mini - G4 1.42 GHz - 1 Go RAM - Radeon 9200 32 Mo - MorphOs 3.9
WinUAE sur HP Core2 Quad 8200
Epave de Mist FPGA remplacé par un Sidi
A1200 malade 😉 et A500 512+512Ko RAM Kickstart 1.3FAB: Suite à la trick du DCBZ je me suis retrouvé avec des performances identiques en 32 ou 64 bits. Pourquoi, je ne sais pas, mais j’écris à 780 mo/sec en 32 ou 64 bits avec DCBZ.
Sans DCBZ, je retourne bien évidement à 330 et 711.
Avec une boucle C, je re retourne encore à 330 et 711, ce qui est normal vu que le C n’utilise pas ces trick.
Sur Pegasos 2 que tu ai 400 ou 600 (ou un truc du genre j’ai pu la valeur) avec une boucle C est normal et j’aurais le meme résultat en ASM sans DCBZ. Mais avec, ça chie, et une chose est sure si ça chie n’est pas de ma faute, ou alors j’ai loupé un truc dans la doc.
Kakace à dit tout ce qu’il y avait à dire……… J’aimerais également préciser une chose, en lecteur/écriture continue, vu la lenteur d’une mémoire, il est difficile de ralentir la boucle si l’algo est bon. En effet, sous RAGE, je peux m’amuser à passer 40 instructions entre chaque acces mémoire sans rien ralentir, preuve que la mémoire est over saturée et que meme avec les pieds, il est très difficile de louper totalement un benchmark mémoire, en C ou ASM, vu l’énorme rapport de vitesse entre un CPU et la RAM.
Ta routine n’aligne pas la mémoire sur les lignes de cache. Pourquoi c’est moi qui suis obligé de le remarquer?
Du coup, ta série:
dcbz, stfd, stfd, stfd, stfd, dcbst
peut se transformer en quelque chose comme:
dcbz, stfd, dsbst, stfd, stfd, stfd
On voit vite que chaque ligne de cache est chargée inutilement puis vidée une fois de trop.
Pas étonnant que ça rame.
J’imagine qu’Hyperion a modifié l’alignement des routines mémoire d’OS4 par rapport à AmigaOS 68k.
J’imagine aussi qu’os4emu ne reproduit pas ce comportement.
Deux points pour conclure:
– ton benchmark rage n’est pas compatible os4emu.
– comme souvent, tu parles sans savoir mais cela ne t’empêche pas de raconter n’importe quoi sur MorphOS ou le Pegasos (pareil pour kakace… tss tss).
@Henes : Merci de préciser comme je l’ai sus cité que le probleme peut venir d’os4emu Venant de toi, je suis sur que cela aurait un (amiga)impact plus important
@Crisot : Est-il possible de recompiler Rage pour Mos que l’on puissent totalement exclure la cause » os4emu » dans le disfonctionnement du programme sur peg ?
@Logo : Calme toi, mon grand !!!!
@Kakace : Pareil que Logo, peu d’entre nous avons ton niveau, ce qui fait que nous pouvons poser des questions stupides à tes yeux.@all : Avez vous lu l’edit de Kakace ? Les resultats donnés pas Rage ne sont guere different de ceux qu’offre un [email protected] La faute à la trique de DraConBallZ ?
Il faut lire moins vite mon ami, et tu verras que je ne fais que répondre à quelqu’un d’agressif, car G un principe : ne jamais mordre en premier.
PowerMac - G5 2.0 GHz - 1.7 Go RAM - Radeon 9600P 128 Mo - MorphOs 3.13 et Peg2 - G4 RIP
Mac mini - G4 1.42 GHz - 1 Go RAM - Radeon 9200 32 Mo - MorphOs 3.9
WinUAE sur HP Core2 Quad 8200
Epave de Mist FPGA remplacé par un Sidi
A1200 malade 😉 et A500 512+512Ko RAM Kickstart 1.3Ta routine n’aligne pas la mémoire sur les lignes de cache. Pourquoi c’est moi qui suis obligé de le remarquer?
Du coup, ta série:
dcbz, stfd, stfd, stfd, stfd, dcbst
peut se transformer en quelque chose comme:
dcbz, stfd, dsbst, stfd, stfd, stfd
Si la boucle n’est pas alignée correctement, il est certain que les performances sont en chute libre (puisque le dcbz arrive trop tard, et que le dcbst provoque l’écriture d’une ligne de cache incomplète). Au final, chaque ligne de cache est lue depuis la mémoire (dcbz mal placé) puis écrite deux fois (via dcbst puis automatiquement)…
Quoiqu’il en soit, je ne parlais pas de ce cas particulier mais plutôt des différences entre les bandes passantes de chacune des plateformes, notament en lecture, différences mises en lumière par un outil tel que celui de Crisot (certains disaient alors que ça ne servait à rien). Si ces différences existent, elles ne peuvent venir que d’une configuration différente des processeurs, du chipset, ou du design général.
Malheureusement, je n’ai aucun moyen de tester par moi-même et j’en suis réduit aux seules informations fournies sur ce forum. Pour le moment, je n’ai rien vu permettant d’emettre l’hypothèse que le code de Crisot n’est pas correct (sauf en ce qui concerne le « bug » dcbz/pegasos en écriture), et encore moins de contre-exemples avec données chiffrées à l’appui.
Dans ces conditions, vu de l’extérieur, il est raisonnable de conclure que les performances annoncées par le benchmark sont globalement correctes et représentatives de la réalité, d’autant plus que certains aspects sont confirmés par la théorie (vitesse d’écriture > vitesse de lecture).
Les performances annoncées par le benchmark sont globalement correctes et représentatives de la réalité, d’autant plus que certains aspects sont confirmés par la théorie (vitesse d’écriture > vitesse de lecture).
Non point, dans le cas du PegasosII, la vitesse de lecture est supérieure à la vitesse d’écriture avec Ragemem.
Tiki
Non point, dans le cas du PegasosII, la vitesse de lecture est supérieure à la vitesse d’écriture avec Ragemem.
Pourquoi prendre ça en compte alors que ça sent le bug à plein nez (voir le post d’Henes et ce que je dis dans le post précédent) ?
C’est quand même incroyable que quasiment personne ne prend la peine de LIRE et que la plupart se contentent de camper sur leurs positions, quite à détourner le sens de certaines phrases en les sortant de leur contexte. Je ne vois pas en quoi ça fait avancer le débat !
En ce qui me concerne, je me contrefiche de savoir qui de l’AOne ou du Pegasos est le plus performant. D’abord parce que je n’en ai pas, ensuite parce que ça ne m’interresse pas, et enfin parce que les deux sont techniquement dépassés (hardware).
En revanche, les constatations faites à partir du benchmark de Crisot m’interressent parce qu’elles soulèvent un problème lié à l’architecture du PowerPC G4e, et il se trouve que j’ai deux de ces bestioles depuis plus de deux ans et certaines connaissances sur le sujet (dont plus de 20 ans de programmation en assembleur, du Z-80 au PPC en passant par tous les 68k).
Je ne viens pas ici pour attaquer qui que ce soit ou pour démolir telle ou telle plateforme, et encore moins pour me faire tirer dessus à boulet rouge sans raisons. Certaines personnes posent des questions pertinentes auquelles j’essaye de répondre par des explications techniques basées sur l’architecture et le fonctionnement particulier du G4e, dans la mesure de mes moyens. Avec ça, chacun est libre de se faire sa propre opinion, objectivement.
t’as pas compris : les résultats donnés par rage sur peg sont bidons : voir la répose d’henes et le premier commentaire de kakace.
Quant aux résultats sur x86 et sur PPC 603e, cela n’a rien a voir, cela fonctionne différemment. Maintenant, essaye de lire les posts 7 fois dans ta tête avant de poster
( Rhaaaaa, flute, Kakace a édité plus vite que je n’ai posté, ce qui m’oblige a tout reprendre. Et Falcon est intervenu ).
J’ai un Pegasos, mais je pourrais tout aussi bien avoir un Aone si celui ci avait été disponible avec l’OS4 au moment ou j’ai pris la décision d’acheter une nouvelle machine. Je ne regrette certes pas mon achat, mais je ne prends pas parti.
Maintenant, c’est quand meme assez bizarre de se voir conseiller de lire intégralement la discussion alors que vous n’avez pas pris la peine de noter que par 2 fois j’ai dis qu’il y avait surement un bug ( j’ai d’ailleurs montré du doigt os4emu, mais mes competences étant fortement limitées, cela peut parfaitement venir de Ragemem lui meme ) .
La conclusion étant que ce qui s’applique à moi ( et oui, j’ai mal lu le message de Kakace, j’aurais du le relire une nouvelle fois ), s’applique aussi à vous, Kakace.
Sur ce, je quitte cette discussion qui me dépasse de toutes facons.
Tiki
- Vous devez être connecté pour répondre à ce sujet.
› Forums › AmigaOS, MorphOS et AROS › Guéguerres › RAGEmem (Os4 memtest, OS4emu)