Deutsche optimierte Builds - (FAQ/Mirror: 1. Post LESEN!)

  • BeeHaa,

    da kennst du meinen Kameraden Uli aber schlecht :) Natürlich ist mein Spieltrieb noch vorhanden, aber manchmal ist es angebracht aus der Tiefe des Raumes zu kommen :wink:

    Danke Uli mein Jung,

    den Rest mach ich natürlich wie immer in Eigenregie. Also auf ein neues Fuchsabenteuer im Netz.

  • Zitat von UliBär

    Update!

    1.5.0.4 SSE2 Test Build von tete009 vom 09.07.
    1.5.0.4 SSE Test Build von tete009 vom 09.07.
    1.5.0.4 MMX Test Build von tete009 vom 09.07.

    Optimierte Deutsche Fx-Builds gibts <a href="http://xthost.info/ulibaer/">hier</a> (<a href="http://fsphost.com/ulibaer/">mirror</a>) eventuell mit CTRL-F5 refreshen.

    Viel Spaß damit! :mrgreen:


    Es sind die G6 :( Also ab P2 und P3 von Intel und ab K6 von AMD. Die G7 sind für ab P4/Centrino für Intel und ab Athlon für AMD. Die laufen nochmals paar Umdrehungen höher auf diesen Maschinen.

    loshombre
    G6-Kompilate sind nicht für die Spitze der Nahrungskette gedacht, alter Haudegen :)

    Probieren geht über Studieren

  • Zitat von BeeHaa

    Es sind die G6 :( Also ab P2 und P3 von Intel und ab K6 von AMD. Die G7 sind für ab P4/Centrino für Intel und ab Athlon für AMD. Die laufen nochmals paar Umdrehungen höher.

    Ich habe nunmal Platzprobleme auf dem Server und 6*6,5 = 39 MByte nur für einen Builder ist mir einfach zuviel. G6 ist das Blend-Modell für alle Prozessorarchitekturen und ist ein recht guter Kompromiß. Für Selbstschrauber gibt es ja noch den Germanizer ;)

    Was mir bei tete009 in letzter Zeit nicht so gefällt:
    Er benutzt alte 1.5.0.4 Quellcodes, die noch nicht die Fehlerkorrekturen des aktuellen 1.5.0-Branch enthalten. Das schätze ich besonders an musume - neben der schückelichen About-Box :mrgreen:

    PS: Könnte endlich mal ein Franzose die Italiener nach Hause schicken? :twisted:

    Aloha, Uli

    Seit 102.0 wieder mit dem jeweils neuesten 64bit-Fx von tete009 unterwegs.

  • Zitat von UliBär

    Ich habe nunmal Platzprobleme auf dem Server und 6*6,5 = 39 MByte nur für einen Builder ist mir einfach zuviel. G6 ist das Blend-Modell für alle Prozessorarchitekturen und ist ein recht guter Kompromiß. Für Selbstschrauber gibt es ja noch den Germanizer ;)

    Was mir bei tete009 in letzter Zeit nicht so gefällt:
    Er benutzt alte 1.5.0.4 Quellcodes, die noch nicht die Fehlerkorrekturen des aktuellen 1.5.0-Branch enthalten. Das schätze ich besonders an musume - neben der schückelichen About-Box :mrgreen:


    Das ist jetzt absolut nicht böse gemeint, aber dieser Post ergibt irgendwie keinen Sinn. Nun aber der Reihe nach.
    Natürlich ist musume in der Hinsicht besser. Da ich selbst aber von keinen merkbaren Problemen geplagt bin und tete merkbar schneller ist, fällt die Entscheidung für mich leicht. Abgesehen davon baut tete halt keine 'nicht releases' und fertig. Gecko scheint aber meist recht frisch (?) Dafür sind wir schon in der RC-Phase für 1.5.0.5. Lange wirds ja nicht mehr dauern.

    ABER das kann jetzt nicht von Dir mit dem backfrischen Kode einfach so kommen, wenn Du Leichen auf dem Server mitschleppst wie den 1.0.8 von pigfoot oder 1.5.0.1, 1.5.0.2 und 1.5.0.3 von mmoy.

    Probieren geht über Studieren

  • Zitat von BeeHaa

    ABER das kann jetzt nicht von Dir einfach so kommen, wenn Du Leichen auf dem Server mitschleppst wie den 1.0.8 von pigfoot oder 1.5.0.1, 1.5.0.2 und 1.5.0.3 von mmoy.

    Die gesamten pigfoot Builds liegen auf dem pryan.org Server und sind nur verlinkt, da pigfoot selbst deutsche Lokalisierungen baut.

    ...und mit Verlaub - Du mußt schon mir überlassen, was ich auf meinen Webspace lade...

    Aloha, Uli

    Seit 102.0 wieder mit dem jeweils neuesten 64bit-Fx von tete009 unterwegs.

  • Zitat von UliBär

    Die gesamten pigfoot Builds liegen auf dem pryan.org Server und sind nur verlinkt, da pigfoot selbst deutsche Lokalisierungen baut.


    Ups. Das hab ich nicht nachgeguckt. Sorry.

    Zitat

    ...und mit Verlaub - Du mußt schon mir überlassen, was ich auf meinen Webspace lade...


    Natürlich. Ich überlaß Dir auch die Argumentation. Und Du mir wohl einmal auch meine. Hoffe ich...

    Probieren geht über Studieren

  • Ich bin mir jetzt nich sicher aber habe ich jetzt aus dem G6 ein G7 Tete zusammengestellt, wenn ich auf tetes Seite, die 2 entsprechenden Dateien rausgesucht und kopiert habe, um sie dann anschließend mit dem tbind zu verknüpfen? Falls das so korrekt ist, braucht man doch nicht mehr mit dem Germanizer rangehen.

    Mozilla/5.0 (Windows; U; Windows NT 5.1; de; rv:1.9.0.4) Gecko/2008111022 Minefield/3.0.4 (tete009 SSE PGO)

  • loshombre + andere G7 Fans:
    Wie groß ist denn bei Euch der Unterschied zwischen G6 und G7?
    Ich kann auf meinem Athlon Thunderbird keinerlei Unterschied bemerken. :?
    Werde morgen auf Arbeit mal auf dem 3,4 GHz Preßkot testen...

    Aloha, Uli

    Seit 102.0 wieder mit dem jeweils neuesten 64bit-Fx von tete009 unterwegs.

  • Uli mein Liebster :wink:

    das kann ich dir gar nicht so richtig sagen. Ich verließ mich da immer auf tetes und deine Aussagen, bezüglich der G7+Athlon Maschinen. Am Anfang dieser ganzen Sache hier hab ich auch immer viel rum experimentiert. Irgend wann mal wurde es auf mein Gefühl und paar Tests hin der tete09 G7 SEE und dabei bin ich auch geblieben.

    Das schreib ich schon mit dem neuen, der wie immer und zwar problemlos (hab schon so paar meiner wilden dunklen Seiten angefahren :wink: ) mit ner tollen Peformance aus dem Keller kommt.

  • Zitat von loshombre

    Schön Uli! Danke wie immer für die tolle Arbeit, aber diesmal muss ich wohl selber ran wegen dem G7. Ist aber kein Thema, weil ich doch so ne schöne deutsche Schraube von dir hab :wink: . Also ab in die Werkstatt!


    Meine Rede. Egal mit welchem Bein Ulibär mal wieder aufgestanden ist, immer schön meine Hochachtung und ein Dankeschön für den Germanizer!

    UliBär
    Kann man das denn brauchbar messen? Was bleibt ist der subjektive Eindruck. LEIDER.

    Etymotic
    Nein, leider nicht. Ich erzähls mal lang, aber halt nur 1x.

    Der erste Schritt ist, daß tete (und andere Builder) den eigenen handoptimierten Kode und den für sinnvoll gehaltenen anderer Builder austauscht. Danach wird das KOMPLETTE BUILD durch den Kompiler gejagt, damit aus dem Quelltext Dateien werden ;) DAS ist die zweite Optimierung.

    Die meisten benutzen den VisualC 7.1 von Kleinweich. Einige schon den VC8 (obwohl bis jetzt imho alle in der kostenlosen Express Version, der leider das wichtigste Feature -PROFILING- fehlt) und manche den Kompiler von Intel. Der von Intel macht Athlons aber künstlich langsamer, da es manche Optimierungen nur zuläßt, wenn es eine IntelCPU vorfindet.

    Der Kleinweich VC7.1 (als Beispiel) optimiert also den Kode beim Kompilieren. Das kann man mit Schaltern/Optionen beeinflussen. Eine, die bissl auf die Prozessorarchitektur angeht, ist die Option -Gx. -G6 ist wie gesagt für K6/Athlon und P2/P3 gedacht. G7 für AthlonXP/Athlon64, P4 und Centrino. Mit G6 läuft die Soft auch auf allen späteren CPUs, holt aber nicht alles raus was geht.

    ***
    Das Austauschen der beiden DLLs reicht also nicht, da das Build selbst -G6 bleibt.
    ***

    Mit den DLLs ersetzt man die Originale - und IMHO von tete mit G6 oder G7 kompilierten - memutil.dll (Mozilla?) und msvcr71.dll (Kleinweich) - mit den handoptimierten und neu kompilierten von tete. Mit tmemutil.dll und tmsvcr71.dll. Mit TBind bringt man dem Build durch Patchen bei, auch diese zu benutzen ohne neu kompilieren zu müßen. Was tete dem Anwender auch nicht zumuten kann.
    Den Builds selbst liegen die t-versionen schon ebenfalls bei, aber hier blick ich noch nicht wirklich durch :-?? Ich ersetz das immer mit den entsprechenden Einzelstücken bzw. den Betas die den Builds wohl eh nicht beiliegen.

    Befehlssätze der Builds und DLLs:
    Meine Empfehlung was die Streamingerweiterung angeht, wäre, generell die SSE und speziell die G7/SSE Version zu meiden. Es performt nach meinen wenigen Tests subjektiv schlechter als die MMX. Zweitens bringt es beim P3 nicht viel (G6/SSE), weil es noch nicht besonders viel kann uind das auch nicht besonders schnell.
    Auf dem AthlonXP ist SSE generell langsamer als 3dnow, da viele SSE-Befehle mit 128bit Register arbeiten, AthlonXP aber nur 64bit breite Register dafür bereit hält. Die laufen dadurch auf dem AthlonXP auch noch bis zu 80% langsamer als auf sonst gleich schnellen Pentiums, auf welchen sie selten etwas bringen :wink:

    Die Lutzi geht erst ab SSE2 ab. Das sind Centrino, P4, Core und alle Athlon64. Auf allen ist die Leistung mit SSE2 nicht zu beanstanden. Damit aber nicht gleich jeder den Durchblick hat, kann man die Streaming-Befehle auch mixen. Was man an den Namen der DLLs auch wunderbar sehen kann :D

    Falls niemand Einwände hat, würde sich folgendes ergeben:
    - K6-2 K6-3: G6/mmx, 3dnow
    - Athlon/Duron: G6/mmx, 3dnow/K7
    - AthlonXP/Sempron_SockelA: G7/mmx, 3dnow/K7
    - Athlon64/Sempron_Sockel 754: G7/SSE2, SSE2/3dnow/K8
    - P2: G6/mmx, mmx
    - P3: G6/mmx/(mit SSE mal selbst antesten)
    - P4: G7/SSE2, SEE2
    - Centrino: G7/SSE2, SSE2
    - Core: G7/SSE2, SEE2

    MMX2 bzw. extended mmx macht imho keinen Sinn, da entsprechende Pentiums besser mit SSE2 und Athlons mit 3dnow performen.
    Mit SSE3 - neuere P4 und neuere Athlon64 - bin ich mir ziemlich sicher, daß momentan erst der 'aktuellste' Intel-Kompiler da merkbare Ergebnise erzielt. Beim per Hand vorbereiteten Kode. Da der Kompiler aber Athlons benachteiligt und tete eh keinen Intel-Kompiler benutzt, würde ich das ebenfalls noch ne Weile sein lassen.

    Ich hoffe ich konnte einiges erklären und wenn ich irgendwo falsch liege, hoffe ich bald dazu zu lernen ;)

    Probieren geht über Studieren

  • Ich kann selbst auf dem 3,4 GHz Preßkot keinerlei Unterschied feststellen - aber trotzdem hier für die Fanboys: ;)

    Update!

    1.5.0.4 SSE2 Test Build G7 von tete009 vom 09.07.
    1.5.0.4 SSE Test Build G7 von tete009 vom 09.07.
    1.5.0.4 MMX Test Build G7 von tete009 vom 09.07.

    Aus Platzgründen nur auf dem Mirror: http://fsphost.com/ulibaer/

    Viel Spaß damit! :mrgreen:

    PS: Nun ist hoffentlich Ruhe.

    Aloha, Uli

    Seit 102.0 wieder mit dem jeweils neuesten 64bit-Fx von tete009 unterwegs.

  • Tete's builds sind z.Z. das nonplus ultra was speed angeht dicht gefolgt von musume's. Ich frage mich, wann mmoy wieder loslegt, denn er war für meine Begriffe der Pionier der FX-Raketen :lol:

    Mozilla/5.0 (Windows; U; Windows NT 5.1; de; rv:1.9.0.4) Gecko/2008111022 Minefield/3.0.4 (tete009 SSE PGO)

  • Zitat von UliBär

    Aus Platzgründen nur auf dem Mirror: http://fsphost.com/ulibaer/

    Viel Spaß damit! :mrgreen:

    PS: Nun ist hoffentlich Ruhe.


    Na jetzt geht das Geschrei ja erstmal los :lol:

    fsphost.com is down due to technical maintenance on our database servers, hopefully our service is available again a.s.a.p.

    Etymotic
    War mit Sicherheit das letzte Mal, daß ich mir Mühe mit irgendwelchen Erklärungen mache.

    Probieren geht über Studieren

  • Zitat von UliBär

    Kostenloser Service - da kann man nicht meckern. [Blockierte Grafik: http://www.cosgan.de/images/smilie/konfus/p075.gif]


    Genialer Smiley :D

    Hej Leute, unbekannte Perle?? Ein Kumpel von tete, Herr Ayakawa. Baut zwar nur mit SSE und SSE2, aber: baut 1.5.0.5 Branches, baut eigene Optimierungen ein, baut wie tete Optimierungen von Miyasaka ein, baut die Optimierungen von tete selbst ein (tbind und DLLs sollten funzen) und backt das ganze dann mit der VOLLVERSION von VC8.0, also mit Profiling. Was die schon beschriebenen G-Schalter obsolet machen soll.

    Freiwilige vor 8) Ich krieg das wohl erst morgen auf die Reihe.

    http://marilab.hp.infoseek.co.jp/buildfx/index_en.html

    Probieren geht über Studieren

  • Zitat von hanmac

    also damit ich das verstehe:
    -ich lade mir ein build von tete


    Ja, Das passende.

    Zitat

    -suche mir die passenden Datein
    in meinem fall(AMD64 venic) zb: tmemutil-20060525-3dnow-sse3-k8.zip


    tmsvcr ebenfalls. Venice unterstützt SSE3 ab Stepping E3.

    Zitat

    und binde das ein


    ja. tbind und die beiden DLLs in den FF Ordner kopieren und tbind von da ausführen.

    Zitat

    ->FF noch schneller?


    Wer weiß das schon 8)

    Probieren geht über Studieren