Primate Labs hat gerade Geekbench 6 veröffentlicht, eine neue Version seiner beliebten Benchmarking-App. Die neue Version enthält neue Tests und neue Datensätze, um die Leistung besser messen zu können. Die neuen Tests umfassen Hintergrundunschärfe, ähnlich der Technologie, die bei Videokonferenzen verwendet wird; Fotofilter, ähnlich denen, die von modernen Social-Media-Apps verwendet werden; und Objekterkennung für KI-Workloads. Die neuen Datensätze enthalten Fotos mit höherer Auflösung, die mit denen der besten Telefone von heute übereinstimmen (12 bis 48 MP), sowie größere und modernere PDF-Beispiele.
Eine große Änderung bei Geekbench 6 im Vergleich zu Geekbench 5 und anderen Versionen besteht in der Art und Weise, wie Multi-Core-Ergebnisse berechnet werden. Zuvor wurden mehrere einzelne Aufgaben erstellt und gemessen, um zu sehen, wie schnell sie abgeschlossen werden konnten. Je mehr Kerne man hatte, desto schneller wurden sie abgeschlossen. In Geekbench 6 wird jedoch eine Arbeitslast verwendet und alle Kerne arbeiten zusammen an diesem einen gemeinsamen Ziel. Es gilt immer noch: Je mehr Kerne man hat, desto schneller wird die Aufgabe abgeschlossen. Allerdings gibt es jetzt eine Interaktion zwischen den Kernen.
Zeitgleich mit der Markteinführung hatten wir die Gelegenheit, mit John Poole, dem CEO und Gründer von Primate Labs sowie dem ursprünglichen Autor der frühen Versionen von Geekbench, über alles rund um Geekbench 6 zu sprechen.
Um die Benchmark-Ergebnisse von Geekbench 6 zu erfahren, sollten Sie in den nächsten Tagen und Wochen unbedingt wieder bei Android Authority vorbeischauen, da wir es mit den neuesten und besten Geräten auf Herz und Nieren prüfen werden. Sie können sich außerdem unter dem Link oder im obigen Video eine vollständige Abschrift unseres Interviews mit John Poole ansehen.
Haben Sie schon einmal Geekbench verwendet?
436 Stimmen
Ja, auf meinem/meinen Telefon(en).
39 %
Ja, auf meinem/meinen Desktop-Computer(n).
14 %
Ja, auf beiden.
29 %
NEIN.
18 %
Geekbench 6: Ist es ein synthetischer Benchmark?
Im Jahr 2003 brachte Apple den weltweit ersten 64-Bit-Desktop-Computer auf den Markt, den Power Mac G5. Poole kaufte sich einen, doch als er ihn nach Hause brachte, hatte er das Gefühl, dass er nicht viel schneller war als die vorherige Generation. Also lud er einige Standard-Benchmarks der damaligen Zeit herunter, doch nach einigen Tests stellte er fest, dass die vorhandenen Benchmarks nicht besonders gut funktionierten. Also beschloss er, seine eigenen zu schreiben! Drei Jahre später wurde Geekbench 1.0 veröffentlicht. Heutzutage ist Geekbench der De-facto-Standard zum Testen von Computergeräten für Verbraucher , von Laptops und Desktops bis hin zu Android- und iOS-Telefonen.
Trotz ihrer Popularität hegen manche Leute immer noch ein tiefes Misstrauen gegenüber Benchmarks, da sie behaupten, dass sie synthetisch seien und keine realen Anwendungsfälle abbilden. Ich habe John diese Frage gestellt. „In Geekbench 6 haben wir fünfzehn verschiedene Workloads, mit denen wir die CPU-Leistung gemessen haben, und wir haben versucht, eine Vielzahl unterschiedlicher Aufgaben auszuwählen, die unserer Meinung nach zumindest widerspiegeln, wofür die Leute ihre Computer tagaus, tagein oder tagaus verwenden oder wofür sie ihre Smartphones tagaus, tagein verwenden“, sagte er mir. Der Fokus von Geekbench 6, sagt Poole, liege darin, „sich wirklich darauf zu konzentrieren, was die Leute tatsächlich mit ihren Computern machen werden.“ Er fährt fort:
Wir versuchen also wirklich, uns darauf zu konzentrieren, was die Leute tatsächlich mit ihren Computern machen. So etwas wie Komprimierung ist wichtig, denn wenn Sie Apps auf Ihr Smartphone herunterladen, entpackt Android sie und installiert sie dann. Andere Dinge wie HTML-Tests sind enthalten, weil die Leute heute so viel Zeit in ihren Webbrowsern verbringen, das ist eine wichtige zu erfassende Messgröße. Andere Dinge, die aus der Pandemie entstanden sind, Dinge wie Videokonferenzen und wir haben eine Hintergrundunschärfe-Arbeitslast für diesen Zoom-Effekt, bei dem Ihr Gesicht sichtbar ist, aber Ihr Hintergrund nicht, das wird plötzlich zu einer neuen Arbeitslast, die vor drei oder vier Jahren noch nicht einmal relevant war.
Er fügte hinzu: „Wir versuchen herauszufinden, was für die Benutzer interessant sein wird, was tatsächlich CPU-intensiv ist, was für das Gerät im Alltag wirklich wichtig ist. Wir wollen wirklich nicht, dass Geekbench im Vakuum existiert, wir wollen, dass es repräsentativ ist für das, was die Leute tatsächlich tun.“
Können wir die Ergebnisse von Geekbench 5 mit denen von Geekbench 6 vergleichen?
Poole bestätigte mir, dass man die Ergebnisse von Geekbench 5 nicht mit denen von Geekbench 6 vergleichen kann, da es sich um einen völlig neuen Benchmark handelt. Für Geekbench 5 werden die Ergebnisse anhand eines Referenzwerts von 1.000 kalibriert, was dem Wert eines Intel Core i3-8100 entspricht. Ein höherer Wert weist auf eine verbesserte Leistung hin, und eine Verdoppelung des Werts bedeutet eine zweifache Leistungssteigerung. Die Basislinie hat sich für Geekbench 6 geändert, sie wird anhand eines Basiswerts von 2.500 kalibriert, was dem Wert eines Intel Core i7-12700 entspricht.
Interessanterweise wies Poole auch darauf hin, dass man eine Zwischenversion (sagen wir 5.0) nicht unbedingt mit einer anderen Zwischenversion (wie 5.1) vergleichen kann:
Wir werden immer Feedback bekommen, nachdem wir einen Benchmark ausgeliefert haben. Jemand wird uns auf etwas aufmerksam machen und wir sagen „Ups, da haben wir einen Fehler gemacht, den sollten wir beheben“. Wir versuchen das immer in den ersten ein oder zwei Monaten zu tun, also wird 6.0 mit 6.1 vergleichbar sein? Das ist schwer zu sagen, aber danach versuchen wir wirklich, den Benchmark für 6.1, 6.2, 6.3 usw. vergleichbar zu halten. Normalerweise tun wir eine Zwischenversion, weil wir Unterstützung für neue Hardware hinzufügen. Wenn Sie also neue Hardware benchmarken, möchten Sie vielleicht einfach die neuere Version verwenden. Zum größten Teil ist es vergleichbar. Wir versuchen, in den Versionshinweisen explizit darauf hinzuweisen, wo es vergleichbar ist und wo nicht.
Können wir die Leistung von Desktop- und Mobilgeräten anhand der Geekbench-Ergebnisse vergleichen?
Ich bekomme manchmal Kommentare zu Gary Explains , dass Geekbench für ein System besser optimiert ist als für ein anderes, was zu unterschiedlichen Ergebnissen zwischen Desktop und Mobilgerät führt. Ich fragte Poole, ob Geekbench für alle Systeme gleichermaßen optimiert ist: „Absolut, wir verbringen viel Zeit [darauf].“
„Nehmen wir als Beispiel an, wir haben eine NEON-Version einer Funktion geschrieben. Wir wollen diese NEON-Version nicht auf eine SSE-Version aufpfropfen“, erklärt er. „Wir versuchen, die Dinge auf eine Weise zu schreiben, die für den jeweiligen Befehlssatz natürlich ist, die die Vorteile nutzt und die Nachteile dieses Befehlssatzes berücksichtigt. So erhalten wir etwas, das auf beiden Plattformen vergleichbar sein sollte.“
Hardwarebeschleunigung, Optimierung und das „Hardware Computer Museum“
Prozessoren , ob in Desktops, Laptops oder Smartphones, verfügen in der Regel über Hardwarebeschleunigung für verschiedene Aufgaben wie Kryptografie oder Videokodierung/-dekodierung. Außerdem gibt es spezielle Befehlssätze wie SSE und AVX auf x86-64 oder NEON und SVE auf Arm-Chips. Ich fragte Poole, wie Geekbench in Sachen Hardwarebeschleunigung vorgeht. Sein erster Punkt war, dass Geekbench keine spezifischen Videokodierungstests vorsieht. Das liegt nicht daran, dass sie diese nicht einbinden wollen, sondern daran, dass alle modernen Videokodierungssysteme lizenziert und mit Patenten versehen werden müssen. Deshalb hat Primate Labs sie im Moment noch meidet. Aber für andere Tests, wie etwa einen Filtertest im Instagram-Stil, verwenden die Ingenieure das, was eine gängige Anwendung verwenden würde, also für Arm wäre das NEON (und SVE kommt bald, vielleicht in Geekbench 6.1), und für x86-64 wären das SSE und AVX2 razer kraken.
Primate Labs nimmt die Entwicklung von Geekbench ernst – und Geekbench 6 ist keine Ausnahme.
„Wir arbeiten mit Hardware-Unternehmen zusammen, die die Anweisungen verfasst oder implementiert haben. Wir arbeiten mit ihnen zusammen, um sicherzustellen, dass das, was wir haben, nicht unbedingt das Allerbeste ist, was es sein kann, aber dass es eine faire und repräsentative Stichprobe davon ist, wie die Anweisungen verwendet werden könnten“, erklärte Poole. „Wir tun das mit allen verschiedenen Befehlssätzen, die wir unterstützen. Ob es sich also um NEON auf der Arm-Seite oder um AVX auf der x86-Seite handelt, wir versuchen sicherzustellen, dass das, was wir geschrieben haben, fair und vernünftig ist.“
Alle wichtigen Entscheidungen werden in der Test- und Entwicklungsumgebung von Primate Labs getroffen – mit dem Spitznamen „The Hardware Computer Museum“ – die über 150 Testgeräte beherbergt, von einem Intel Core Duo-System bis hin zu Raptor Lake-Systemen (d. h. mit einem Intel Core-Prozessor der 13. Generation). Ich scherzte mit Poole, dass ich wirklich gerne eine Führung durch dieses Labor sehen würde! Er stimmte zu, dass eine Führung durch das Labor und ihren Entwicklungsprozess nützlich wäre, „weil ich denke, dass es viele dieser Ängste zerstreuen würde, die die Leute haben, dass Geekbench eine Blackbox ist, ‚wer weiß, was da drinsteckt?‘“
Tour hin oder her: Poole macht sehr deutlich, wie ernst sie die Entwicklung von Geekbench nehmen – und Geekbench 6 ist da keine Ausnahme.