banner

Blog

Jun 09, 2023

Hände

Das Testembargo ist endlich vorbei und wir können Ihnen mitteilen, was wir beim Nvidia Jetson TX2 herausgefunden haben. Es ist schnell. Es ist sehr schnell. Während die beabsichtigte Verwendung des TX2 für jemanden, der einmalige Prototypen baut, eher eine Nische sein mag, sind hier einige sehr interessante Anwendungen vielversprechend.

Letzte Woche kündigte Nvidia den Jetson TX2 an, einen leistungsstarken Einplatinencomputer, der als Gehirn für selbstfahrende Autos, Selfie-Drohnen, Alexa-ähnliche Bots für Datenschutzbewusste und andere Anwendungen konzipiert ist, die viel erfordern Verarbeitung mit einem erheblichen Energiebudget.

Dies ist der Nachfolger des Nvidia Jetson TX1. Seit der Veröffentlichung des TX1 hat Nvidia große Fortschritte gemacht. Jetzt haben wir Pascal-GPUs und es gab noch nie einen besseren Zeitpunkt, eine Grafikkarte zu kaufen. Deep Learning ist ein heißes Thema, mit dem sich jeder neue CS-Absolvent befassen möchte, und das bedeutet Racks voller GPUs und CUDA-Kerne. Die Jetson TX1 und TX2 sind Nvidias Vorstoß im Bereich Embedded Deep Learning oder Geräte, die viel Rechenleistung benötigen, ohne die Batterien leer zu saugen.

Bevor wir uns mit diesem Test befassen, ist es ein guter Zeitpunkt, die Embedded-Angebote von Nvidia in einen historischen Kontext zu stellen. Der Nvidia TK1 war das erste Angebot, das im April 2014 auf den Markt kam. Obwohl es sich immer noch um einen leistungsfähigen Einplatinencomputer handelt, gibt es mittlerweile günstigere Optionen, die fast genauso gut sind. Wenn Sie die im TK1 enthaltene Kepler-GPU nicht benötigen, greifen Sie einfach zu einem Pi oder Beaglebone.

Das Nvidia TX1 kam im November 2015 auf den Markt. Dieses Board war eine deutliche Abkehr vom TK1. Das TX1 ist ein Modul im Kreditkartenformat, das an einem Kühlkörper befestigt ist. Damals war der TX1 das beste leistungsstarke Embedded-Linux-Gerät, das man kaufen konnte. Mit einer leistungsstarken Quad-Core-ARM-Cortex-A57-CPU gepaart mit einer Maxwell-GPU war die Leistung großartig. Auch heute noch weist die Nvidia TX1 im Vergleich zur Konkurrenz eine akzeptable Leistung auf.

Kurz nach der Einführung des TX1 wurde Pine64 – der „weltweit erste 64-Bit-Einplatinencomputer“ – auf Kickstarter gestartet. Die Veröffentlichung war eine Katastrophe und ich kann einen Pine64 nicht empfehlen. Wenige Monate nach dem Pine64 erschien der Raspberry Pi 3B mit einem Quad-Core-ARM-Cortex-A53. Der Pi 3B ist der erste Pi, der sich wie ein richtiger Desktop-Computer anfühlt. Es ist schnell genug für allgemeines Rechnen und gut genug für (leichte) schwere Arbeit.

Im März 2016 kam der Odroid C2 auf den Markt. Wie der Pi 3B war er mit einem Quad A53 ausgestattet. Auch hier handelt es sich um einen passablen Desktop-Computer, der schnell genug für allgemeine Computeraufgaben ist. Ende letzten Jahres veröffentlichte der Orange Pi seinen Cattywampus PC2, einen weiteren Quad-Core-A53-Einplatinencomputer. Dabei handelt es sich allesamt um akzeptable Einplatinencomputer, deren Leistung die Menschen im Jahr 2000 in Erstaunen versetzt hätte.

Etwa 18 Monate lang wurden weltweit Dutzende ARM-basierte Einplatinencomputer auf den Markt gebracht. Jetzt haben wir so ziemlich die Grenze dessen erreicht, was ein kleines ARM-Linux-Board mit geringem Stromverbrauch leisten kann. In einem seltenen Interview über die Zukunft des Raspberry Pi sagt [Eben Upton], dass wir noch eine Weile bei 40-nm-Chips festsitzen werden. Bis neuere, schnellere Chips mit neuen Architekturen verfügbar (und günstig) sind, sind dies die schnellsten ARM/Linux-Einplatinencomputer, die Sie kaufen können.

Diese Einplatinencomputer eignen sich hervorragend, wenn Sie lediglich einen Computer benötigen, der in der Lage ist, ein paar Skripte zu verarbeiten, ein paar Webseiten bereitzustellen oder ein paar YouTube-Videos abzuspielen. Wenn Ihr Anwendungsfall Videospiele, das Rendern von Videos oder maschinelles Lernen umfasst, benötigen Sie etwas Leistungsstärkeres. Aus diesem Grund gibt es den Nvidia Jetson TX1 und TX2. Ist es so schnell wie ein Desktop mit i7 und GTX 1080? Nein, aber das ist nicht der Punkt – ein Desktop mit einem i7 6700K und einer GTX 1080 verbraucht mindestens 300 Watt, während der Jetson TX2 bei voller Leistung nur fünfzehn Watt verbraucht.

Das TX2 ist eine winzige Platine, die an einen Kühlkörper in Kreditkartengröße geschraubt ist. Das ist das Herzstück des TX2, aber ich vermute, dass nur sehr wenige Leute jemals mit einem bloßen TX2-Modul arbeiten werden. Ich weiß nicht einmal, ob man das TX2-Modul in Stückzahlen kaufen kann. Anstatt mit dem Modul selbst und den darin enthaltenen Benchmarks zu beginnen, beginne ich mit dem TX2 Developer Kit.

Das Jetson TX2 Developer Kit ist im Grunde ein Mini-ITX-Motherboard. Das ist ein großartiger Formfaktor für ein Entwicklungskit und tritt in die Fußstapfen des Jetson TX1. Zwischen den Entwicklerkits TX1 und TX2 hat sich kaum etwas geändert.

Für alle, die bereits den Jetson TX1 verwenden, ist der TX2 ein direkter Ersatz. Darüber hinaus wird Nvidia den TX1 weiterhin unterstützen, den TX1 nicht auslaufen lassen und es wird eine Preissenkung für den TX1 geben. Abhängig davon, wie stark der Preisnachlass ausfällt, würde ich das TX1 jedem wärmstens empfehlen, der ein schnelles Linux-System mit geringem Stromverbrauch benötigt. Anscheinend ist Nvidia dem Jetson-Ökosystem verpflichtet, und wenn Sie jemals etwas Schnelleres benötigen, erwartet Sie das „Drop-in-Replacement“-Versprechen des TX2.

Was Sie mit der Trägerplatine erhalten, finden Sie hier in Ihrer Stichpunktliste

Auf der Trägerplatine hat sich seit dem Jetson TX1, wenn überhaupt, nicht viel geändert. Da es sich um ein Mini-ITX-Motherboard handelt, hätte ich mir etwas anderes als einen Hohlstecker und ein Brick-Netzteil gewünscht. Ein echter 20- oder 24-poliger ATX-Stromanschluss wäre übertrieben gewesen, aber 6- oder 8-polige PCIe-Anschlüsse sind klein genug und irgendwo auf der Platine ist Platz dafür. Vielleicht in ein paar Jahren.

Auch wenn es sich um ein Board im Mini-ITX-Format handelt, ist es für alle Anwendungen, bei denen der Jetson sinnvoll ist, immer noch riesig. Dieses Board passt nicht hinter die Headunit eines Autos und es ist zu groß für eine Drohne. Seit der Veröffentlichung des Jetson TX1 hat mindestens ein Unternehmen eine Reihe von Trägerplatinen für dieses Modul herausgebracht. Die Jetsons-Themenplatinen von Connecttech zeigen die wichtigsten Teile einer eingebetteten Lösung auf, obwohl ich sie noch nie in freier Wildbahn gesehen habe.

Auf der Unterseite des TX2 befindet sich ein riesiger, verwirrender und tatsächlich beziehbarer Anschluss. Wenn Sie Ihr eigenes Breakout-Board für den TX1 oder TX2 bauen möchten, müssen Sie sich nur an Samtec wenden und ihnen die Teilenummer SEAM-50-02.0-S-08-2-AK-TR geben. Dieses Teil sollte in der ersten Stückzahl nicht mehr als 5,50 $ kosten. Um es zu verwenden, benötigen Sie eine vierschichtige Platine, die Sie von Hand löten können. Ich warte sehnsüchtig auf einen Pi-Top-Adapter für den Nvidia Jetson.

Das ist das Developer Kit, aber was ist mit dem tatsächlichen Jetson TX2?

Im Vergleich zum Jetson TX1 verfügt der TX2 über doppelt so viel RAM mit mehr Bandbreite, doppelt so viel eMMC-Flash und kann 2K-Videos doppelt so schnell kodieren. Die CPU ist ein Dual-Core Nvidia Denver 2.0 und ein Quad-Core ARM Cortex A57.

Der Jetson TX1 hatte einen ARM Cortex A57 und einen A53 Quad-Core auf dem Chip. Die A53-Kerne waren für den Jetson nicht aktiviert. Der TX2 hingegen ist eine echte Multi-Core-CPU mit einem Quad-A57, der Berichten zufolge gut für Multithread-Anwendungen geeignet ist, und einem Dual-Core-Denver 2, der für leistungsstarke Single-Thread-Anwendungen gedacht ist.

Im letzten Jahr veröffentlichte Nvidia seine neueste GPU-Reihe. Wir sollten uns nicht wundern, dass der TX2 auf der Pascal-Architektur basiert. Das ist großartig – wenn Sie einen GPU-Cluster aufbauen oder Counter Strike mit achttausend Bildern pro Sekunde spielen möchten, ist eine Pascal-basierte GPU das beste Preis-Leistungs-Verhältnis.

Der Jetson TX2 verfügt über zwei Leistungsmodi. Bei der Einstellung „Max Q“ handelt es sich um maximale Energieeffizienz, die bei der Messung mit einem Messgerät bei etwa 7,5 Watt liegt. Die Einstellung „Max P“ steht für maximale Leistung und liegt bei etwa 15 Watt. Im Max-P-Modus soll die Leistung doppelt so hoch sein wie beim Jetson TX1. Ich konnte mit einem einzigen Befehl im Terminal zwischen diesen Modi wechseln.

Noch ein Wort zum riesigen Kühlkörper des TX2-Moduls: Beim Durchführen von Benchmarks schaltete sich der Lüfter nie ein. Der Kühlkörper fühlte sich immer kaum warm an. Ich gehe davon aus, dass der TX2 im August in Florida im Motorraum eines Autos installiert werden soll.

Endlich der Teil, auf den Sie alle gewartet haben. Wie schnell ist der TX2 im Vergleich zur Konkurrenz? Es ist sehr schnell.

Die CPU des TX2 ist ein Dual-Core Nvidia Denver 2.0 gekoppelt mit einem Quad-Core ARM Cortex A57. Wie oben erwähnt, ist der Denver für schnelle Single-Core-Leistung gedacht, während der A57 für parallele Prozesse gedacht ist, aber nicht so parallel, dass eine GPU eine bessere Lösung wäre. Dafür gibt es die Pascal-GPU mit 256 CUDA-Kernen. Im Vergleich zum TX1 sind Speichergröße und Bandbreite verdoppelt.

Ich habe Unixbench verwendet, um die CPU auf dem TX2 und dem Raspberry Pi 3 Modell B zu charakterisieren. Die Ergebnisse sind unten:

Was ist daraus zu ziehen?In synthetischen Benchmarktests der CPU ist der Nvidia Jetson TX2 etwa viermal so schnell wie der Raspberry Pi 3 . Es ist höllisch schnell. Ich kann es kaum erwarten, dass jemand ein Game Cube-Gehäuse für dieses Ding in 3D druckt.

Der Vergleich der Leistung des TX2 mit anderen Einplatinencomputern ist etwas schwieriger. Ich würde einem selbstfahrenden Auto, das von einem Raspberry Pi gesteuert wird, nicht vertrauen; Die Leistung ist einfach nicht da. Auch der Test eines selbstfahrenden Autos mit Jetson TX2-Antrieb kommt nicht in Frage.

Es ist tatsächlich ziemlich schwierig, Ihnen einen Eindruck von der Leistung des TX2 bei bildintensiven Aufgaben zu vermitteln. Glücklicherweise hat Nvidia dem Testpaket einige VisionWorks-Beispiele beigelegt.

Mit VisionWorks konnte der Jetson Merkmale identifizieren, die für die Fahrt über die Golden Gate Bridge relevant sind. Mithilfe der Parallaxe konnte eine Punktwolke eines Parkplatzes erstellt werden. Der Jetson TX2 stabilisierte das Video in Echtzeit. Ein Laptop könnte das tun, ein Pi jedoch nicht.

Aber nicht jedes Deep Learning spielt mit der Kamera; In den von Nvidia veröffentlichten Benchmarks ist der TX2 bei der GoogleNet-Inferenzleistung fast doppelt so schnell wie der TX1. Was die AlexNet-Inferenzleistung betrifft, ist der TX2 besser und verbraucht weniger Strom.

Nvidias Marketingtipp für den Jetson TX2 lautet „Deep Learning At The Edge“. Was bedeutet das? Die Zukunft wird voller Roboter sein, die OpenCV ausführen, Autos, die Menschen automatisch meiden, und Alexa-ähnlichen Sprach-KIs, die ihre gesamte natürliche Sprachverarbeitung lokal durchführen. Diese Anwendungen werden zusammenfassend als Deep Learning bezeichnet. „The Edge“ bezeichnet in dieser Metapher Umgebungen, in denen Netzwerklatenz und Bandbreite ein Problem darstellen. Für ein selbstfahrendes Auto gibt es möglicherweise nicht einmal ein Netzwerk, um Daten zur Verarbeitung an einen Server zurückzusenden. Wenn Sie aus Datenschutzgründen nicht möchten, dass Ihr Alexa-Bot Audioaufnahmen an einen Server zurücksendet, müssen Sie die Verarbeitung lokal durchführen.

Der Jetson ist so konzipiert, dass er bei Anwendungen mit einem begrenzten Energiebudget viel Rechenleistung am „Edge“ zur Verfügung stellt. Dabei handelt es sich um eingebettetes Deep Learning. Ist eine Desktop-CPU bei Deep-Learning-Aufgaben schneller als ein Jetson? Natürlich, aber eine Desktop-CPU verbraucht 60 Watt – der Jetson TX2 verbraucht nur fünfzehn. Wenn es bei Ihrem Projekt oder Produkt darum geht, einen Laptop irgendwo zu verstauen, haben Sie jetzt einen Ersatz, der kleiner, möglicherweise schneller und weniger Strom verbraucht.

Wenn Sie einen Game Cube-Emulator bauen möchten, ist der TX2 nicht das Richtige für Sie. Wenn Ihre Vorstellung von Innovation darin besteht, ein RetroPi-Gehäuse in 3D zu drucken, ist der TX2 nicht das Richtige für Sie. Dies ist kein Spielzeug. Dies ist ein Engineering-Tool. Dabei handelt es sich um ein Modul, das ein selbstfahrendes Auto oder einen Selfie-aufnehmenden Quadrocopter antreibt. Hierbei handelt es sich um schwierige technische Probleme, die eine schnelle Verarbeitung bei geringem Energiebudget erfordern.

Es gibt einen Grund, warum das TX2 Developer Kit teuer ist. Der Markt für ein Gerät wie dieses ist winzig im Vergleich zum Scheffel der Pi Zeros bei Microcenter. Es gibt jedoch kein anderes Tool wie dieses. Wenn Sie eine schnelle CPU benötigen, die nur fünfzehn Watt verbraucht, ist mir keine bessere Option bekannt.

LagerungUSBNetzwerk / KonnektivitätÜberschriftenIn synthetischen Benchmarktests der CPU ist der Nvidia Jetson TX2 etwa viermal so schnell wie der Raspberry Pi 3
AKTIE