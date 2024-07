In Jobs, bei denen C++-Code für Hochfrequenzhandelsunternehmen (HFTs) und Hedgefonds geschrieben wird, lässt sich teilweise enorm gut verdienen. Headhunter bezifferten die Vergütung (Gehalt und Bonus) für solche Stellen vor ein paar Jahren auf bis zu 600.000 Dollar und mehr, und das gilt immer noch. Aber es genügt nicht, einfach nur C++ zu können. Die Sprache ist immer vergleichsweise schnell, aber für Trading-Anwendungen mit geringer Latenzzeit muss man wissen, wie man sie wirklich schnell macht.

Paul Bilokon, ehemaliger Director bei der Deutschen Bank, Gastprofessor am Imperial College London und Chief Scientific Advisor bei Thalesians Marine Ltd, sagt, dass das Beherrschen von C++ mit geringer Latenzzeit in der Regel unabdingbar ist, wenn man als C++-Entwickler:in eine wichtige Rolle in einem HFT-Team spielen will. Obwohl einige Unternehmen programmierbare FPGAs verwenden, um eine extrem niedrige Latenzzeit zu erreichen, kann dies laut Bilokon kompliziert sein, da sie spezielle Hardwarekenntnisse und Sprachen wie Lucid, VHDL und Verilog erfordern. „Solange das Unternehmen nicht bereit ist, langfristig in FPGAs zu investieren (sowohl in Forschung und Entwicklung als auch in den laufenden Support), ist es wahrscheinlich eine kluge Entscheidung, den größtmöglichen Nutzen (niedrige Latenz) aus C++ zu ziehen“, erklärt er uns.

Allerdings sind Informationen über C++ mit geringer Latenzzeit schwer zu bekommen. Ein Paper* Bilokon und einem seiner Doktoranden, Burak Gunduz, das letztes Jahr erschienen ist, identifiziert zwölf Techniken zur Verringerung der Latenz in C++-Code:

Lock-free programming: ein nebenläufiges Programmierparadigma mit Multi-Thread-Algorithmen, die im Gegensatz zu ihren traditionellen Gegenstücken keine Mechanismen zum gegenseitigen Ausschluss, wie z. B. Sperren, verwenden, um den Zugriff auf gemeinsame Ressourcen zu vermitteln. SMID-Befehle (Single Mix Multiple Data): Befehle, die die parallele Verarbeitungsleistung moderner CPUs nutzen und die gleichzeitige Ausführung mehrerer Operationen ermöglichen. Mischen von Datentypen: Wenn eine Berechnung sowohl Float- als auch Double-Typen umfasst, sind implizite Konvertierungen erforderlich. Wenn nur Fließkommaberechnungen verwendet werden, steigt die Leistung. Vorzeichenbehaftet vs. vorzeichenlos: Sicherstellung einer konsistenten Vorzeichentreue bei Vergleichen, um Konvertierungen zu vermeiden. Prefetching: Explizites Laden von Daten in den Cache, bevor sie benötigt werden, um Verzögerungen beim Datenabruf zu verringern, insbesondere bei speichergebundenen Anwendungen. Verzweigungsreduzierung: Vorhersage von bedingten Verzweigungsergebnissen, um eine spekulative Codeausführung zu ermöglichen. Slowpath-Entfernung: Minimierung der Ausführung von selten ausgeführten Codepfaden. Kurzschließen: Logische Ausdrücke werden nicht mehr ausgewertet, wenn das Endergebnis feststeht. Inlining: Einbindung des Funktionskörpers an jedem Punkt, an dem die Funktion aufgerufen wird, wodurch der Overhead beim Funktionsaufruf verringert und eine weitere Optimierung durch den Compiler ermöglicht wird. Contexpr: Berechnungen, die als constexpr gekennzeichnet sind, werden zur Kompilierzeit ausgewertet, was eine Konstantenfaltung und eine effiziente Codeausführung durch Eliminierung von Laufzeitberechnungen ermöglicht Kompilierzeit-Versand: Techniken wie Schablonenspezialisierung oder Funktionsüberladung, so dass optimierte Codepfade zur Kompilierzeit auf der Grundlage des Typs oder Werts ausgewählt werden, wodurch die Abfertigung zur Laufzeit und frühe Optimierungsentscheidungen vermieden werden. Cache-Erwärmung: Um die Speicherzugriffszeit zu minimieren und die Reaktionsfähigkeit des Programms zu erhöhen, werden Daten in den CPU-Cache geladen, bevor sie benötigt werden.

Quelle: C++ design patterns for low-latency applications including high-frequency trading

Wie effektiv diese Techniken sind, zeigt die obenstehende Grafik. Während Cache-Warming und Contextpr eine Effizienzsteigerung von 90 Prozent bringen können, führt die Verwendung von vorzeichenbehafteten Vergleichen nur zu 12,5 Prozent Steigerung.

Wenn du dich für das Thema interessierst, empfiehlt Bilokon auch das folgende Konferenzvideo von 2019 mit Carl Cook und Nimrod Sapir bei QSpark, einem Anbieter von Handelsplattformen mit niedriger Latenz:

