Archive

Posts Tagged ‘ethernet’

Interesting, if true?

November 23rd, 2011 No comments

Hab da grad ein Whitepaper in die Finger bekommen (von Cisco). Die behaupten darin dass ihr, mit 10GigE bestückter Cluster, so schnell ist wie ein gleichwertiger Cluster mit InfiniBand QDR (40Gigabit wie sie selbst zugeben). Ich ja immer übervorsichtig bei Whitepapers von Firmen die einem Sachen verkaufen wollen und dann sich auch noch mit der Konkurrenz vergleichen.

Naja wie dem auch sei, die nehmen unteranderem einen Benchmark der von der Autoindustrie zur Crashsimulation benutzt wird. Ich hab dann mal hinterher gegoogelt und siehe da die Ergebnisse sind öffentlich und scheinen auch zu stimmen. Nur ist mir ein Detail aufgefallen, laut topcrunch.org hatte der IB Cluster (Ergebnisse von 2010) genau “RAM per CPU: 2”, was jetzt viel Interpretation zuläßt. 2GB pro Core, pro CPU, oder 2 RAM-Rigel unbekannter Größe pro CPU. Dem gegenüber steht zumindest ein Cisco Rack mit 96GB pro Node, was 8GB pro Core entspricht.

Ich mutmaße mal dass die hohe/vergleichbare 10GigE Performance durch ein paar Tricks zustande gekommen sein kann, aber kann es natürlich nicht beweisen:

  • Es wurde mehr RAM benutzt damit die Anwendung schnell läuft (ein Indiz dafür ist u.a. die höhere Performance auf einem einzigen Node, s. Figure 2)
  • Die Kommunikationslast der Benchmarks ist sehr gering, bzw die Benchmarks wurden speziell nach dem Kriterium ausgesucht
  • Die Benchmarks arbeiten nur mit sehr kleinen Nachrichten, wodurch die 4x höhere Peakperformance von IB nicht sichbar wird.

Aber lest selbst und bildet euch eine Meinung. Vielleicht siehts von euch ja jemand anders und kann mir glaubhaft erklären warum bei 2 angeblich identische Clustern, die Anwendungen auf dem “von Spezifikationen her langsameren” Interconnect schneller laufen sollen.

Categories: linux, nerdcore, news Tags: , ,