TGen hat sich für das SGI Altix 4700-System mit über einem halben Terabyte Shared-Memory entschieden, damit die Forscher am Institut in Phoenix, Arizona, Suchläufe in den komplett im Speicher befindlichen Daten zu mehreren Chromosomen durchführen können. Eine Aufspaltung der untersuchten Chromosomenabschnitte in kleinere Fragmente ist nicht erforderlich. Die Forscher können so nicht nur die Summe der Teile, sondern die Chromosomen in ihrer Gesamtheit betrachten.
Für diese umfangreichen Datensuchläufe wird noch ein spezieller Inhouse-Code geschrieben. Nach Berichten von TGen wurden Benchmarktests am NCBI (National Center for Biotechnology Information) für BLAST (Basic Local Alignment Search Tool), einem Algorithmus zur Analyse primärer biologischer Sequenzdaten, ClustalW, einem Universalprogramm für multiples Sequenz-Alignment für DNA oder Proteine, und NAMD, einem parallelen Molekulardynamik-Code für große biomolekulare Systeme, durchgeführt. Die Tests ergaben Leistungsverbesserungen von bis zu 50 Prozent auf dem 64-Bit-SGI-Altix-System im Vergleich zur bisherigen 32-Bit-Systemarchitektur.
"Mit der Technologie - und insbesondere den Microarrays - hat der Umfang der Bioinformatik-Datensätze so zugenommen, dass die Anschaffung einer 64-Bit-Recheninfrastruktur mit großem Speicher notwendig geworden ist, um diese Dateien auf dem Level, den unsere Forscher benötigen, bearbeiten und analysieren zu können", sagt James Lowey, Director of High Performance Bio-Computing am TGen. "Konventionelle 32-Bit-Computerarchitekturen können Speicher mit mehr als 4 Gigabyte nicht adressieren. Diese Einschränkung zwingt aufgrund der kostenintensiven langen Computeranalysezeiten, die für optimale mathematische Modelle und Rechenalgorithmen erforderlich sind, zu suboptimalen Analyseverfahren."
Die am TGen untersuchten Datensätze für Molekularprofile umfassen bösartige Geschwülste, Melanome, die Alzheimer-Krankheit, Autismus sowie Bauchspeicheldrüsen-, Prostata-, Dickdarm- und Brustkrebsarten. Mit den Microarrays kann jede Einzeldatei bis zu 150 Megabyte groß sein. Für die Suchläufe und Vergleiche der genetischen Muster verwenden Forscher Hunderte von Kopien jeder Einzeldatei. Der Code von TGen nutzt die Rechenleistung der Global-Shared-Memory des SGI Altix Systems für die Analyse der Microarrays. Dabei wird nach minimalsten Abweichungen gesucht - etwa eine Veränderung in nur einem einzigen Protein - und dann ermittelt, welche Auswirkungen das auf das gesamte untersuchte Spektrum hat.
"Der bisherige Erfolg der TGen-Wissenschaftler war mit großen zeitlichen Opfern verbunden", erläutert Dr. Edward Suh, CIO von TGen. "Doch für Menschen, die von Krebskrankheiten betroffen sind, ist Zeit ein Luxus. Mit dem 64-Bit-SGI-Rechensystem können die TGen-Forscher die erforderlichen Datenanalysen effizienter ausführen, was hoffentlich schon bald zum entscheidenden Durchbruch in der Humanmedizin führen wird."
Das System wird an der staatlichen Universität in Arizona (Arizona State University, ASU) in Tempe, Arizona, installiert und von der Fulton High Performance Computing Initiative (HPCI) der ASU operativ unterstützt. "Die Möglichkeiten der Shared-Memory des neuen SGI-Systems sind eine willkommene Ergänzung im HPC-Portfolio in Arizona. Sie bieten den Forschern am TGen und ihren Mitarbeitern am ASU die Möglichkeit, Probleme anzugehen, mit denen wir uns bisher nicht befassen konnten", so Dan Stanzione, Direktor der Fulton HPCI.
Das Ende Mai 2007 am TGen installierte SGI Altix 4700-System ist mit 576 Gigabyte Speicher und 48 Intel® Itanium® 2-Prozessorkernen ausgerüstet. Es wurde über James River Technical (JRT), Inc., dem designierten Partner von SGI für den Hochschul- und Forschungsbereich, angeschafft.
"Wir freuen uns sehr über den Zuschuss des NIH für TGen und die Installation des SGI-Altix-Systems", kommentiert Tom Mountcastle, President von James River Technical. "Die Genomforschung ist ein strategischer Schwerpunkt von JRT und SGI, und für die Verwaltung und Verarbeitung riesiger Datenmengen und umfassender Workflows ist Altix 4700 wie geschaffen. Es freut uns, dass das System die Erwartungen von TGen erfüllt. Wir sind stolz darauf, Teil der unterstützenden Infrastruktur zu sein, die diese zukunftsweisende Forschung ermöglicht."
"Die von TGen eingesetzte SGI-Technologie ist ein weiteres Beispiel dafür, wie gut die Lösungen von SGI für anspruchsvolle, rechen- und datenintensive Aufgaben in den Biowissenschaften geeignet sind", sagt Deepak Thakkar, verantwortlich für die Sparte Biowissenschaften bei SGI. "Die Skalierbarkeit, Flexibilität und Zuverlässigkeit des Altix-Systems gemeinsam mit ihrer Interoperabilität bietet die beste Kombination aus Rechen-, Speicher- und I/O-Elementen für die vielfältigen Erfordernisse in der Laborumgebung von TGen."