Die GPU-betriebene Datenbank MapD wird Open Source

Gepostet am Mai 10, 2017

Das gleichnamige Unternehmen hat die Kerndatenbank und zugehörige Visualisierungsbibliotheken unter der Apache-2-Lizenz auf GitHub veröffentlicht. Der Schwerpunkt liegt auf dem parallelen Einsatz auf Multi-GPU-Servern.

Das Unternehmen MapD bietet unter dem selben Namen eine spaltenorientierte In-Memory-Datenbank an, die darauf ausgelegt ist, GPUs zur parallelen Verarbeitung der Anfragen zu verwenden. Die zentrale Engine MapD Core ist ab sofort quelloffen auf GitHub verfügbar. Laut dem Blogbeitrag sind die Betreiber davon überzeugt, dass Open Source die Innovation vorantreibe, wie sich unter anderem beim Hadoop-Ökosystem und den Deep-Learning-Frameworks zeige. Außerdem ermögliche die Offenlegung eine einfachere Integration mit anderen Projekten.

Das Open-Source-Release enthält das Kernprodukt MapD Core inklusive dem Tiered-Caching-System und der LLVM Query Compilation Engine. Nutzer können damit parallele Queries auf Multi-GPU-Servern ausführen. Die Software ist auf den Betrieb unter Linux und macOS vorbereitet, aber zumindest derzeit nicht für den Einsatz unter Windows. Neben MapD Core haben die Macher JavaScript-Bibliotheken zum Erstellen webbasierter Anwendungen zur Datenvisualisierung, die auf MapD aufsetzen, ebenfalls quelloffen auf GitHub veröffentlicht.

Grafikprozessoren für Data Science

Um allgemein die Entwicklung von Data-Science-Anwendungen auf GPUs voranzutreiben und ein einheitliches Framework zur Datenverarbeitung auf Grafikprozessoren zu erstellen, hat MapD zudem zusammen mit Continuum Analytics und H2O.ai die GPU Open Analytics Initiative ins Leben gerufen.

Basisarchitekturmodell des GPU Data Frame
Basisarchitekturmodell des GPU Data Frame Vergrößern
Bild: GPU Open Analytics

Weitere Details dazu lassen sich der Website der Initiative sowie dem GitHub-Repository entnehmen. Dort ist auch ein Demoprojekt zu finden. Das Repository zu MapD Core befindet sich ebenfalls inklusive der Anleitung zum Build des Projekts auf GitHub. Daneben bietet MapD weiterhin eine Enterprise-Version der Software an, die unter andrem High-Availabilty-Funktionen sowie LDAP- und ODBC-Anbindung enthält. Eine kostenfreie Community-Variante ist ebenfalls verfügbar. (rme)

Deutsche Promi News Deutsche Blog – Nachrichten

Verwandte Beiträge