/ OSS / Bullet: Yahoo legt Abfrage-Engine für Echtzeit-Streams offen

Bullet: Yahoo legt Abfrage-Engine für Echtzeit-Streams offen

128421-141421-i_rc.jpg
Gerfried Steube on June 17, 2017 - 4:47 am in OSS

Der Begriff Big Data beschreibe längst nicht mehr nur die gesammelten Logs von Apache-Webservern in riesigen Rechenzentren, sondern auch Daten zu Leistungsmetriken, Nutzerverhalten oder von Internet-of-Things-Geräten sowie weiteren eher atypischen Daten, schreibt des Entwicklerteam von Yahoo in seinem Blog. Mit Bullet hat das Team ein Werkzeug erstellt, das die Analyse dieser Daten ermöglicht, ohne diese erst aggregieren zu müssen.

Üblicherweise werden Big-Data-Analysen bisher nur auf statisch abgelegten Daten durchgeführt, die etwa über eine bestimmten Zeitraum aufgezeichnet werden. Mit dem nun als Open-Source-Software zur Verfügung stehenden Bullet könnten Analyseanfragen jedoch auch auf Daten durchgeführt werden, die in Echtzeit durch das Netzwerk gestreamt werden. Grundlage dafür bildet das Apache-Projekt Storm.

“Im Wesentlichen kommen die Daten zu den Abfragen, statt die Abfragen dahin zu leiten, wo die Daten sind. Wenn die Bedingungen der Abfrage erfüllt sind (in der Regel ein Zeitfenster oder eine Anzahl von Ereignissen), endet die Abfrage und gibt dann das Ergebnis zurück”, heißt es vereinfachend in der Beschreibung des Systems.

Bullet skaliert zu Big-Data-Analyse

Laut der Ankündigung skaliert Bullet linear in Bezug auf die Daten sowie die Anfragen. Bei Tests habe das System mehr als 700 Anfrage bei 1,5 Millionen Dateneinträgen pro Sekunde abarbeiten können. Das entspreche einem Datendurchsatz von etwa 5 GByte/s.

Yahoo selbst setze Bullet ein, um das sogenannte User-Engagement zu analysieren. Der Datensatz umfasse dabei rund 100.000 Einträge pro Sekunde, was komprimiert 130 MByte/s entspreche. Ausgeführt wird Bullet dabei auf 100 virtualisierten CPU-Kernen mit 120 GByte RAM.

Read more on: Source

Comments are disabled