Mit dem KI-gestützten Federated Data Lakehouse von Blossom Sky können Sie Analysen, maschinelles Lernen (ML) und KI auf verschiedenen föderierten Datenquellen und Formaten ausführen, ohne Daten in zentrale Datenspeicher oder Data Lakes verschieben oder kopieren zu müssen. Die meisten unserer Kunden nutzen die Blossom Sky-Plattform, um ihre aktuellen Datenplattformen und Verarbeitungsmodule zu vereinheitlichen. Ein Virtual Data Lakehouse ermöglicht die dezentrale Verarbeitung und den föderierten Datenzugriff über eine Vielzahl von Datenquellen und Formaten. Es ermöglicht Benutzern, Analyse- und KI-Aufgaben direkt dort auszuführen, wo sich die Daten befinden, ohne sie verschieben oder kopieren zu müssen.
Blossom Sky von DataBloom kann Unternehmen dabei helfen, bis zu 35 Prozent ihrer aktuellen Datenausgaben wiederherzustellen und erneut bereitzustellen, indem ein besseres Datenmanagement auf Datenarchitektur-, Beschaffungs- und Nutzungspraktiken angewendet wird. Viele der empfohlenen Verbesserungen können mithilfe von Blossom Sky schnell umgesetzt werden, sodass Unternehmen innerhalb von sechs Monaten zweistellige Einsparungen erzielen. Unternehmen können erhebliche Einsparungen erzielen, indem sie ihren aktuellen Datenstapel mit Blossom Sky optimieren.
Senkung der Investitionskosten durch Vereinheitlichung vorhandener Datenplattformen
Wir analysieren Blossom im Vergleich zu den hochmodernen Apache Spark-Instances für Big-Data-Analysen. Wir haben in mehreren Forschungsartikeln berichtet, dass Apache Spark im Durchschnitt das schnellste Big-Data-System ist. Wir haben daher die Zeit- und Kostenvorteile von Blossom Sky mit Apache Spark verglichen. Die hier angegebenen Zeiteinsparungen stammen aus unseren Forschungsartikeln. Zur besseren Darstellung der Arbeitslasten der Benutzer betrachten wir drei Hauptarbeitslasten:
- Textanalyse (z. B. Worthäufigkeit, Wortsynonyme, Erstellung inverser Indizes)
- Datenanalyse (z. B. Aggregatabfragen und Join-Abfragen)
- maschinelles Lernen (SGD, K-Means und gemeinschaftsübergreifender Pagerank)
Für diesen Vergleich haben wir eine einzelne AWS-Cloud-Instance von zwei gängigen Typen betrachtet: m4 (2,42 $/h) und T3 (8,786 $/h). Wir gehen davon aus, dass der Benutzer die Instanz 8 Stunden am Tag weiterlaufen lässt, um ihre Datenanalysen durchzuführen. Die folgende Tabelle veranschaulicht die Vorteile von Blossom in Bezug auf Zeit- und Kosteneinsparungen. Bemerkenswerterweise stellen wir fest, dass die Verwendung von Blossom Sky immer zu Zeit- und Kosteneinsparungen führt: Sie ermöglicht es den Benutzern sparen über 200.000$ pro Jahr in der oben genannten Einstellung.
Reduzieren Sie die Betriebskosten und die Investitionskosten, indem Sie Ihren aktuellen Datenstapel wiederverwenden
Unserer Erfahrung nach entlasten Unternehmen ihre Mitarbeiter möglicherweise um ein Drittel, indem sie die Kosteneinsparungen bei der Einstellung von IT-Mitarbeitern ignorieren, und können ihre derzeitige Belegschaft sofort umschichten. Um beispielsweise einen Spark-Cluster mit 25 Knoten in AWS zu verwalten und etwa 5 KI-Beratungsprojekte durchzuführen, beträgt die typische Teamgröße insgesamt 14 Teammitglieder:
- Backend-Entwickler (5)
- Systemspezialisten (2)
- Datenwissenschaftler//Datenanalyst (4)
- Projektmanager (3)
Durch die Implementierung von Blossom Sky reduziert sich die durchschnittliche Teamgröße auf 7 Mitarbeiter:
- Backend-Entwickler (2)
- Systemspezialisten (1)
- Datenwissenschaftler//Datenanalyst (2)
- Projektmanager (2)
Dies führt auch zu erheblichen Kostensenkungen für das gesamte Unternehmen. Aufgrund der längeren Nutzung bereits vorhandener Datenverarbeitungsplattformen wie Hadoop oder Spark und seiner kommerziellen Versionen sparen unsere Kunden oft 35 bis 40% der Betriebskosten und im Durchschnitt mehr als 50% CapEx-Kosten, wenn sie Blossom Sky verwenden. Bitte beachten Sie, dass die Einsparungen bei den Betriebskosten umgehend umgeschichtet werden können, um mehr Projekte gleichzeitig voranzutreiben.
Über Scalytics
Apache Wayang: Das führende Java-basierte Federated Learning-Framework
Scalytics nutzt Apache Wayang als Basis, und wir sind stolz darauf, dieses Projekt zu fördern. Sie können das öffentliches GitHub-Repository hier einsehen. Wenn Ihnen unsere Software gefällt, zeigen Sie Ihre Wertschätzung und Unterstützung – ein Stern ⭐ würde uns viel bedeuten!
Wenn Sie professionelle Unterstützung von unserem Team von branchenführenden Experten benötigen, können Sie sich jederzeit an uns über Slack oder E-Mail wenden.