Lies mehr über unser Open-Source-Engagement, unsere Projekte und unsere Forschung in unserem Open-Source Blogs.
Im Gegensatz zu herkömmlichen Datenverarbeitungssystemen, die eine dedizierte Ausführungs-Engine bereitstellen, integriert Apache Wayang transparent und nahtlos mehrere Ausführungs-Engines und nutzt sie zur Ausführung einer einzigen Aufgabe als DAG, was KI über jede angeschlossene Datenplattform ermöglicht, sei es JDBC, Spark, Flink oder Kafka.
LSTEnergy ist ein LSTM-Modell, das es Nutzern ermöglicht, den Energieverbrauch besser zu verstehen, Energieflüsse genauer vorherzusagen und folglich Energie zu sparen und CO2-Emissionen zu reduzieren. LSTEnergy erzielt je nach Datensatz nach etwa 20 Epochen mit hoher Wahrscheinlichkeit eine sehr gute Prognose.
Apache Spark ist ein verteiltes Open-Source-Verarbeitungssystem, das für Big-Data-Workloads verwendet wird. Es nutzt In-Memory-Caching und optimierte Abfrageausführung für schnelle analytische Abfragen für Daten jeder Größe.
Apache Flink wurde so konzipiert, dass es in allen gängigen Cluster-Umgebungen läuft und Berechnungen mit In-Memory-Geschwindigkeit und in jeder Größenordnung durchführt. Es kann unbegrenzte und begrenzte Datenströme verarbeiten.
Apache Hadoop ist ein Open-Source-Software-Framework, das die verteilte Verarbeitung großer Datensätze über Computercluster hinweg mithilfe einfacher Programmiermodelle ermöglicht und mehrere Datentools vereint.
Apache Impala ist eine native Open-Source-Analysedatenbank für Apache Hadoop. Sie bietet eine niedrige Latenz und eine hohe Parallelität für BI-/Analyseabfragen auf Hadoop, was von Batch-Frameworks wie Apache Hive nicht bereitgestellt wird.
TensorFlow ist eine Plattform für maschinelles Lernen, TTF ist für föderierten TensorFlow konzipiert. Es unterstützt verteiltes Training, sofortige Modelliteration und einfaches Debuggen mit Keras und vieles mehr.