MEHRWERTE AUS DEM ROHSTOFF – Wir leben Daten

Als Lösungsanbieter für Big Data, Analyse und Künstliche Intelligenz ist es unser Ziel, Unternehmen dabei zu helfen, das volle Potenzial ihrer Daten auszuschöpfen. Wir bieten maßgeschneiderte Lösungen für jede Phase des Datenlebenszyklus an, von der Erfassung über die Verarbeitung bis hin zur Auswertung und Anwendung von Erkenntnissen. Unser Team von Expert:innen verwendet modernste Analyse-Tools und Machine-Learning-Algorithmen, um wertvolle Erkenntnisse aus den Daten zu gewinnen und so eine effektive Entscheidungsfindung zu unterstützen.

Wir helfen Unternehmen dabei, datenbasierte Entscheidungen zu treffen und ihre Wettbewerbsfähigkeit zu steigern.

DATENANALYSE

MACHINE LEARNING

KÜNSTLICHE INTELLIGENZ

DATA MINING

„Data is the new Oil.“ Im Jahr 2006 wurde dieser Satz von Clive Humby geprägt. Heute hat die Aussage nichts an ihrer Aktualität verloren. Verfahren, mit denen ein Mehrwert aus den Rohstoffdaten gewonnen werden kann, sind überall auf dem Vormarsch. Neben klassischen BI-Ansätzen zur Visualisierung und Analyse von Daten spielen künstliche Intelligenz (KI) und maschinelles Lernen (ML) eine immer wichtigere Rolle.

Data Pipelines & Data Science Pipeline

Im Zusammenhang mit datengetriebenen Anwendungsfällen wird oft von einer Data Pipeline oder Data Science Pipeline gesprochen. Die konkrete Umsetzung einer solchen Pipeline variiert und hängt stark von den konkreten Anforderungen und Rahmenbedingungen ab. Im Zentrum einer solchen Pipeline stehen immer die Daten. Diese werden in mehreren Stufen aufbereitet und veredelt, bis aus ihnen ein Produkt (oder Modell) entsteht, das einen Mehrwert generiert.

Unsere Abteilung hat sich darauf spezialisiert, solche Pipelines aufzubauen, die verschiedenen Stufen innerhalb dieser Pipelines umzusetzen und fertige Pipelines zu betreiben.

Entwicklung von Modellen

Für die Analyse der Daten und die Entwicklung von Modellen ist das Team „Data Science“ verantwortlich. Die Expert:innen dieser Abteilung haben unter anderem reichhaltige Erfahrung mit gängigen Machine-Learning-Bibliotheken wie scikit-learn, PyTorch oder TensorFlow.

Das ORDIX^®-Team „DWH/ETL“ hat sich auf die Aufbereitung der Daten spezialisiert. Hierbei kommen zum Beispiel ETL-Tools wie NiFi, Talend oder IBM Data Stage zum Einsatz. Ein weiterer Schwerpunkt des Teams ist die (dimensionale) Datenmodellierung für die effiziente Speicherung großer Datenmengen in einem DWH.

abbildung

Infrastruktur & Betrieb

Um den Aufbau der Infrastruktur und den sicheren Betrieb der Systeme kümmert sich das Team „Engineering & Infrastructure“. Technologische Schwerpunkte des Teams sind Hadoop, NoSQL-Datenbanken und Kafka.

Wenn Sie mit Ihren Daten oder Prozessen in die Cloud wollen, so kann Ihnen das Team „Architecture & Cloud Solutions“ helfen. Dabei spielt es keine Rolle, ob Sie sich für einen der großen Public-Cloud-Anbieter entscheiden, die Systeme on-premises mit OpenStack, OpenShift oder Kubernetes betreiben wollen oder aber einen hybriden Ansatz wählen.

Unser KNOW-HOW im Big Data Umfeld

Partnerschaften im Big Data-Umfeld

Stackable - die flexible Datenarchitektur

Die Stackable Data Platform vereint Offenheit und Flexibilität. Sie bietet eine abgestimmte Auswahl der besten Open Source Data Apps wie Apache Kafka®, Apache Druid, Trino und Apache Spark™.

Zur Stackable Webseite

IBM - Silver Partner

IBM bietet umfassende Datenlösungen, die Unternehmen bei der Integration, Verwaltung, Analyse und Sicherung ihrer Daten unterstützen. Mit KI-gestützten Plattformen wie IBM Watson und Technologien wie Cloud Pak for Data ermöglicht IBM datengetriebene Entscheidungsfindung und Innovation.

Zur IBM Webseite

Cloudera - All Ihre Daten. Eine Plattform. Unbegrenzte Möglichkeiten.

Sicheres Datenmanagement und portable Cloud-native Datenanalysen in einer offenen, hybriden Datenplattform

Zur Cloudera Webseite

GEMEINSAME SUCCESS-STORIES -
Wertschöpfung von Beginn an

Versicherung
Migration der Mainframe-Architekturen in die moderne und hybride Cloud Infrastruktur

Banken
Aufbau des neuen Online-Bankings in der Google Cloud und Migration des Datenhaushalts

Banken
Big Data Dataflow Plattformverwaltung: Wie wir einer führenden deutschen Bank dabei geholfen haben, ihre Daten sicher und stabil zu verwalten

Banken
Aufbau, Betrieb, Weiterentwicklung und Migration eines Hadoop-basierten Data Lakes

Finanzdienstleistungen
Supportdienstleistungen Hortonworks/Cloudera Cluster

Banken
Migration von Big Data Anwendungen in die Cloud

„Wir begleiten Sie beim Aufbau einer maßgeschneiderten Datenplattform, die Ihre Daten effizient für AI-Anwendungen nutzbar macht. Von der Integration und Bereinigung Ihrer Daten bis zur Einrichtung einer skalierbaren Infrastruktur sorgen wir dafür, dass Ihre AI-Projekte erfolgreich starten können.“

Patrick Kramer, Abteilungsleiter Big Data, ORDIX AG

BLOGARTIKEL zum Thema Big Data & AI

Reden ist Silber, Chatten ist Gold – Wir testen die Grenzen des neuen RAG-Features in Oracle APEX

Wir arbeiten derzeit an einem Prototypen für einen Chatbot auf unserer Seminar-Webseite – intern bekannt als „Semibot". Ziel dieses Use-Cases ist es, herauszufinden, ob sich unser bestehender Chatbot ...

Maximale Kontrolle über NiFi-Logs: So ändert ihr das Log-Level in Echtzeit!

Apache NiFi ist eine leistungsstarke Plattform zur Automatisierung und Verwaltung von Datenflüssen – doch was tun, wenn mal etwas klemmt? NiFi ermöglicht eine granulare Konfiguration des Log-Verhalten...

KI unter Kontrolle? Der EU AI Act und was jetzt auf Unternehmen zukommt!

Der EU AI Act ist ein umfassendes Gesetz zur Regulierung von Künstlicher Intelligenz auf globaler Ebene. Mit ihm möchte die Europäische Union sicherstellen, dass KI-Systeme in Europa sicher, transpare...

Micro-Batching oder Event-Driven? So wählt ihr die richtige Streaming-Architektur

Stellt euch vor, ihr leitet ein Unternehmen, das täglich Millionen von Daten aus verschiedensten Quellen erhält – seien es Social Media, Sensoren in der Produktion, Finanztransaktionen oder Logdaten v...

Microsoft HDInsight Autoscaling leicht gemacht

In der heutigen Ära des Cloud-Computings ist es für Unternehmen von entscheidender Bedeutung, ihre Infrastruktur effizient und kostengünstig zu verwalten. Besonders bei der Verarbeitung großer Datenme...

KI beurteilt KI: LLMs als Tools zur Evaluierung von RAG-Systemen

Retrieval Augmented Generation-Systeme (RAG-Systeme) gewinnen zunehmend an Bedeutung. „LLM-as-a-Judge" bietet einen innovativen Ansatz zur automatisierten Evaluierung, indem große Sprachmodelle (LLMs;...

Erfahren Sie mehr in unserem Blog

SEMINARE im Big Data Umfeld

In diesem Seminar erhalten Sie einen Einblick in die wichtigsten Komponenten des Hadoop-Ökosystems. Sie bekommen eine Einführung in die zentralen Hadoop-Komponenten HDFS, YARN und MapReduce. Darauf aufbauend lernen Sie weitere wichtige Dienste aus dem Hadoop-Umfeld kennen. Dazu zählen Hive, Spark, HBase, Kafka und ZooKeeper. Viele praktische Übungen vertiefen das Gelernte.

ZUM SEMINAR

Durch die stetig wachsende Menge und Verfügbarkeit von Daten und deren vielseitige Einsatzmöglichkeiten nimmt die Bedeutung und Notwendigkeit der automatisierten Analyse und Generierung höherwertiger Information drastisch zu. Konzepte und Algorithmen aus dem Bereich des Machine Learnings ermöglichen es, aus den Daten neue Erkenntnisse zu gewinnen, aufwändige und datenlastige Prozesse zu automatisieren und Modelle zur Vorhersage zu entwickeln. Dieses Seminar bietet einen Einstieg in die Themen Data Science und Machine Learning. Sie bekommen einen Überblick über die wichtigsten Methoden und lernen Algorithmen zur Regression, Klassifikation und zum Clustering kennen. In praktischen Übungen verwenden Sie Python, um Daten aufzubereiten und eigene Modelle zu entwickeln.

ZUM SEMINAR

Apache Kafka hat sich in den letzten Jahren zu einem Standard für die Verarbeitung von Datenströmen entwickelt. In diesem Seminar bekommen Sie einen Einblick darin, warum Apache Kafka so erfolgreich ist, und Sie erhalten einen Einstieg in die Anwendung sowie in die Administration. Damit Ihnen der Produktiveinsatz gelingt, werden auch wichtige Themen wie Integration, Überwachung und Hochverfügbarkeit behandelt.

ZUM SEMINAR

In der Unternehmenspraxis stehen oft beträchtliche Mengen an Rohdaten zur Verfügung. Diese Daten können häufig erst dann ihr volles Potenzial entfalten, wenn sie durch einen Labeling-Prozess in verwertbare Informationen für überwachte Modelle transformiert werden. In vielen Fällen können aussagekräftige Labels in der Regel nur von Fachexperten vergeben werden, was zu einem zeitaufwändigen und kostenintensiven Prozess führt. Active-Learning nutzt verschiedene Strategien, um den Labeling-Prozess effizienter zu gestalten und somit die Labeling-Kosten zu reduzieren bei zeitgleicher Steigerung der Modellgüte. In diesem einstündigen Webinar wird ein grundlegendes Wissen über den Active-Learning-Zyklus sowie gängige Query-Strategien vermittelt. Weiterhin werden Sie verstehen, wie sich Active-Learning von anderen Labeling-Strategien unterscheidet.

ZUM SEMINAR

Das 1,5-stündige Kafka Webinar bietet einen Überblick über die Eigenschaften und Besonderheiten des verteilten Nachrichtensystems Kafka. Dabei werden auch betriebliche Aspekte, wie z.B. Monitoring, betrachtet.

ZUM SEMINAR

Maschinelles Lernen, Big Data und künstliche Intelligenz sind in der medialen Berichterstattung allgegenwärtig. Für fachfremde und nicht-Experten wird es zunehmend schwerer, aktuelle Trends, Technologien und Methoden im Kontext der Digitalisierung einzuordnen und realistisch einzuschätzen, um jüngste Entwicklungen gewinnbringend in ihrem Unternehmen einzusetzen. Als Führungskraft oder Fachexperte ohne Programmierkenntnisse lernen Sie in diesem Seminar die wichtigsten Begriffe und Konzepte moderner Datennutzung und die sich bietenden Möglichkeiten kennen, um Ihre Kolleg:Innen ideal auf aktuelle Entwicklungen vorzubereiten. Darüber hinaus verstehen Sie die zentralen Voraussetzungen, um in der Umsetzung erfolgreich zu sein. Sie profitieren von der umfangreichen Projekterfahrung unserer Dozenten und können auf Wunsch eigene Projektideen diskutieren.

ZUM SEMINAR