Data Science - Lösungen. Wissen. Seminare.

Data Science kombiniert statistische Analysen, maschinelles Lernen und fortgeschrittene Datenverarbeitungstechniken, um wertvolle Informationen aus großen Datensätzen zu gewinnen. Bei ORDIX setzen wir moderne Tools und Methoden ein, um komplexe Datenprobleme zu lösen und relevante Erkenntnisse zu generieren. Wir nutzen modernste Technologien und Algorithmen, um Ihre Daten optimal zu analysieren und wichtige Muster, Trends und Zusammenhänge zu identifizieren.

Die Anwendungsbereiche von Data Science sind vielfältig. Wir unterstützen Sie bei der Vorhersage von Kundenverhalten, Optimierung von Geschäftsprozessen, Identifizierung von Betrugsmustern, Personalisierung von Angeboten und vielem mehr. Mit Data Science können Sie datenbasierte Entscheidungen treffen, Ihre Effizienz steigern und einen Wettbewerbsvorteil erlangen.

Unsere Data Science-Lösungen werden speziell auf Ihre individuellen Anforderungen zugeschnitten und unsre Expert:innen bringen langjährige Erfahrung in der Umsetzung von Data Science Use Cases mit. In einem agilen Umfeld arbeiten wir eng mit Ihnen zusammen, um Ihre Geschäftsziele zu verstehen und maßgeschneiderte Anwendungen zu entwickeln.

Der Einsatz von Data Science bietet Ihnen zahlreiche Vorteile. Sie erhalten wertvolle Einblicke in Ihre Daten, können Prozesse optimieren, Kosten senken und neue Chancen für Ihr Unternehmen entdecken. Mit fundierten Entscheidungen auf Basis von Daten können Sie Ihre Marktposition stärken und Ihr Wachstum fördern.

Forschungsengagement unserer Experten

CNN-basierte Spielzustandserkennung für einen Kickertisch

Die Automatisierung von Spielen mithilfe von Deep Reinforcement Learning (DRL) ist eine bekannte Herausforderung in der KI-Forschung. Während in Videospielen oft das gesamte Bild zur Merkmalsextraktion verwendet wird, ist dies bei realen Spielen wie Tischfußball kaum praktikabel. Stattdessen bietet ein kompakter Spielzustand, der nur die wesentlichen Parameter wie Figurenpositionen, Rotationen und Ballbewegungen umfasst, eine vielversprechende Alternative.

In dieser Arbeit stellen wir ein System zur Figuren- und Spielzustandserkennung für Tischfußball vor. Dafür wurde ein Datensatz erstellt, der Rotationen der Stangen über Beschleunigungssensoren und Positionsverschiebungen über klassische Computer-Vision-Techniken erfasst. Auf Basis dieses Datensatzes wurden Convolutional Neural Networks (CNNs) für die Vorhersage der Stangenbewegungen trainiert. Wir evaluieren verschiedene moderne CNN-Architekturen und zeigen, dass unser System den Spielzustand mit hoher Genauigkeit vorhersagen kann.

Das System liefert Daten für beide Teams (schwarz und weiß) und soll künftig als Grundlage für Imitation Learning dienen, welches auf der Analyse menschlicher Spielstrategien basiert.

Zum PDF des Projekts

Automatische Verständlichkeitsbewertung deutscher Sätze mit Transformer-Ensembles

Zuverlässige Methoden zur automatischen Einschätzung der Verständlichkeit von Texten können viele Bereiche, wie machinelle Übersetzung bis hin zum selbstgesteuertem Lernen, beeinflussen. Mit der Verfügbarkeit großer Sprachmodelle für Deutsch wie GBERT und GPT-2-Wechsel eröffnen sich neue Möglichkeiten für Deep-Learning-basierte Ansätze.

In dieser Arbeit untersuchen wir, wie gut Ensembles aus fine-tuned GBERT- und GPT-2-Wechsel-Modellen die Lesbarkeit deutscher Sätze vorhersagen können. Durch die Kombination mit linguistischen Merkmalen und einer Analyse der Zusammensetzung und Größe der Ensembles zeigen wir, dass gemischte Ensembles aus GBERT- und GPT-2-Wechsel-Modellen bessere Ergebnisse liefern als homogene Ensembles. Unsere Modelle wurden im Rahmen der GermEval 2022 Shared Task zur automatisierten Verständlichkeitsbewertung evaluiert und erreichten auf dem ihnen unbekannten Testdaten einen Root Mean Squared Error von 0,435.

Zum PDF des Projekts

Erkennung von Sexismus in deutschen Online-Kommentaren mit Open-Source-Text-Embeddings

Sexistische Kommentare in Online-Medien sind ein weit verbreitetes Problem. Sie treten oft in subtiler Form auf und erschweren dadurch die Moderation, da die Bewertung von Sexismus individuell unterschiedlich ausfallen kann. In dieser Arbeit untersuchen wir, wie monolinguale und mehrsprachige Open-Source-Text-Embeddings zur zuverlässigen Erkennung von Sexismus und Misogynie in deutschsprachigen Kommentaren einer österreichischen Zeitung beitragen können.

Unsere Klassifikatoren, die auf Text-Embeddings basieren, zeigen eine hohe Übereinstimmung mit den Einschätzungen menschlicher Annotatoren. Im Rahmen der GermEval 2024 GerMS-Detect Challenge erzielte unser Ansatz starke Ergebnisse: Platz 4 in Subtask 1 (F1-Score: 0,597) und Platz 2 in Subtask 2 (Jensen-Shannon-Distanz: 0,301). Die hohe Effizienz unseres Verfahrens macht es geeignet für skalierbare Anwendungen in verschiedenen Sprachen und Kontexten.

Zum PDF des Projekts

GermEval 2025 Shared Task zur Erkennung von Candy Speech: Leistungssteigerung durch span-basiertes Training

Positive und unterstützende Kommunikation in sozialen Medien, auch als "Candy Speech" bezeichnet, kann das digitale Miteinander fördern. Die automatische Erkennung solcher Sprache und damit ihr Einfluss auf die Internetkultur ist jedoch bislang wenig erforscht. In dieser Arbeit untersuchen wir, wie Candy Speech in einem deutschsprachigen YouTube-Datensatz mit 46.000 Kommentaren zuverlässig erkannt werden kann.

Wir vergleichen monolinguale und mehrsprachige Sprachmodelle wie GBERT, Qwen3 Embedding und XLM-RoBERTa. Besonders erfolgreich war ein mehrsprachiges XLM-RoBERTa-Large-Modell, das auf span-basierter Erkennung trainiert wurde. Es erreichte den ersten Platz in beiden Subtasks der GermEval 2025 Challenge mit einem F1-Score von 0,8906 für die binäre Klassifikation und 0,6307 für die kategorisierte span-basierte Erkennung. Wir vermuten, dass das span-basierte Training, die Mehrsprachigkeit des Modells und die Verwendung Emoji-sensitiver Tokenizer zur verbesserten Erkennungsleistung beigetragen haben. Unsere Ergebnisse zeigen, dass mehrsprachige Modelle besonders effektiv darin sind, positive und unterstützende Sprache zu identifizieren.

Zum PDF des Projekts

ORDIX® blog – Beiträge zu Data Science

In ihrem Blog präsentiert die ORDIX® regelmäßig Beiträge zu Data Science, die das Wissen der Leser erweitern und sie über die neuesten Entwicklungen auf dem Laufenden halten. Von praktischen Anwendungsfällen bis hin zu technischen Tutorials bietet der Blog eine breite Palette an Informationen zu Data Science.

Seminare im DATA SCIENCE Umfeld

Durch die stetig wachsende Menge und Verfügbarkeit von Daten und deren vielseitige Einsatzmöglichkeiten nimmt die Bedeutung und Notwendigkeit der automatisierten Analyse und Generierung höherwertiger Information drastisch zu. Konzepte und Algorithmen aus dem Bereich des Machine Learnings ermöglichen es, aus den Daten neue Erkenntnisse zu gewinnen, aufwändige und datenlastige Prozesse zu automatisieren und Modelle zur Vorhersage zu entwickeln. Dieses Seminar bietet einen Einstieg in die Themen Data Science und Machine Learning. Sie bekommen einen Überblick über die wichtigsten Methoden und lernen Algorithmen zur Regression, Klassifikation und zum Clustering kennen. In praktischen Übungen verwenden Sie Python, um Daten aufzubereiten und eigene Modelle zu entwickeln.

ZUM SEMINAR

Maschinelles Lernen, Big Data und künstliche Intelligenz sind in der medialen Berichterstattung allgegenwärtig. Für fachfremde und nicht-Experten wird es zunehmend schwerer, aktuelle Trends, Technologien und Methoden im Kontext der Digitalisierung einzuordnen und realistisch einzuschätzen, um jüngste Entwicklungen gewinnbringend in ihrem Unternehmen einzusetzen. Als Führungskraft oder Fachexperte ohne Programmierkenntnisse lernen Sie in diesem Seminar die wichtigsten Begriffe und Konzepte moderner Datennutzung und die sich bietenden Möglichkeiten kennen, um Ihre Kolleg:Innen ideal auf aktuelle Entwicklungen vorzubereiten. Darüber hinaus verstehen Sie die zentralen Voraussetzungen, um in der Umsetzung erfolgreich zu sein. Sie profitieren von der umfangreichen Projekterfahrung unserer Dozenten und können auf Wunsch eigene Projektideen diskutieren.

ZUM SEMINAR

Unsere Ansprechpartner:innen
SPRECHEN SIE UNS AN!

Sie haben Fragen zu unseren Dienstleistungen & Inhouse-Seminaren oder benötigen ein individuelles Angebot? Dann sprechen Sie uns an!