Data Science - Lösungen. Wissen. Seminare.

Data Science kombiniert statistische Analysen, maschinelles Lernen und fortgeschrittene Datenverarbeitungstechniken, um wertvolle Informationen aus großen Datensätzen zu gewinnen. Bei ORDIX setzen wir moderne Tools und Methoden ein, um komplexe Datenprobleme zu lösen und relevante Erkenntnisse zu generieren. Wir nutzen modernste Technologien und Algorithmen, um Ihre Daten optimal zu analysieren und wichtige Muster, Trends und Zusammenhänge zu identifizieren.

Die Anwendungsbereiche von Data Science sind vielfältig. Wir unterstützen Sie bei der Vorhersage von Kundenverhalten, Optimierung von Geschäftsprozessen, Identifizierung von Betrugsmustern, Personalisierung von Angeboten und vielem mehr. Mit Data Science können Sie datenbasierte Entscheidungen treffen, Ihre Effizienz steigern und einen Wettbewerbsvorteil erlangen.

Unsere Data Science-Lösungen werden speziell auf Ihre individuellen Anforderungen zugeschnitten und unsre Expert:innen bringen langjährige Erfahrung in der Umsetzung von Data Science Use Cases mit. In einem agilen Umfeld arbeiten wir eng mit Ihnen zusammen, um Ihre Geschäftsziele zu verstehen und maßgeschneiderte Anwendungen zu entwickeln.

Der Einsatz von Data Science bietet Ihnen zahlreiche Vorteile. Sie erhalten wertvolle Einblicke in Ihre Daten, können Prozesse optimieren, Kosten senken und neue Chancen für Ihr Unternehmen entdecken. Mit fundierten Entscheidungen auf Basis von Daten können Sie Ihre Marktposition stärken und Ihr Wachstum fördern.

Forschungsengagement unserer Experten

CNN-basierte Spielzustandserkennung für einen Kickertisch

Automatische Verständlichkeitsbewertung deutscher Sätze mit Transformer-Ensembles

Erkennung von Sexismus in deutschen Online-Kommentaren mit Open-Source-Text-Embeddings

GermEval 2025 Shared Task zur Erkennung von Candy Speech: Leistungssteigerung durch span-basiertes Training

CNN-basierte Spielzustandserkennung für einen Kickertisch

Die Automatisierung von Spielen mithilfe von Deep Reinforcement Learning (DRL) ist eine bekannte Herausforderung in der KI-Forschung. Während in Videospielen oft das gesamte Bild zur Merkmalsextraktion verwendet wird, ist dies bei realen Spielen wie Tischfußball kaum praktikabel. Stattdessen bietet ein kompakter Spielzustand, der nur die wesentlichen Parameter wie Figurenpositionen, Rotationen und Ballbewegungen umfasst, eine vielversprechende Alternative.

In dieser Arbeit stellen wir ein System zur Figuren- und Spielzustandserkennung für Tischfußball vor. Dafür wurde ein Datensatz erstellt, der Rotationen der Stangen über Beschleunigungssensoren und Positionsverschiebungen über klassische Computer-Vision-Techniken erfasst. Auf Basis dieses Datensatzes wurden Convolutional Neural Networks (CNNs) für die Vorhersage der Stangenbewegungen trainiert. Wir evaluieren verschiedene moderne CNN-Architekturen und zeigen, dass unser System den Spielzustand mit hoher Genauigkeit vorhersagen kann.

Das System liefert Daten für beide Teams (schwarz und weiß) und soll künftig als Grundlage für Imitation Learning dienen, welches auf der Analyse menschlicher Spielstrategien basiert.

PDF
WSCG 2024
arXiv
Semantic Scholar

Automatische Verständlichkeitsbewertung deutscher Sätze mit Transformer-Ensembles

Zuverlässige Methoden zur automatischen Einschätzung der Verständlichkeit von Texten können viele Bereiche, wie machinelle Übersetzung bis hin zum selbstgesteuertem Lernen, beeinflussen. Mit der Verfügbarkeit großer Sprachmodelle für Deutsch wie GBERT und GPT-2-Wechsel eröffnen sich neue Möglichkeiten für Deep-Learning-basierte Ansätze.

In dieser Arbeit untersuchen wir, wie gut Ensembles aus fine-tuned GBERT- und GPT-2-Wechsel-Modellen die Lesbarkeit deutscher Sätze vorhersagen können. Durch die Kombination mit linguistischen Merkmalen und einer Analyse der Zusammensetzung und Größe der Ensembles zeigen wir, dass gemischte Ensembles aus GBERT- und GPT-2-Wechsel-Modellen bessere Ergebnisse liefern als homogene Ensembles. Unsere Modelle wurden im Rahmen der GermEval 2022 Shared Task zur automatisierten Verständlichkeitsbewertung evaluiert und erreichten auf dem ihnen unbekannten Testdaten einen Root Mean Squared Error von 0,435.

PDF
Code Repository
ACL Anthology
arXiv
Semantic Scholar

Erkennung von Sexismus in deutschen Online-Kommentaren mit Open-Source-Text-Embeddings

Sexistische Kommentare in Online-Medien sind ein weit verbreitetes Problem. Sie treten oft in subtiler Form auf und erschweren dadurch die Moderation, da die Bewertung von Sexismus individuell unterschiedlich ausfallen kann. In dieser Arbeit untersuchen wir, wie monolinguale und mehrsprachige Open-Source-Text-Embeddings zur zuverlässigen Erkennung von Sexismus und Misogynie in deutschsprachigen Kommentaren einer österreichischen Zeitung beitragen können.

Unsere Klassifikatoren, die auf Text-Embeddings basieren, zeigen eine hohe Übereinstimmung mit den Einschätzungen menschlicher Annotatoren. Im Rahmen der GermEval 2024 GerMS-Detect Challenge erzielte unser Ansatz starke Ergebnisse: Platz 4 in Subtask 1 (F1-Score: 0,597) und Platz 2 in Subtask 2 (Jensen-Shannon-Distanz: 0,301). Die hohe Effizienz unseres Verfahrens macht es geeignet für skalierbare Anwendungen in verschiedenen Sprachen und Kontexten.

PDF
Code Repository
ACL Anthology
arXiv
Semantic Scholar

GermEval 2025 Shared Task zur Erkennung von Candy Speech: Leistungssteigerung durch span-basiertes Training

Positive und unterstützende Kommunikation in sozialen Medien, auch als "Candy Speech" bezeichnet, kann das digitale Miteinander fördern. Die automatische Erkennung solcher Sprache und damit ihr Einfluss auf die Internetkultur ist jedoch bislang wenig erforscht. In dieser Arbeit untersuchen wir, wie Candy Speech in einem deutschsprachigen YouTube-Datensatz mit 46.000 Kommentaren zuverlässig erkannt werden kann.

Wir vergleichen monolinguale und mehrsprachige Sprachmodelle wie GBERT, Qwen3 Embedding und XLM-RoBERTa. Besonders erfolgreich war ein mehrsprachiges XLM-RoBERTa-Large-Modell, das auf span-basierter Erkennung trainiert wurde. Es erreichte den ersten Platz in beiden Subtasks der GermEval 2025 Challenge mit einem F1-Score von 0,8906 für die binäre Klassifikation und 0,6307 für die kategorisierte span-basierte Erkennung. Wir vermuten, dass das span-basierte Training, die Mehrsprachigkeit des Modells und die Verwendung Emoji-sensitiver Tokenizer zur verbesserten Erkennungsleistung beigetragen haben. Unsere Ergebnisse zeigen, dass mehrsprachige Modelle besonders effektiv darin sind, positive und unterstützende Sprache zu identifizieren.

PDF
Code Repository
ACL Anthology
arXiv
Semantic Scholar

ORDIX^® blog – Beiträge zu Data Science

In ihrem Blog präsentiert die ORDIX^® regelmäßig Beiträge zu Data Science, die das Wissen der Leser erweitern und sie über die neuesten Entwicklungen auf dem Laufenden halten. Von praktischen Anwendungsfällen bis hin zu technischen Tutorials bietet der Blog eine breite Palette an Informationen zu Data Science.

Automatische Anomalieerkennung in Power BI: Grenzen der KI-Funktion und was ein eigenes Modell leisten kann

Die automatisierte Erkennung von Anomalien in Maschinendaten gewinnt in der Industrie zunehmend an Bedeutung. Durch die Digitalisierung und Sensorik entstehen riesige Datenmengen, deren manuelle Überw...

Wenn BI denken lernt: KI als Gamechanger im Datenprozess

Business Intelligence war gestern, heute denken die Daten mit. Was sich wie Science-Fiction anhört, wird bereits Realität: Künstliche Intelligenz revolutioniert, wie wir mit Geschäftsdaten umgehen. Do...

Vom sokratischen Zweifel zum datengetriebenen DBA: „Ich weiß, dass ich nichts weiß“ im KI-Zeitalter

Wie mir der Oracle MCP Server meinen Wiedereinstieg als DBA beschleunigte. Es gibt Momente, in denen technologische Veränderungen plötzlich greifbar werden. Für mich war heute einer dieser Augenblicke...

Die Vermessung der Bedeutung – Drei Datenbanken auf Sinnsuche

Vektordatenbanken spielen eine zentrale Rolle in modernen KI-Anwendungen. Sie bilden die Grundlage für semantische Textsuchen, indem sie Embeddings, numerische Repräsentationen von Texten oder anderen...

Titelbild Wenn das Sprachmodell plötzlich anders tickt: Vom Umgang mit Modell-Updates

KI generiertes Bild

Wenn das Sprachmodell plötzlich anders tickt: Vom Umgang mit Modell-Updates

Die rasante Entwicklung großer Sprachmodelle (Large Language Models, kurz LLMs) eröffnet Unternehmen laufend neue Möglichkeiten, aber gleichzeitig bringt sie auch technische und organisatorische Herau...

Titelbild Gleiche KI, neues Zuhause: Die feinen Unterschiede zwischen der OpenAI API und Azure AI Foundry

KI generiertes Bild

Gleiche KI, neues Zuhause: Die feinen Unterschiede zwischen der OpenAI API und Azure AI Foundry

KI-Modelle sind längst im Alltag angekommen und die Zahl der Anbieter wächst stetig. Ob bessere Integration, neue Funktionen oder attraktivere Konditionen: Es kann viele Gründe geben, den KI-Anbieter ...

Erfahren Sie mehr in unserem Blog

Seminare im DATA SCIENCE Umfeld

Durch die stetig wachsende Menge und Verfügbarkeit von Daten und deren vielseitige Einsatzmöglichkeiten nimmt die Bedeutung und Notwendigkeit der automatisierten Analyse und Generierung höherwertiger Information drastisch zu. Konzepte und Algorithmen aus dem Bereich des Machine Learnings ermöglichen es, aus den Daten neue Erkenntnisse zu gewinnen, aufwändige und datenlastige Prozesse zu automatisieren und Modelle zur Vorhersage zu entwickeln. Dieses Seminar bietet einen Einstieg in die Themen Data Science und Machine Learning. Sie bekommen einen Überblick über die wichtigsten Methoden und lernen Algorithmen zur Regression, Klassifikation und zum Clustering kennen. In praktischen Übungen verwenden Sie Python, um Daten aufzubereiten und eigene Modelle zu entwickeln.

ZUM SEMINAR

Maschinelles Lernen, Big Data und künstliche Intelligenz sind in der medialen Berichterstattung allgegenwärtig. Für fachfremde und nicht-Experten wird es zunehmend schwerer, aktuelle Trends, Technologien und Methoden im Kontext der Digitalisierung einzuordnen und realistisch einzuschätzen, um jüngste Entwicklungen gewinnbringend in ihrem Unternehmen einzusetzen. Als Führungskraft oder Fachexperte ohne Programmierkenntnisse lernen Sie in diesem Seminar die wichtigsten Begriffe und Konzepte moderner Datennutzung und die sich bietenden Möglichkeiten kennen, um Ihre Kolleg:Innen ideal auf aktuelle Entwicklungen vorzubereiten. Darüber hinaus verstehen Sie die zentralen Voraussetzungen, um in der Umsetzung erfolgreich zu sein. Sie profitieren von der umfangreichen Projekterfahrung unserer Dozenten und können auf Wunsch eigene Projektideen diskutieren.

ZUM SEMINAR

Unsere Ansprechpartner:innen
SPRECHEN SIE UNS AN!

Sie haben Fragen zu unseren Dienstleistungen & Inhouse-Seminaren oder benötigen ein individuelles Angebot? Dann sprechen Sie uns an!

Björn Rauschenbach
Tel: 0611 77840-23
E-Mail schreiben

Jana Müller
Tel: 0611 77840-41
E-Mail schreiben

Gabriele Humberg
Tel: 05251 1063-56
E-Mail schreiben

Sandra Melcher
Tel: 0611 77840-27
E-Mail schreiben

Ivan Sharov
Tel: 05251 1063-31
E-Mail schreiben

Maximilian Biermann
Tel: 05251 1063-36
E-Mail schreiben

ORDIX AG: Über uns; ORDIX^® seminare; ORDIX^® blog

RECHTLICHES: Impressum; Datenschutz; Cookie Hinweise

KONTAKT: ORDIX AG
Karl-Schurz-Straße 19a
33100 Paderborn; Tel: +49 5251 1063-0
E-Mail: info@ordix.de; Kontaktieren Sie uns hier.

Data Science - Lösungen. Wissen. Seminare.

Forschungsengagement unserer Experten

CNN-basierte Spielzustandserkennung für einen Kickertisch

Automatische Verständlichkeitsbewertung deutscher Sätze mit Transformer-Ensembles

Erkennung von Sexismus in deutschen Online-Kommentaren mit Open-Source-Text-Embeddings

GermEval 2025 Shared Task zur Erkennung von Candy Speech: Leistungssteigerung durch span-basiertes Training

CNN-basierte Spielzustandserkennung für einen Kickertisch

Automatische Verständlichkeitsbewertung deutscher Sätze mit Transformer-Ensembles

Erkennung von Sexismus in deutschen Online-Kommentaren mit Open-Source-Text-Embeddings

GermEval 2025 Shared Task zur Erkennung von Candy Speech: Leistungssteigerung durch span-basiertes Training

ORDIX® blog – Beiträge zu Data Science

Seminare im DATA SCIENCE Umfeld

Machine Learning Basics

Grundlagen moderner Datennutzung - Data Literacy

Unsere Ansprechpartner:innen SPRECHEN SIE UNS AN!

ORDIX^® blog – Beiträge zu Data Science

Unsere Ansprechpartner:innen
SPRECHEN SIE UNS AN!