Pharma-Talk mit Jörg Neulist von Zühlke über Data Science in der Pharmaindustrie

Vom Reagenzglas zum Patienten

Jörg Neulist, Lead Consultant für Data Science bei Zühlke

Data Science unterstützt Unternehmen auf dem Weg zur digitalen Transformationen. Auch in der Pharmaindustrie kommen diese Methoden und die Nutzung Künstlicher Intelligenz in vielen Bereichen zum Einsatz. Im Pharma-Talk von pharmaindustrie-online.de nimmt Jörg Neulist, Lead Consultant für Data Science bei Zühlke, den Leser mit in die Welt der Algorithmen. Er beschreibt die Leistungsfähigkeit der Methoden, beleuchtet kritisch die Herausforderungen im Umgang mit KI und gibt spannende Einblicke in Projekte, in denen Unternehmen aus der Pharmabranche von Data Science profitieren.

Herr Neulist, Ihr CEO Ernst Ellmer hat 2019 gesagt, dass Zühlke in Deutschland einen steigenden Bedarf an Expertise im Bereich der Digitalisierung auch in der Pharmaindustrie sehe, insbesondere bei deren Umsetzung. Was unterscheidet Ihr Unternehmen von den vielen anderen Anbietern für Digitalisierungslösungen, insbesondere von den kreativen Start-Ups?

Es gibt einen grundlegenden Unterschied: Start-Ups entwickeln häufig ein Produkt, das skalierbar ist. Oft sind es sehr gute Standardlösungen. Aber sie verfügen nicht über die Kapazitäten großer Unternehmen, um den Kunden individuell zu unterstützen. Unsere Herangehensweise ist eine andere. Wir kommen aus der Beratung und Umsetzung von kundenspezifischen Projekten. Auch sind wir viel stärker darin, Kundenlösungen zu entwickeln, die individuellen Nutzen stiften. Natürlich kennen wir auch die marktüblichen Standardlösungen von Microsoft und Co. Aber wir haben neben den Software-Entwicklern auch UX-Experten für benutzerfreundliche Anwendungen. Business Consultants sorgen dafür, dass der Kunde eine gewinnbringende Lösung erhält. Bei uns wird, unserem Unternehmensmotto „Empowering Ideas“ entsprechend, eine Idee ganzheitlich umgesetzt, statt nur ein Out-of-the-Box Produkt zu verkaufen. Gerade im Bereich Healthcare und Pharma haben wir vielfältige Projekte realisiert, vor allem im Bereich Regulierung.

Hat Zühlke seine Expertise bereits in der Pharmabranche eingesetzt und wenn ja, können Sie das Projekt kurz umreißen?

Wir blicken auf 50 Jahre Erfahrungen im Bereich Pharma und haben mit fast allen europäischen Pharmaunternehmen schon zusammengearbeitet. Ohne Namen nennen zu dürfen, möchte ich drei Projekte kurz anreißen. Ein Beispiel ist die Automatisierung von Laboranalysen. Hier strebte der Kunde eine Unabhängigkeit von den Teillösungen der Gerätehersteller an. Wir haben Software zur Laboranalyse entwickelt, die für eine bestimmte Art der Analyse eine eigene Auswertung vornimmt. Aus praktischer Sicht liefert der Biotechnikhersteller Daten mit seinen Substanzen mit, die Einfluss auf die Analyse haben. Hier haben wir das Pharmaunternehmen begleitet, um das Verfahren durch den gesamten Regulationsprozess in den USA und in Europa zu bringen.

Mit dem Inselspital Bern haben wir ein schönes Projekt umgesetzt: Normalerweise schreibt ein Arzt „ICD10“-Codes auf seine Arztberichte, damit die Verwaltung die Abrechnung mit den Versicherungen abwickeln kann. Diese Berichte waren meist unvollständig und führten zu häufigen Rückfragen. Hier hat Zühlke eine KI mit Natural Language Processing, kurz NLP, entwickelt. Das System liest und versteht die Arztberichte und schlägt daraus ICD10-Codes mit sehr hoher Trefferquote vor. Das spart sowohl in der Verwaltung als auch für die Ärzte viel Zeit. Für die Einrichtung haben wir ein eigenes Data-Science-Team aufgebaut, damit sie nach Projektende eigenständig ohne Zühlke weiterarbeiten konnten. Denn eine Data Science-Lösung ist kein einmaliger Vorgang. Nach der Implementierung muss sie aktiv betrieben und mit Features weiterentwickelt werden.

Aktuell haben wir ein Vorhaben zu „Explainable AI“ gestartet. Wir entwickeln hier die diagnostischen Algorithmen für ein großes europäisches Pharmaunternehmen. Ziel ist, Arztdiagnosen durch Künstliche Intelligenz zu ersetzen. Aber in dem Bereich sind die regulatorischen Hürden sehr hoch. Voraussetzung ist, dass man der KI „auf die Finger schauen kann“ – also nachvollziehen kann, wie sie lernt und warum sie ihre Entscheidungen fällt. Mit Deep Learning in neuronalen Netzwerken kommt man hier nicht weiter, weil die Ergebnisse nicht begründet werden können. Deshalb muss das KI-System verraten, welche Kriterien zu einer Entscheidungen geführt haben.

Gibt es aus Ihrer Sicht Entwicklungsstufen in der Digitalisierung und welche wäre die nächste Stufe auf der Entwicklungsleiter?

Aktuell sehe ich keinen großen KI-Durchbruch, auch wenn Visionäre wie Elon Musk darüber reden, dass Künstliche Intelligenz bald so klug sein soll, dass sie sich selbst weiterentwickelt und dann die Menschheit vernichtet. Davon sind wir unglaublich weit entfernt. Algorithmen sind inselbegabt. Sie können eine bestimmte Aufgabe sehr gut erledigen, weil sie mit Millionen von Datensätzen trainiert wurden. Hier lassen sich Prozesse bewältigen, zu denen Menschen nicht in der Lage sind. Aber sobald die Aufgabe leicht abweicht, wird man keine sauberen Ergebnisse mehr bekommen. Dann haben Menschen mit ihrem komplexen Gehirn und ihren Erfahrungen einen Vorteil gegenüber dem technischen System.

Auch stellen wir fest, dass KI immer mehr zur Massenware wird. Das ist vergleichbar mit dem Internet. Es ist kein eigenes Thema mehr, sondern läuft immer im Hintergrund, um Dinge zu erleichtern. Der Trend führt dazu, dass sich Menschen mit AI beschäftigen, die zu wenig Ahnung von der Materie haben. Ergebnisse werden zu stark simplifiziert. Das Resultat sind beispielsweise Wetter-Apps, die eine Wolke anzeigen statt einer dezidierten Regenwahrscheinlichkeit. Wichtig ist, dass bei KI-berechneten Ergebnissen immer die Unsicherheiten mit ausgegeben werden. Um ein Beispiel aus der Gesundheitspraxis zu nennen: Es macht einen gewaltigen Unterschied, ob die KI-Vorhersage auf die Wahrscheinlichkeit von bösartigen Hautkrebstumoren bei 51 Prozent liegt - im Sinne von: das kann bösartig sein - oder bei 99,9999 Prozent.

Wie verhält es sich hier in Unternehmen?

Der Einsatz von Data Science gewinnt an Normalität. Aktuell wird nicht mehr nur über das System als Insellösung nachgedacht, sondern über Geschäftsmodelle, Lösungen oder Prozessoptimierungen, in denen Data Science zum Einsatz kommen soll. Uns freut diese Entwicklung, denn es wird endlich lösungsorientiert gedacht. So werden die zuvor angesprochenen Hürden teilweise von Anfang an überwunden. Indem man Menschen direkt mit ins Boot holt, ist die Akzeptanz viel größer und der Nutzen deutlich höher.

In Bezug auf Unternehmen ist der Stand der Digitalisierung sehr unterschiedlich. Viele nutzen KI noch überhaupt nicht. Es fehlen Konzepte, um zur „Data Driven Company“ zu werden. Dafür wären Strategieplanungen mit einem Zeithorizont von zehn bis 20 Jahren notwendig, die jedoch gar nichts mit dem Tagesgeschäft zu tun haben. Data Science könnte auf der einen Seite helfen, die richtigen Businessmodelle, Produkte und Kundenansprachen zu finden, um neue Märkte zu erschließen. Aber sie unterstützt auch, vorhandene Produkte auf völlig andere Art und Weise zu monetarisieren. Digitale Geschäftsmodelle sind so ein Beispiel. Besonders die Hidden Champions sind als Mittelständler hier deutlich aufgeschlossener und auch bereit, neue Chance zu ergreifen und Risiken einzugehen.

Eine persönliche Frage zu Abschluss: Sie sind bei Zühlke der Lead Consultant für Data Science. Unser Gespräch heute hat sich hauptsächlich um die Bedeutung von Daten gedreht. Spiele Daten auch in Ihrem privaten Alltag eine große Rolle?

Wie wahrscheinlich jeder Data Scientist habe ich zu Beginn der Corona-Pandemie ein persönliches Dashboard programmiert. Ich wollte mit Hilfe von Data Science Methoden verstehen, was passiert und wie sich die Situation entwickelt. Über die Wochen und Monate habe ich das System weiter verfeinert, weil mir die Zahlen nicht spezifisch genug waren. Jetzt bekomme ich die Entwicklung von Hotspots in meiner Umgebung angezeigt. Dafür nutze ich die Rohdaten vom RKI. Auch für anstehende private und berufliche Reisen lasse ich mir die Daten der jeweiligen Orte tagesaktuell, aber auch in der Statistik anzeigen. Ein Spezifikum habe ich in meinem Dashboard: Ich ziehe die Fälle von vor 14 Tagen von den heutigen ab. So bekomme ich einen realistischeren Stand der Inzidenz. Damit versorge ich auch meine Eltern und Schwiegereltern, die aufgrund ihres Alters zur Risikogruppe gehören.

Herr Neulist, wir danken Ihnen für die spannenden Einblicke in die Welt der Künstlichen Intelligenz!