10 Qualitätsziele im DMP

10.1 Qualitätsziele: Theorie und Praxis

Qualitätsindikatoren dienen dazu, ausgewählte Aspekte der Versorgung gezielt zu messen. Sie reduzieren die Komplexität des Versorgungsgeschehens auf wenige möglichst gut interpretierbare Kennzahlen und ermöglichen so eine objektive und strukturierte Evaluation der Versorgungsqualität. Oft wird zu einem Indikator ein angestrebter Zielwert definiert und der Indikator als Qualitätsziel bezeichnet. So kann das Ergebnis in seiner einfachsten Form – “Ziel erreicht” oder “Ziel nicht erreicht” – zusammengefasst werden und der Fokus auf nicht erreichte Ziele gelenkt werden.

Ein Qualitätsziel besteht aus folgenden Komponenten:

  • Die Grundgesamtheit (Nenner) gibt an, welche Patienten bei der Auswertung des Zieles zu berücksichtigen sind. Die Grundgesamtheit soll nur diejenigen Patienten einschließen, für die das Ziel relevant ist. Im DMP-Feedbackbericht wird der vereinfachte Begriff “berücksichtigte Patienten” verwendet.
  • Der Zähler zählt die Anzahl der Patienten in der Grundgesamtheit, die ein bestimmtes Kriterium erfüllen.
  • Der Indikator ist der aus Zähler und Grundgesamtheit berechnete Anteil.
  • Der Zielwert und die Zielrichtung definieren bereits vor der Datenerhebung den gewünschten Wertebereich für den Indikator. Er bietet eine Orientierung und macht die Erwartungshaltung deutlich.

Im Rahmen der Disease Management Programme werden über 60 Qualitätsziele gemessen und analysiert. Diese sind auf Bundesebene in der DMP-Anforderungsrichtlinie vorgegeben und werden unverändert als Bestandteil der bayerischen DMP-Verträge festgelegt. Eine Berichterstattung erfolgt sowohl an die koordinierenden Arztpraxen im Rahmen der Feedbackberichte als auch an die interessierte Öffentlichkeit im Rahmen dieses Qualitätsberichts. Auf diese Weise soll ein sachlicher und evidenzbasierter Umgang mit der Versorgungsqualität unterstützt werden.

Qualitätsindikatoren sollen möglichst selbsterklärend sein, was jedoch in der Praxis eine Herausforderung darstellt. Unserer Erfahrung nach kommt es häufig zu Missverständnissen, wenn zum Beispiel nicht jeder Patient in der Grundgesamtheit berücksichtigt wird. Bei der Kommunikation der Ergebnisse hat es sich deswegen als hilfreich erwiesen, die Definition des Indikators immer im medizinischen Kontext zu erklären. Somit wird auch betont, dass die Qualitätsziele nur für einen Zweck existieren, nämlich die Unterstützung einer optimalen leitliniengerechten Versorgung.

10.2 Bewertung der Zielerreichung auf Praxisebene

Die im DMP-Vertrag festgelegten Qualitätsziele gelten sowohl für die Qualitätssicherung auf regionaler Ebene (d. h. für das Kollektiv aller Patienten in Bayern) als auch für die praxisbezogene Qualitätssicherung (d. h. für die Patienten der einzelnen Praxen). Diese unterschiedlichen Situationen stellen unterschiedliche Herausforderungen hinsichtlich der Evaluation dar, die von den Gemeinsamen Einrichtungen berücksichtigt werden. Aus methodischer Sicht bleibt jedoch ein erhebliches Potenzial für die Optimierung der Indikatoren.

Die Erfahrung der letzten Jahre hat gezeigt, dass die Bewertung und Interpretation der Indikatoren vor allem auf Ebene der einzelnen Praxen schwierig ist. Dies ist bedauerlich, weil Befragungen von Ärzten und Praxismitarbeitern ergaben, dass die Bewertung der Zielerreichung als wichtigste Komponente der Feedbackberichte betrachtet wird. Dabei wird die Aufmerksamkeit von vielen Ärzten und Praxismitarbeitern vorrangig auf diejenigen Qualitätsziele gerichtet, die im Bericht “rot” markiert sind (d. h. Ziel nicht erreicht). Aus diesem Grund ist eine verständliche und aussagekräftige Darstellung der Zielerreichung von entscheidender Bedeutung. Es gilt, sowohl eine falsche Sicherheit durch die grüne Markierung von Indikatoren mit Handlungsbedarf als auch einen falschen Vorwurf durch die rote Markierung von Indikatoren mit eingeschränkter Aussagekraft zu vermeiden. Nur so kann eine effektive Qualitätsverbesserung unter Mitwirkung der behandelnden Ärzte vorangetrieben werden.

Im Folgenden wird der Sachstand geschildert, der bisherige Umgang mit dem Problem dargestellt und neue Lösungsansätze beschrieben und diskutiert.

10.2.1 Problembeschreibung

Eine Bewertung der Qualitätsindikatoren auf Praxisebene ist vor allem aus zwei Gründen schwierig:

  1. Geringe Fallzahlen: Viele Praxen haben geringe Fallzahlen, sodass eine präzise Schätzung des Indikators für die Praxis nicht möglich ist. Zum Beispiel ist das Ergebnis “4 von 5 Patienten” dem Ergebnis “400 von 500 Patienten” nicht gleich zu setzen.
  2. Keine Risikoadjustierung: Den Indikatoren unterliegt keine Risikoadjustierung, sodass der Einfluss der Praxisstruktur (d. h. Alter, Geschlecht, Komorbiditäten und sozioökonomischer Status der Patienten) nicht berücksichtigt wird. Somit werden Praxen mit ungünstigen Patientenstrukturen bei der Darstellung der Versorgungsqualität benachteiligt.

Die Folge ist, dass ein Qualitätsziel, das auf die Bedürfnisse einer Vertragsregion zugeschnitten ist, nicht immer den Bedürfnissen der einzelnen Praxen gerecht wird.

Eine Risikoadjustierung ist vor allem auf Praxisebene indiziert. Dies ist in der DMP-Anforderungsrichtlinie jedoch nicht vorgesehen und im Kontext der Berichtserstellung derzeit nur schwer umsetzbar. Solche Verfahren werden daher nur im Rahmen der weitergehenden Analysen der Gemeinsamen Einrichtung angewendet. Im Feedbackbericht wird die Schwierigkeit der Interpretation im ersten Rang durch eine angemessene Kommunikation Rechnung getragen:

  • Werden bei einem Qualitätsziel weniger als zehn Patienten berücksichtigt, wird keine Bewertung vorgenommen. Die Praxis wird über das Ergebnis informiert, sodass eventuell vorliegender Handlungsbedarf beispielsweise unter Verwendung des Patientenanhanges identifiziert werden kann.
  • Die Zielerreichung wird unter anderem durch Verwendung der Farbe blau weniger stark betont. Dagegen wird der Praxis empfohlen, auch bei Erreichung eines Zieles auf mögliches Verbesserungspotenzial zu prüfen.
  • Die Indikatoren werden mit Hinweisen versehen, welche das zugrunde liegende Versorgungsziel für den Arzt und für die Praxismitarbeiter verdeutlichen. Auch so kann der Fokus weg von einer starren Interpretation “Ziel (nicht) erreicht” und hin zu einer konstruktiven Auseinandersetzung mit der Versorgungsqualität gelenkt werden.

Einen ähnlichen Ansatz verfolgt das Projektbüro DMP des Zentralinstituts für die kassenärztliche Versorgung (Zi). Die Feedbackberichte des Zi stellen zudem die zeitliche Entwicklung der Indikatoren auf Praxisebene dar, um ein noch differenzierteres Bild der Zielerreichung zu ermöglichen [40].

10.2.2 Umgang mit geringen Fallzahlen

Die oben beschriebenen Probleme der Interpretation sind keine Besonderheiten der DMP. In anderen Ländern und in anderen Sektoren ist eine Vielzahl von Lösungsmöglichkeiten entwickelt worden. Auch das Institut für Qualitätssicherung und Transparenz im Gesundheitswesen (IQTiG) beschreibt mehrere Verfahren, die im Rahmen der stationären und der sektorenübergreifenden Qualitätssicherung eingesetzt werden [41].

Im Folgenden wird eine Methode vorgestellt, die auf der Theorie der statistischen Prozesslenkung basiert. In einem einflussreichen Artikel schlug Prof. Sir David Spiegelhalter vor, den Funnel Plot als geeignetes Tool für die Darstellung von Performanceindikatoren auf Institutionsebene anzuwenden [42]. Ein Funnel Plot zeichnet einen Indikator in Abhängigkeit seiner Präzision (gemessen beispielsweise durch die Anzahl der berücksichtigten Patienten) und berechnet Kontrollgrenzen um den Zielwert. Diese Kontrollgrenzen geben an, welche Ergebnisse mit dem Zielwert kompatibel sind. Die nicht fundierte Regel “Bewertung des Zieles, falls mindestens zehn Patienten vorliegen” kann so durch ein statistisch fundiertes Vorgehen ersetzt werden.

Wird ein Indikator als Anteilswert definiert, so können die entsprechenden 95 %igen Kontrollgrenzen für einen Zielwert \(p_0\) und \(n\) berücksichtigten Patienten wie folgt berechnet werden:

\[p_0 \pm 1,96 \sqrt{\frac{p_0 (1 - p_0)}{n}}\]

Abbildung 10.1 zeichnet Funnel Plots für unterschiedliche Zielwerte zwischen 40 % und 90 %. Die Kontrollgrenzen bilden “Trichter” (engl. “Funnel”), welche die Tatsache widerspiegeln, dass bei einer kleinen Grundgesamtheit eine größere Abweichung vom Zielwert erforderlich ist, um eine statistisch begründete Abweichung feststellen zu können. Die blauen Punkte stellen die Ergebnisse von fünf fiktiven Institutionen (z. B. Arztpraxen) dar. Liegt eine Praxis innerhalb der Kontrollgrenze, so kann sie aus statistischer Sicht vom Zielwert nicht unterschieden werden. Praxen, die oberhalb der oberen Grenze stehen, haben den Zielwert signifikant übertroffen. Praxen, die unterhalb der unteren Grenze liegen, haben das Ziel aus statistischer Sicht nicht erreicht.

__Berechnung der Kontrollgrenzen für einen Indikator mit unterschiedlichen Zielwerten (blaue Linien) und mit der Zielrichtung "größer oder gleich".__ Die grüne Linie gibt an, bei welchem Ergebnis das Ziel als erreicht zu bewerten ist. Die rote Linie gibt an, bei welchem Ergebnis das Ziel als nicht erreicht zu bewerten ist. Praxen, die innerhalb des "Trichters" liegen, sind aus statistischer Sicht nicht vom Zielwert zu unterscheiden.

Abbildung 10.1: Berechnung der Kontrollgrenzen für einen Indikator mit unterschiedlichen Zielwerten (blaue Linien) und mit der Zielrichtung “größer oder gleich”. Die grüne Linie gibt an, bei welchem Ergebnis das Ziel als erreicht zu bewerten ist. Die rote Linie gibt an, bei welchem Ergebnis das Ziel als nicht erreicht zu bewerten ist. Praxen, die innerhalb des “Trichters” liegen, sind aus statistischer Sicht nicht vom Zielwert zu unterscheiden.

Aus der Abbildung ist ein konkreter Nutzen der Methodik sofort erkennbar: Umso geringer die Anzahl an berücksichtigten Patienten, desto vorsichtiger die Bewertung. Die Kontrollgrenzen machen deutlich, dass ein fester Schwellenwert von zehn Patienten keine geeignete Entscheidungsgrundlage darstellt, da auch in diesem Bereich eine große Spannbreite von Ergebnissen mit dem Zielwert kompatibel ist. Sogar mit mehreren Hundert Patienten muss das Ergebnis etwa fünf Prozentpunkte ober- oder unterhalb des Zielwertes liegen, um als signifikant unterschiedlich betrachtet werden zu können.

Funnel Plots werden häufig für die Identifikation von auffälligen Praxen eingesetzt. Abbildung 10.1 zeigt, wie sich die Kontrollgrenzen zwischen statistisch auffälligen und unauffälligen Variabilitäten unterscheiden können. Für die Gemeinsamen Einrichtungen ist die Identifikation von auffälligen Praxen kein primäres Ziel. Vielmehr kann ein möglicher Handlungsbedarf seitens der Vertragspartner insbesondere durch Beantwortung der folgenden Fragen aufgedeckt werden:

  • Wie viele Praxen haben das Qualitätsziel (nicht) erreicht?
  • Existieren gehäuft Praxen, die das Ziel mit sehr gutem oder sehr schlechtem Ergebnis (nicht) erreichen?
  • Bei welchem Anteil der Praxen ist eine Bewertung des Qualitätszieles möglich?

Von Interesse ist daher die Verteilung der praxisbezogenen Ergebnisse unter Berücksichtigung der folgenden Einteilung:

  1. Ziel erreicht: Das Ergebnis liegt oberhalb der oberen Grenze. Somit wurde das Ziel eindeutig erreicht.
  2. Keine Abweichung vom Zielwert feststellbar: Das Ergebnis liegt innerhalb des Trichters. Das Ziel kann zwar als “erreicht” berücksichtigt werden, eine individuelle Bewertung durch den behandelnden Arzt ist jedoch angezeigt.
  3. Ziel nicht erreicht: Das Ergebnis liegt unterhalb der unteren Grenze. Somit wurde das Ziel eindeutig nicht erreicht.

Eine für die Zwecke der Gemeinsamen Einrichtung geeignete Darstellung der praxisbezogenen Ergebnisse ist nachfolgend in der Lesehilfe zu entnehmen.

10.2.3 Fazit

Der Einsatz von Kontrollgrenzen ermöglicht einen statistisch fundierten Umgang mit den praxisbezogenen Ergebnissen unter Berücksichtigung der Praxisgröße. Das Verfahren lässt sich in einfacher Weise berechnen und umgeht die Verwendung eines arbiträren Kriteriums. Es wird vermieden, dass eine ungeeignete Bewertung vorgenommen wird, die möglicherweise ein unpassendes Signal vermittelt. Kontrollgrenzen ersetzen jedoch eine Risikoadjustierung der Indikatoren nicht. In der Tat geht die Literatur generell davon aus, dass zumindest eine elementare Adjustierung für die Alters- und Geschlechtsstruktur stattfindet, da unterschiedliche Patientenstrukturen in den Arztpraxen ein zusätzlicher Grund für die Variabilität der Indikatoren darstellen [42].

Die Gestaltung des ärztlichen Feedbacks ist immer ein Kompromiss zwischen einer hohen Aussagekraft einerseits und einer leicht verständlichen Praxisinformation andererseits. Der Feedbackbericht wird sowohl von Ärzten als auch von Praxismitarbeitern verwendet, welche oftmals über geringere statistische Kenntnisse verfügen. Die Anfragen an die Gemeinsamen Einrichtungen zeigen, dass bereits die Einschränkung der Grundgesamtheit (z. B. Berücksichtigung von Patienten mit Teilnahmedauer von mindestens einem Jahr) oder die Bewertung des Indikators nur ab zehn berücksichtigten Patienten führen nicht selten zu Verwirrung führen. Gleichwohl stellen die Gemeinsamen Einrichtungen fest, dass auch der Verzicht auf solcher Methoden für Unverständnis sorgt, weil die im Bericht ausgewiesene Bewertung als ungerechtfertigt empfunden wird.

Mit dem oben beschriebenen Verfahren möchten die Geimensamen Einrichtungen DMP Bayern einen Beitrag zu der Weiterentwicklung des ärztlichen Feedbacks leisten. Die arztbezogene Bewertung wird in diesem Bericht für die Analyse der Ergebnisse unter den Praxen eingesetzt und liefert hilfreiche Erkenntnisse zum Verständnis der Versorgungssituation in Bayern. Die Konzeption einer optimalen Darstellung für die Ergebnisse im Feedbackbericht stellt eine Herausforderung im Rahmen der Weiterentwicklung der DMP dar.

Literatur

40 Zentralinstitut für die kassenärztliche Versorgung. DMP Feedback. 2017; https://www.zi-dmp.de/Documents/Feedback.aspx

41 Boywitt D, Bungard S. Methodische Grundlagen V1.0. Institut für Qualitätssicherung und Transparenz im Gesundheitswesen, 2017 https://iqtig.org/das-iqtig/grundlagen/methodische-grundlagen/

42 Spiegelhalter DJ. Funnel plots for comparing institutional performance. Statistics in Medicine 2005; 24: 1185–1202 https://doi.org/10.1002/sim.1970