Tag

Präzision Archive - Dr. Stavros Kromidas

Die kleine Frage zur Validierung …

By Allgemein, Monatstipp

Unser Kunde sagte: „Ich brauche für meinen Kunden eine Methode mit einer guten Präzision und ohne Ausreißer – alles andere interessiert mich nicht.“ Dieser Kunde ist wichtig, hat keine Ahnung und wir wollen ihn zufrieden stellen. Wie machen wir das?“

Zusammenfassung:
Gute Präzision? So klappt´s:
Hervorragende Werte für die Präzision werden bekannterweise durch eine große Anzahl an Werten erreicht; ferner auch, wenn Messpräzision (Streuung der Werte bedingt lediglich durch das Gerät) statt Methodenpräzision ermittelt wird. Noch „krasser“: Keine Injektion aus sechs vials mit je einer Standardlösung, sondern sechs (drei) Wiederholinjektionen aus einem vial.
Sind Ausreißer vorhanden? So sind keine zu befürchten:
Es sollte als Ausreißertest natürlich der Dixon-Test verwendet werden
a) Kleine Anzahl an Werten: Egal wie stark ein Wert abweicht, wird er kaum als Ausreißer zu deklarieren sein
b) Starke Streuung der Werte – keine Probleme
c) Große Anzahl an Werten (mehr als sechs); da der Dixon-Test hier ungeeignet ist, sind auch hier kaum Ausreißer zu „befürchten“

Die Story:
Anfang des Jahres hat manch eine(r) gute Vorsätze für das neue Jahr; einige wollen vielleicht gar „bessere“ Menschen werden. Lasst uns dennoch für einen Moment ein raffiniertes, böses Teufelchen spielen und uns überlegen, wie man einen Unwissenden begeistern kann. Neben legalen, seien einmal ausnahmsweise auch halblegale und moralisch „grenzwertige“ Tricks/Aussagen erlaubt, die jedoch auf den ersten Blick wahrhaftig erscheinen.

Garantiert „gute“ Präzision:

Klassische, legale Vorgehensweise: Viele Werte? Ein kleiner Variationskoeffizient, VK ist mehr als sicher.
Injektion lediglich von Standardlösungen? Da die Geräte heute in der Regel einen hohen technischen Standard aufweisen, ist ein kleiner VK ebenfalls ziemlich leicht zu erreichen.

Test auf Ausreißer – keine Probleme zu befürchten

Ein bekannter Test auf Ausreißer ist der Dixon-Test

Vorgehen: Man bildet die Größe Q nach

Q = | x1 – x2 | / R

x1: ausreißverdächtiger Wert

x2: benachbarter Wert

R : Spannweite (Differenz zwischen kleinstem und größtem
Wert)

Der Ausreißer gilt als erwiesen, wenn der berechnete Wert Q größer ist als ein entsprechender Tabellenwert: Q > Q(P) in der Dixon-Tabelle. Deswegen „Betrag“ in der Formel, weil es um die absolute Differenz zwischen ausreißverdächtigem und benachbartem Wert geht – egal ob sie negativ oder positiv ist.

Die berechnete Größe Q stellt man dem Tabellenwert Q (P) gegenüber:

niP = 0.90P = 0.95P = 0.99
30.890.940.99
40.680.770.89
50.560.640.76
60.480.560.70
70.430.510.64
80.400.480.58

 

P: Signifikanzniveau, d. h. Wahrscheinlichkeit für die Richtigkeit der getroffenen Aussage

ni: Anzahl der Werte

Es hat sich eingebürgert, dass die Werte der Spalte „P=0.99“ zurate gezogen werden: Ein Wert wäre als Ausreißer zu deklarieren, wenn dieser größer als der entsprechende Wert in der Dixon-Tabelle ist: Dieser Wert ist eben zu 99 % ein Ausreißer. Und bei der relativ kleinen Anzahl an Werten, die wir in der Labor-Welt haben, sollte man für eine bestimmte Aussage schon zu 99 % sicher sein (statistische Relevanz bewahrt!)

Beispiel 1

3 Werte: 4,0   6,0   12,0; der Ausreißer-verdächtige Wert ist definitiv die „12“.

Dixon-Text:

6 – 12 : 8 = 0,75

0,75 ist kleiner als 0,99, also muss die „12“ nicht eliminiert werden

Beispiel 2

7 Werte, die recht stark streuen (kleinster Wert 5, größter Wert 14):

7,0   7,8   5,0   8,3   9,0   6,9   14,0
Ausreißer-verdächtiger Wert ist die „14“

Dixon-Text:

9 – 14: 9 = 0,56

0,56 ist kleiner als 0,64, die „14“ ist „kein“ Ausreißer

Beispiel 3

8 Werte, die nicht so stark streuen
:

7,0   7,5   8,0   8,5   7,9   8,9   10,0   14,0
Ausreißer-verdächtigter Wert ist die „14“

Dixon-Text:

10 – 14 : 7 = 0,57

0,57 ist kleiner als 0,58, die „14“ ist „kein“ Ausreißer

Bemerkungen:

  • Drei Werte sind zu wenig, um von einer statistischen Relevanz zu sprechen
  • Je stärker Werte streuen, um so unwahrscheinlicher wird es, eine starke Abweichung als Ausreißer zu deklarieren
  • Je größer die Anzahl der Werte, um so ungeeigneter wird der Dixon-Test; bei diesem Test werden ja nur drei Werte für die Berechnung der Prüfgröße Q berücksichtigt: der Ausreißer-verdächtigte Wert, sein benachbarter Wert und der kleinste Wert. Wie viele Werte dazwischen liegen, ist irrelevant. Deswegen sollte ab ca. sechs Werte der Grubbs-Text verwendet werden (Mittelwert, Standardabweichung für die Berechnung)

Eine analytisch seriös, wahrhaftig klingende Aussage vom Teufelchen könnte in etwa wie folgt lauten:

„Lieber Kunde,
wir haben unsere Methode wirklich sehr gründlich getestet: Die Präzision ist wie du hier siehst, hervorragend. Ferner haben wir die Methode selbstverständlich sowohl für eine kleine Zahl (Beispiel 1) als auch für eine große Anzahl an Werten (Beispiel 3) getestet. Wir haben unsere Methode sogar für die schwierigste Matrix getestet, also nicht nur für Apfelsaft, sondern auch für Spinat (Beispiel 2). Es ergab in keinem einzigen Fall ein Ausreißer, unsere Methode ist somit für dich gut geeignet.“

Jetzt verwandeln wir uns von einem Teufelchen zu einem(r) kritischen Beobachter(in): Wenn Sie Daten erhalten, werfen Sie einen kritischen Blick auf diese sowie auf den verwendeten statistischen Test:

  • Anzahl der Werte?
  • Sind diese normal/gleichmäßig verteilt?
  • Passt der Test zu der Intention, zu den Werten: Wie streng will/muss ich sein (Signifikanzniveau 95 % oder 99 %)?

Präzision:
Wenn Sie das Ergebnis eines Tests zur Präzision mit auffallend vielen Werten bekommen: Handelt es sich um eine Methode mit beispielsweise komplexer Probenaufarbeitung (Extraktion, Derivatisierung)? Oder liegt vielleicht eine komplexe Matrix vor (biologische, Lebensmittel- oder Umweltmatrix)? Dann kann eine große Anzahl an Werten gerechtfertigt sein. Ist das nicht der Fall, liegt womöglich ein unnötiger Fleiß vor, oder … Jedenfalls sollte man schon nach dem Grund fragen.

Ausreißertest:
Bei einer kleinen Anzahl an Werten und/oder starker Streuung ebendieser ist das Fehlen von Ausreißern keinesfalls ein Qualitätsattribut der Methode. Und wenn für ab ca. sechs Werten der Dixon-Text verwendet wird, würde ich der Aussage keinen sonderlichen Wert beimessen.

Meine Erfahrung aus diversen Projekten:
– Nicht-zu-Ende gedachten Vorgaben (Notwendigkeit für diese?),
– starker Focus auf formale Anforderungen zu Lasten analytischer Relevanz und
– mangelndes Wissen um die Aussagekraft von statistisch „sauber“ ermittelten Größen …
… führen des Öfteren dazu, dass die Routineeignung einer Methode zu positiv eingeschätzt wird. Seien Sie kritisch und versuchen Sie praxis-nah zu denken (mir fällt es auch oft schwer).

Die kleine Frage zur Validierung …

By Allgemein, Einstellparameter, Jahrestipps, Nachweisgrenze

„Wir haben bei der Bestimmung vom LOQ starke Schwankungen. Auch an unterschiedlichen Geräten und mit neuen Säulen. Woran kann das liegen? Als LOQ-Kriterium haben wir wie üblich ein S/N-Verhältnis von 10:1.“ Antwort: Die Erfahrung zeigt, dass hier mit recht großen Integrationsfehlern zu rechnen ist. Wir konnten zeigen (s. Infos am Ende des Beitrages), dass kaum eine kommerzielle Software in der Lage ist, bei automatischer Integration und einem S/N-Verhältnis von 10:1 so zu integrieren, dass der Fehler – bei optimalen (!) Bedingungen (BL-Trennung, kaum Drift usw.) – nicht mindestens 5-10 % beträgt. Siehe dazu weiter unten die Werte in der Tabelle für den ersten, kleinen Peak (oben): In den grau schraffierten Feldern befinden sich Werte mit einer Abweichung von mehr als 1 % vom richtigen Wert, bedingt durch eine fehlerhafte Integration.   Einige Kommentare und Erläuterungen zu den Werten der Tabelle: Die verwendeten Einstellparameter („Settings“) wie Dwell-Time, Time Constant, Sample Rate usw. können – vor allem bei kleinen Peaks – die Integration beeinflussen. So ist beispielsweise die Abweichung vom richtigen Wert beim ersten Peak bei einem Threshold-Wert von 50 12,50 %, bei einem Threshold-Wert von 100 17,78 % (EZChrom) Bei einigen Software-Programmen können unterschiedliche Integrationsalgorithmen angewandt werden. Die erhaltenen Ergebnisse können…

Read More

Die kleine Frage zur Validierung …

By Allgemein, Jahrestipps, Nachweisgrenze

„Validierung ist aufwendig und teuer; was ist das Minimum an Validierung, was wir machen müssen?“ Zwei Vorbemerkungen Vor einer Antwort halten wir wie folgt fest: 1. Es gibt viele Definitionen zur Validierung, eine davon lautet: „Das Ziel bei der Validierung einer analytischen Methode ist zu zeigen, dass sie für den beabsichtigten Zweck geeignet ist.“ 2. Validierung ist – anders als z. B. GLP – kein Gesetz. Es gibt demnach de jure keine offizielle Stelle, die bzgl. Umfangs, Validierungstiefe, Durchführung, Revalidierungbedarfs etc. gesetzlich bindende Vorgaben macht. Somit jetzt schon einige Schlussfolgerungen: Validierung ist demnach etwas recht Individuelles: Um was geht es in einem aktuellen Fall eigentlich? Muss ich eher formale Sachen beachten, muss also eine wichtige Person/Organisation lediglich „nicken“? Oder stehen analytische Gesichtspunkte im Vordergrund, die notwendiger-/sinnvollerweise zu beachten sind? Sehr wohl ergibt sich häufig de facto aus bestimmten Zwängen/Gegebenheiten genau „was“, „wie“, und „wieviel“ an Validierung zu tun ist. Wenn ich diese Vorgaben missachte, bekomme ich beispielsweise keine Zulassung für mein Produkt bzw. kann ich besagte Methode gar nicht anwenden. Wenn ich solchen Zwängen nicht unterliege, kann ich selbst denken und dem „beabsichtigten Zweck“ gemäß handeln. Das heißt, ich suche aus der „Validierungsklaviatur“ (Richtigkeit, Präzision, Linearität, Robustheit etc.) diejenigen Validierungsparameter…

Read More

Sprechen wir alle die gleiche „Sprache“? (II)

By C - Einführungen, Überblicke, Routine-Tipps, Wartung, allgemeine Hinweise, HPLC-Tipps Demo

Sprechen wir alle die gleiche „Sprache“? (II)

Im diesem Tipp haben wir uns mit verwirrenden Abkürzungen und nicht ganz glücklichen Synonymisierungen beschäftigt. Im hiesigen Tipp möchte ich auf vermeintlich eindeutige Begriffe und Angaben eingehen unter denen evtl. doch Unterschiedliches verstanden wird. Ich habe zwei Begriffe aus der HPLC und drei aus dem Bereich der Validierung ausgesucht.

Beispiele

Luftofen

Zwei Labore möchten Ergebnisse vergleichen, die Hardware ist identisch, beide verwenden einen qualifizierten „Luftofen“. Sollte allerdings der eine ein Ruhluftofen und der andere ein Umluftofen (bzw. das gleiche Gerät aber im unterschiedlichen Modus betrieben) sein, könnten die Ergebnisse evtl. divergieren. Siehe dazu ein Beispiel in Abbildung 1: Bei gleicher Temperaturanzeige am Display kann an unterschiedlichen Luftöfen die Auflösung besser oder schlechter sein, auch Elutionsumkehr ist denkbar, weil ganz einfach die tatsächlich herrschende Temperatur in der Säule eine andere ist.

Abbildung 1. Unterschiedliche Ergebnisse mit unterschiedlichen Luftöfen, Details, siehe Text

Oberfläche des Materials in m2/g

In der Literatur und auch In Broschüren von Herstellern werden häufig die physikalisch-chemischen Daten der verwendeten bzw. angebotenen Materialien angegeben. Es kann leicht passieren, dass man übersieht, dass einmal die Rede von „effektive Oberfläche“ und einmal von „spezifische Oberfläche“ ist. Die Zahlenwerte sind nicht vergleichbar. So entspricht beispielsweise eine effektive Oberfläche von 200 m2/g einer spezifischen Oberfläche von 102 m2/g.

Signal/Rauschen-Verhältnis

Ein Zitat aus der amerikanischen Pharmakopöe:

“The signal-to-noise ratio (S/N) is a useful system suitability parameter. The S/N is calculated as follows: S/N = 2H/h”.

Als Bestimmungsgrenze wird oft ein Signal/Rauschen-Verhältnis von 10:1 verlangt/erwartet. Da jedoch die „2“ bereits in der Formel enthalten ist, bedeutet „10:1“: 20 mal die Peakhöhe zum Rauschen. In manch´ einem Labor wird allerdings als Bestimmungsgrenze tatsächlich 10 mal die Peakhöhe zum Rauschen genommen. Es liegt auf der Hand, dass Ergebnisse nicht vergleichbar sind, zumal die Integration in diesen Bereichen nicht unproblematisch ist…

Genauigkeit

Genauigkeit ist der Oberbegriff von Richtigkeit und Präzision; wenn ein Ergebnis frei ist von systematischen Fehlern, spricht man von einem richtigen Ergebnis. Wenn ein Ergebnis frei ist von zufälligen Fehlern, spricht man von einem präzisen Ergebnis. Wenn nun ein Ergebnis frei ist von systematischen und zufälligen Fehlern, also wenn jenes richtig und präzise ist, spricht man von einem genauen Ergebnis. Es ist allerdings so, dass oft „Genauigkeit“ gleich „Richtigkeit“ gesetzt wird. Die Konfusion wird nicht gerade geringer, als im Englischen für „Richtigkeit“ folgende drei Begriffe benutzt werden: „Accuracy“, „Accuracy of The Mean“, „Trueness“. Hier muss man mit den Gesprächspartnern früh genug für Klarheit der Begrifflichkeiten sorgen.

Linearität

Zwei Pharma-Labore möchten die Daten für die Linearität vergleichen. Die Geräte sind gleich, es werden Standards mit Placebo versetzt verwendet, man einigt sich auf neun unabhängige Werte. Nur: Das eine Labor wendet eine immer wieder anzutreffende Praxis im Pharma-Umfeld „3,3,3“, also drei Konzentrationen, a drei Bestimmungen. Das andere Labor verwendet tastsächlich neun unterschiedliche Konzentrationen und je eine Bestimmung. Auch hier sind die Ergebnisse nicht vergleichbar, auch dann wenn in beiden Fällen sich ein Korrelationskoeffizient mit drei Neuner nach dem Komma ergibt.

Der Ausweg heißt Kommunikation

Es ist sicherlich nicht einfach, derartige Missverständnisse gänzlich zu vermeiden. Man kann nur stets versuchen, eine enge und offene Kommunikation mit den Gesprächspartnern zu pflegen.

Warum kann manchmal eine „zu gute“ Präzision beim Methodentransfer hinderlich sein?

By A Fehlersuche, HPLC-Tipps, Methodenentwicklung, -Transfer und -Optimierung, Methodentransfer, Variationskoeffizient (Vk)

Von Mike Hillebrand, Aventis Der Fall Ein Baustein des Methodentransfers ist die „Intermediate Precision“ (Laborpräzision). Dabei werden in beiden Laboratorien, dem aufnehmenden und dem abgebenden, Vergleichsanalysen mit der validierten, zu transferierenden Methode durchgeführt. Diese sollen sicherstellen, dass das empfangende Laboratorium in der Lage ist, die neue implementierte Methode anzuwenden. Dadurch ist eine vollständige Validierung der Methode im empfangenden Laboratorium nicht nötig. Das Design der „Intermediate Precision“ richtet sich nach dem Analyseverfahren, welches es zu transferieren gilt. Beispielsweise wird für eine Gehaltsbestimmung häufig ein Design verwendet, bei dem zwei Mitarbeiter pro Labor zum Einsatz kommen. Ziel ist das Prüfen einer Charge….

Um diesen Beitrag einsehen zu können, musst du eine der HPLC-Tipps Datenbanken Lizenzen erwerben.

Read More

Einstellparameter und Variationskoeffizient

By A Fehlersuche, Einstellparameter, HPLC-Tipps, Integration, Variationskoeffizient (Vk)

Der Fall Einstellparameter wie Zeitkonstante („time constant“), Peakwidth, Datenrateaufnahme („sample rate“), Bandwidth etc. können die Integration und somit Peakfläche und Befund stark beeinflussen. Wir haben uns bereits darüber unterhalten, Details finden sich in (1), (2) und (3). In wie weit beeinflussen nun diese Parameter auch die Streuung der Werte im Falle von Wiederholmessungen? Die Lösung Nachdem ich in der Literatur diesbezüglich nicht fündig geworden bin, wurde in einer kleinen Studie an einer UPLC-Anlage der Einfluss diverser Einstellparameter auf den Vk systematisch untersucht. Dazu wurde zunächst mithilfe von Systemeignungstests die Zuverlässigkeit der Anlage überprüft. Anschließend wurden aus einem vial je 10…

Um diesen Beitrag einsehen zu können, musst du eine der HPLC-Tipps Datenbanken Lizenzen erwerben.

Read More