Als Ärzte in einer groß angelegten Studie eine Reihe digitaler Bilder betrachteten, die Hautkrankheiten in verschiedenen Hauttönen zeigten, und gebeten wurden, eine Diagnose zu stellen, lag die Genauigkeit bei Dermatologen bei 38 % und bei Hausärzten bei 19 %. Doch als die Entscheidungsunterstützung durch ein Deep-Learning-System (DLS) eingeführt wurde, stieg die diagnostische Genauigkeit bei Dermatologen um 33 % und bei Hausärzten um 69 %, wie Ergebnisse einer multizentrischen Studie zeigten.
Die Forscher stellten jedoch fest, dass auf allen Bildern Krankheiten bei dunkler Haut (Fitzpatrick-Hauttypen 5 und 6) weniger genau diagnostiziert wurden als Krankheiten bei heller Haut (Fitzpatrick-Hauttypen 1–4).
„Diese Ergebnisse tragen zu einer neuen Literatur über Unterschiede in der diagnostischen Genauigkeit bei verschiedenen Hauttönen von Patienten bei und liefern Beweise dafür, dass die diagnostische Genauigkeit von Medizinern bei Bildern dunkler Haut geringer ist als bei Bildern heller Haut“, sagten Forscher unter der Leitung von Dr. Matthew Groh Die Kellogg School of Management der Northwestern University schrieb in ihrer Studie, die online veröffentlicht wurde Naturmedizin.
Für die Studie wurden 389 staatlich geprüften Dermatologen (BCDs) und 450 Hausärzten in 39 Ländern 364 Bilder von 46 Hautkrankheiten zur Ansicht vorgelegt und sie wurden gebeten, bis zu vier Differenzialdiagnosen einzureichen. Fast 80 % der Bilder zeigten acht Krankheiten: atopische Dermatitis, kutanes T-Zell-Lymphom (CTCL), Dermatomyositis, Lichen planus, Lyme-Borreliose, Pityriasis rosea, Pityriasis rubra pilaris und sekundäre Syphilis.
Dermatologen und Hausärzte erreichten eine diagnostische Genauigkeit von 38 % bzw. 19 %, aber beide Gruppen von Ärzten waren bei der Diagnose von Bildern dunkler Haut im Vergleich zu heller Haut um 4 Prozentpunkte weniger genau. Mithilfe der DLS-Entscheidungsunterstützung stieg die diagnostische Genauigkeit bei Dermatologen um 33 % und bei Hausärzten um 69 %. Unter Dermatologen unterstützt DLS im Allgemeinen eine erhöhte diagnostische Genauigkeit bei allen Hauttönen. Allerdings steigerte die DLS-Unterstützung bei Hausärzten die diagnostische Genauigkeit bei hellen Hauttönen stärker als bei dunklen.
Im Umfrageteil der Studie wurden die Teilnehmer gefragt: „Sind Sie der Meinung, dass Sie ausreichend für die Diagnose von Hautkrankheiten bei Patienten mit farbiger Haut (nicht-weiße Patienten) geschult wurden?“ 67 % aller Hausärzte und 33 % aller Dermatologen antworteten mit Nein. „Darüber hinaus haben wir Unterschiede darin festgestellt, wie oft BCDs und PCPs Patienten mit heller und dunkler Haut zur Biopsie überweisen“, schreiben die Autoren. „Speziell für CTCL (eine lebensbedrohliche Krankheit) haben wir festgestellt, dass sowohl BCDs als auch PCPs berichten, dass sie Patienten mit heller Haut deutlich häufiger zur Biopsie überweisen würden als mit dunkler Haut Wir haben herausgefunden, dass BCDs berichten, dass sie Patienten mit dunkler Haut häufiger zur Biopsie überweisen würden als mit heller Haut, was eine unnötige Überlastung für Patienten mit dunkler Haut darstellt.“
In einer Pressemitteilung zu der Studie betonte Dr. Groh, dass er und andere Wissenschaftler, die die Mensch-Computer-Interaktion untersuchen, „einen Weg finden müssen, unterrepräsentierte Bevölkerungsgruppen in unsere Forschung einzubeziehen. Auf diese Weise werden wir bereit sein, diese Modelle genau in die Realität umzusetzen.“ Welt und bauen KI-Systeme auf, die als Werkzeuge dienen, um die Art von systematischen Fehlern zu vermeiden, zu denen Menschen und Maschinen bekanntermaßen anfällig sind. Dann können Sie Lehrpläne aktualisieren, Sie können Normen in verschiedenen Bereichen ändern und hoffentlich geht es allen besser.“
Ronald Moy, MD, ein in Beverly Hills, Kalifornien, praktizierender Dermatologe, der gebeten wurde, die Arbeit zu kommentieren, sagte, dass die Studie Erkenntnisse über die Interaktion zwischen Arzt und KI liefert und die Notwendigkeit weiterer Schulungen zur Diagnose von Hautkrankheiten bei Menschen mit dunklerer Haut hervorhebt Hautfarben. „Zu den Stärken dieser Studie gehören die große Stichprobe von Dermatologen und Hausärzten, die Verwendung qualitätskontrollierter Bilder aller Hauttöne und die gründliche Bewertung der diagnostischen Genauigkeit mit und ohne KI-Unterstützung“, sagte Dr. Moy, ein ehemaliger Präsident der American Academy of Dermatology, der American Society for Dermatologic Surgery und dem American Board of Facial Cosmetic Surgery.
„Die Studie beschränkt sich auf die Diagnose und die Einschätzung des Hauttons, die ausschließlich auf einem einzigen Bild basieren, was keine vollständige klinische Bewertung darstellt“, fügte er hinzu. Allerdings „liefert es wichtige Benchmark-Daten zu Unterschieden in der diagnostischen Genauigkeit bei verschiedenen Hauttönen, zeigt aber auch, dass die KI-Unterstützung zwar die allgemeine diagnostische Genauigkeit verbessern kann, aber die Unterschiede für Laien möglicherweise verschärfen kann.“
Die Finanzierung der Studie erfolgte durch Mitglieder des MIT Media Lab-Konsortiums und den Harold Horowitz Student Research Fund. Einer der Studienautoren, P. Murali Doraiswamy, MBBS, gab bekannt, dass er Zuschüsse, Beratungshonorare und/oder Aktien von mehreren Biotechnologieunternehmen erhalten hat, die nicht in den Rahmen dieser Arbeit fallen, und dass er über Duke Miterfinder mehrerer Patente ist Universität. Die übrigen Autoren gaben an, keine Angaben gemacht zu haben. Dr. Moy gab an, keine Angaben gemacht zu haben.
Dieser Artikel erschien ursprünglich am MDedge.comTeil des Medscape Professional Network.