Brain HealthForschungsarbeitKostenpflichtig

KI erkennt kognitive Beeinträchtigungen durch das Zuhören bei Arztgesprächen

Maschinelle Lernmodelle, die auf akustischen Sprachmerkmalen aus routinemäßigen Primärversorgungsgesprächen trainiert wurden, identifizierten kognitive Beeinträchtigungen mit aussagekräftiger Genauigkeit.

Dienstag, 16. Juni 2026 9 Aufrufe

Veröffentlicht in JAMA Neurol

An elderly patient speaking with a doctor in a clinic exam room, a small recording device visible on the desk between them, warm clinical lighting

Zusammenfassung

Forscher am Mount Sinai zeichneten routinemäßige Hausarztbesuche von knapp 1.000 älteren Erwachsenen auf und setzten maschinelles Lernen ein, um akustische Merkmale der Patientensprache zu analysieren – darunter Tonhöhe, Sprechtempo und stimmliche Variabilität. Ohne einen dedizierten Kognitionstest erkannte die KI eine kognitive Beeinträchtigung in etwa 68 % der Fälle korrekt. Modelle, die Whisper, ein Sprachverarbeitungswerkzeug, nutzten, erzielten die besten Ergebnisse und bewährten sich auch in einer unabhängigen Validierungsgruppe in Chicago. Dieser passive, wenig aufwändige Ansatz könnte künftig Patienten identifizieren, die einer weiteren Abklärung bedürfen, ohne ohnehin bereits volle Sprechstunden zusätzlich zu belasten. Etwa jeder fünfte Teilnehmer wies eine bislang unentdeckte kognitive Beeinträchtigung auf – ein deutlicher Hinweis darauf, wie verbreitet Unterdiagnosen in der heutigen Primärversorgung sind.

Deep Dive Audio

0:00--:--

Detaillierte Zusammenfassung

Kognitive Beeinträchtigungen betreffen Millionen älterer Erwachsener, werden jedoch in der Primärversorgung häufig nicht erkannt – dort ist die Zeit knapp und standardisierte kognitive Tests werden selten durchgeführt. Eine neue diagnostische Studie, veröffentlicht in JAMA Neurology, legt nahe, dass die Gespräche, die bereits in Untersuchungsräumen stattfinden, das nötige Signal enthalten könnten, um frühe Beeinträchtigungen zu erkennen – wenn eine KI zuhört.

Forscher der Icahn School of Medicine at Mount Sinai zeichneten routinemäßige Primärversorgungsgespräche von 787 englischsprachigen Patienten im Alter von 55 Jahren und älter in New York auf. Eine separate Validierungskohorte mit 179 Patienten wurde in Chicago rekrutiert. Keiner der Teilnehmer hatte zuvor eine Diagnose leichter kognitiver Beeinträchtigung oder Demenz erhalten. Aus 30-sekündigen Sprachsegmenten wurden akustische Merkmale extrahiert – sowohl mithilfe von KI-Grundlagenmodellen (Whisper, HuBERT und wav2vec 2.0) als auch mithilfe traditioneller, von Experten definierter Maße wie Prosodie und eGeMAPS. Kognitive Beeinträchtigung wurde anhand des Montreal Cognitive Assessment definiert, adjustiert für Alter und Bildung.

Das Whisper-basierte Modell erzielte die stärkste Leistung: einen AUROC von 0,733 in der primären Kohorte und 0,727 in der externen Validierung – konsistente Ergebnisse, die darauf hindeuten, dass der Ansatz standortübergreifend reproduzierbar ist. Die Sensitivität betrug 68,2 % und die Spezifität 63,6 %, bei einem positiven prädiktiven Wert von 30,4 %. Zu den wichtigsten akustischen Prädiktoren zählten Tonhöhe, Timing und Merkmale der stimmlichen Variabilität. Etwa 21 % der Teilnehmer wiesen bei der Aufnahme eine kognitive Beeinträchtigung auf, was das Ausmaß der Untererfassung unterstreicht.

Die klinische Relevanz ist erheblich: Diese Technologie könnte passiv während bestehender Termine eingesetzt werden, ohne zusätzlichen Zeitaufwand für Kliniker oder zusätzliche Belastung für Patienten, und einen Hinweis generieren, der bei Risikopatienten eine weiterführende Abklärung anstößt.

Einschränkungen bestehen. Der positive prädiktive Wert bleibt mit 30 % moderat, was bedeutet, dass viele auffällig getestete Patienten keine tatsächliche Beeinträchtigung aufweisen würden. Die Studie wurde an englischsprachigen Patienten in städtischen akademischen Medizinzentren durchgeführt, was die Verallgemeinerbarkeit einschränkt. Die Leistung als eigenständiges Screening-Instrument bedarf weiterer Verbesserung, bevor ein klinischer Einsatz möglich ist.

Wichtigste Erkenntnisse

AI analyzing speech acoustics from routine clinic visits detected cognitive impairment with 68.2% sensitivity and 63.6% specificity.
Whisper-based models achieved AUROC of 0.733, validated in an independent Chicago cohort at 0.727.
21% of enrolled older adults without a prior diagnosis had undetected cognitive impairment.
Pitch, timing, and vocal variability were the strongest acoustic predictors of impairment.
Screening required no dedicated test — only passive recording of existing patient-clinician dialogue.

Methodik

Diese diagnostische Studie umfasste 966 ältere Erwachsene (≥55 Jahre) ohne vorherige kognitive Diagnosen aus Hausarztpraxen in New York und Chicago im Zeitraum 2020–2021. Audioaufnahmen wurden mithilfe mehrerer KI-Sprachmodelle analysiert; kognitive Beeinträchtigung wurde als Montreal Cognitive Assessment-Score ≥1 SD unterhalb der alters- und bildungsbereinigten Normen definiert. ML-Klassifikatoren wurden anhand von AUROC und F1-Score sowohl in Holdout- als auch in externen Validierungskohorten bewertet.

Studienlimitierungen

Die Zusammenfassung basiert ausschließlich auf dem Abstract, da der vollständige Text nicht verfügbar war. Der positive Vorhersagewert ist mäßig (30,4 %), was bedeutet, dass eine hohe Falsch-positiv-Rate weiterhin ein Hindernis für den eigenständigen klinischen Einsatz darstellt. Die Studie beschränkte sich auf englischsprachige Patienten in städtischen akademischen Medizinzentren, was die Übertragbarkeit auf vielfältige oder ländliche Bevölkerungsgruppen einschränken kann.

Originalquelle anzeigen· DOI: 10.1001/jamaneurol.2026.1868

Hat dir diese Zusammenfassung gefallen?

Erhalte die neueste Longevity-Forschung jede Woche in deinen Posteingang.

E-Mail-Adresse zum Abonnieren eingeben: