^
Fact-checked
х

Allt iLive-innehåll är mediekontrollerat eller faktiskt kontrollerat för att säkerställa så mycket faktuell noggrannhet som möjligt.

Vi har strikta sourcing riktlinjer och endast länk till välrenommerade media webbplatser, akademiska forskningsinstitut och, när det är möjligt, medicinsk peer granskad studier. Observera att siffrorna inom parentes ([1], [2] etc.) är klickbara länkar till dessa studier.

Om du anser att något av vårt innehåll är felaktigt, omodernt eller på annat sätt tveksamt, välj det och tryck på Ctrl + Enter.

Röst som analys: Tidiga signaler på cancer och godartade lesioner

Alexey Kryvenko, Medicinsk granskare
Senast recenserade: 18.08.2025
2025-08-12 08:13
">

Forskare från Oregon Health & Science University analyserade talinspelningar från den nya offentligt tillgängliga datauppsättningen Bridge2AI-Voice och fann en enkel akustisk funktion som kan avslöja stämbandspatologi. Vi talar om förhållandet mellan harmoniska övertoner och brus (HNR) – förhållandet mellan "musikaliska övertoner" och brus. Dess nivå och variation skilde rösterna hos personer med larynxcancer och godartade lesioner från friska och vissa andra röststörningar. Effekten var särskilt tydlig hos cisgenderade män; statistisk signifikans var inte tillräcklig för kvinnor – författarna skyller på den lilla urvalsstorleken och efterlyser en utökning av data. Arbetet publicerades som en kort rapport i Frontiers in Digital Health.

Bakgrund till studien

  • Varför leta efter "röstmarkörer" överhuvudtaget? Heshet är ett vanligt klagomål. Orsakerna är varierande: från förkylningar och reflux till knutor/polyper och larynxcancer. För närvarande är vägen till diagnos ett besök hos en ÖNH-specialist och en endoskopi (en kamera i näsan/halsen). Det är korrekt, men inte alltid snabbt tillgängligt och är inte lämpligt för egenövervakning i hemmet. Förhandsscreening behövs: ett enkelt sätt att förstå vem som ska träffa en läkare först.
  • Vad är en röstbiomarkör? Tal är en signal som enkelt kan spelas in på en telefon. Dess "mönster" kan användas för att bedöma hur stämbanden vibrerar. Lesioner gör vibrationerna ojämna: mer "brus" och mindre "musik".
  • Varför nya datamängder är viktiga. Tidigare förlitade sig sådana arbeten på små, "hemgjorda" stickprov – modellerna var bräckliga. Bridge2AI-Voice är en stor, multicenter, etiskt insamlad uppsättning ljudinspelningar kopplade till diagnoser. Den skapades som en "gemensam testplats" för att äntligen träna och testa algoritmer på stora och heterogena data.
  • Var ligger de största svårigheterna?
    • Rösten förändras på grund av mikrofonen, rumsbuller, kyla, rökning, språk, kön och ålder.
    • Det finns traditionellt mindre kvinnlig data, och den kvinnliga rösten är högre i frekvens – mätvärden beter sig annorlunda.
    • Inget "hemtest" kan ersätta en undersökning eller ställa en diagnos – det hjälper som mest till att avgöra: "är det nödvändigt att snarast uppsöka en öron-näsa-halsspecialist?"
  • Varför behöver kliniken och patienterna detta? Om personer med hög risk för lymfkörtlar/tumörer kan väljas ut för en prioriterad tid genom en kort tidsbokning, kommer detta att påskynda diagnostiken, minska onödiga remisser och ge ett verktyg för självövervakning mellan besök (efter operation, under behandling).
  • Vart detta bör leda: Till validerade telemedicinska applikationer/moduler som:
    1. skriv ett tal enligt standarden (fras + utdraget "aaa"),
    2. beräkna grundläggande funktioner (HNR, jitter, skimmer, F0),
    3. utfärda en rekommendation att kontakta en specialist om profilen är alarmerande,
    4. bibehålla dynamiken efter behandlingen.

Idén är enkel: ”ge telefonen till en ÖNH-läkares öra” – inte för diagnos, utan för att inte missa de som behöver snabb personlig hjälp.

Vad exakt gjorde de?

  • Vi tog den första utgåvan av den multicenterbaserade, etiskt insamlade Bridge2AI-Voice-datauppsättningen, ett flaggskeppsprojekt inom NIH där röstinspelningar kopplas till klinisk information (diagnoser, frågeformulär etc.).
  • Två analytiska prover bildades:
    1. "larynxcancer / godartade lymfkörtlar / frisk";
    2. "cancer eller godartade knutor" kontra spasmodisk dysfoni och stämbandspares (andra vanliga orsaker till heshet).
  • Grundläggande röstfunktioner identifierades från standardiserade fraser: grundton (F0), jitter, skimmer och HNR, och grupperna jämfördes med icke-parametrisk statistik. Resultat: de mest stabila skillnaderna fanns i HNR och F0, där HNR och dess variabilitet bäst skilde godartade lesioner från både normen och larynxcancer. Dessa signaler var mer distinkta hos män.

Varför är detta viktigt?

  • Tidig screening utan sond. För närvarande innebär vägen till diagnos ofta nasoendoskopi och, vid misstanke, biopsi. Om enkla akustiska funktioner i kombination med AI kan prioritera de som behöver endoskopi, kommer patienter att komma till en ÖNH-specialist tidigare och onödiga remisser kommer att minskas. Detta är ett komplement, inte en ersättning för läkaren.
  • Stordata för röst. Bridge2AI-Voice är ett ovanligt projekt där röst samlas in med hjälp av enhetliga protokoll och kopplas till diagnoser; data är tillgängliga för forskare via PhysioNet / Health Data Nexus. Detta accelererar utvecklingen av tillförlitliga röstbiomarkörer istället för "mirakelappar" på små urval.

Vad är HNR?

När vi talar vibrerar stämbanden och skapar övertoner (harmoniska övertoner). Men vibrationen är aldrig perfekt – det finns alltid brus i signalen. HNR är helt enkelt hur mycket mer "musik" det finns i rösten än "väsande". När stämbanden skadas blir vibrationen mindre jämn – det finns mer brus, HNR sjunker och dess hopp (variabilitet) ökar. Det här är det mönster som författarna fångade.

Viktiga ansvarsfriskrivningar

  • Detta är en pilotanalys, en explorativ analys: utan klinisk validering, med begränsningar för urvalet av kvinnor – så deras effekter var inte signifikanta. Större och mer diversifierad data och "roasting" av modeller från olika kliniker och på olika språk behövs.
  • Rösten är en "flervärdig" sak: den påverkas av förkylning, rökning, reflux, en mikrofon, buller i rummet. Alla "hemtest" bör kunna ta hänsyn till sammanhanget – och fortfarande fungera som ett filter för en remiss till en ÖNH-specialist, och inte en klickdiagnos.

Vad händer härnäst?

  • Utöka datamängden (inklusive för kvinnor och åldrar), standardisera uppgifter och akustik (läsa en fras, långt “aaa” etc.), prova multimodala modeller (röst + frågeformulärssymptom/riskfaktorer).
  • Koppla samman akustiska tecken med undersökningsresultat (endoskopi, stroboskopi) och dynamik efter behandling – så att HNR-profilen även kan användas för övervakning.
  • Fortsätt med ”öppen vetenskap”: Bridge2AI-Voice publicerar redan versioner av datasetet och verktygen – detta är en chans att snabbt nå riktiga piloter i kliniker.

Slutsats

Det är möjligt att "höra" problem med stämbanden från rösten – och kanske hänvisa personen till rätt specialist tidigare. För närvarande är det en ganska bra ledtråd (HNR och dess variation), men tack vare stora mängder öppen data har röstbiomarkörer äntligen en chans att bli ett pålitligt screeningsverktyg.

Källa: Jenkins P. et al. Röst som biomarkör: Explorativ analys av benigna och maligna stämbandslesioner. Frontiers in Digital Health, 2025 (accepterad för publicering). Data — Bridge2AI-Voice (NIH/PhysioNet).


ILive-portalen ger inte medicinsk rådgivning, diagnos eller behandling.
Informationen som publiceras på portalen är endast referens och bör inte användas utan att konsultera en specialist.
Läs noggrant regler och policy på webbplatsen. Du kan också kontakta oss!

Copyright © 2011 - 2025 iLive. Alla rättigheter förbehållna.