VOXplot
Akustische Analyse der Stimmqualität: Einfach | Standardisiert | Intuitiv
Wir haben VOXplot mit dem Ziel entwickelt, ein Werkzeug für die Analyse akustischer Stimmparameter bereitzustellen, das auf wissenschaftlicher Evidenz sowie bewährten und zuverlässigen Algorithmen basiert und zugleich einfach und intuitiv bedienbar ist. VOXplot ist quelloffen und kostenlos verfügbar für Windows, macOS und Linux.
Einfach und verlässlich
Die Benutzeroberfläche von VOXplot ist einfach und robust gestaltet und kann ohne lange Einarbeitungszeit genutzt werden. Ein intuitiver Workflow führt mit wenigen Klicks zu einer vollständigen akustische Analyse der Stimmqualität.
VOXplot ist multilingual. Die Benutzeroberfläche ist in drei Sprachen verfügbar: Deutsch, Englisch, Niederländisch. Valide Analyseparameter stehen aktuell für 12 Sprachen zur Verfügung: Deutsch, Englisch, Niederländisch, Spanisch, Japanisch, Koreanisch, Brasilianisches Portugisisch, Malayalam, Kannada, Persisch/Farsi, Finnisch und Italienisch.
Standardisierte Analyse
VOXplot wird in enger Zusammenarbeit mit dem wissenschaftlichen Berater Prof. Ben Barsties v. Latoszek entwickelt.
Die Analyse von insgesamt 19 akustischen Parametern und zwei multidimensionalen Indizes beruht auf bewährten Praat-Algorithmen und folgt mit wissenschaftlich fundierten Voreinstellungen den Empfehlungen zur Analyse akustischer Stimmparameter, die in den Arbeiten zu den Stimmqualitätsindizes AVQI[1] und ABI[2] publiziert wurden.
Intuitive Visualisierung
Das Analyseergebnis ist ein Stimmprofil mit allen Untersuchungsdaten und Messwerten auf einer einzelnen Seite.
Zusätzlich zu den numerischen Messwerten kann das Ergebnis mithilfe eines Diagramms, das Normabweichungen in 6 besonders relevanten Dimensionen farblich hervorhebt, einfach und intuitiv beurteilt werden.
Eine weitere Beurteilung des gehaltenen Vokals kann zusätzlich mittels eines Schmalbandspektrogramms vorgenommen werden.
Benutzeroberfläche
Die übersichtliche Benutzeroberfläche von VOXplot gibt einen einfachen Workflow vor, der sich ohne lange Einarbeitungszeit erschließt. Die Benutzeroberfläche ist aktuell in drei Sprachen verfügbar: Deutsch, Englisch, Niederländisch.
Im linken Bereich des Hauptfensters können Untersuchungsdaten erfasst werden (optional). Der rechte Bereich des Hauptfensters dient der Auswahl von zwei Stimmproben: Gelesener Text und ein gehaltener Vokal (bevorzugt der Vokal [a:]). Diese zwei Stimmproben sind notwendig für die Berechnung der Stimmqualitätsindizes AVQI und ABI. Hierzu wird eine Textpassage (Inhalt und Länge der Passage ist sprachabhängig) und der Vokal [a:] mit einer Dauer von 3 Sek. benötigt.
Für eine AVQI- und ABI-Analyse sind aktuell 12 Analysesprachen in VOXplot verfügbar, die in den Einstellungen ausgewählt werden können. Die Sprachauswahl basiert auf den Validitätsstudien in Deutsch[3], Japanisch[4,5], Koreanisch[6], Niederländisch[7,8], Spanisch[9], Brasilianisch-Portugisisch[10,11], den süd-indischen Sprachen Malayalam und Kannada[15,16] sowie Finnisch[18,21], Persisch/Farsi[20], Englisch[22] und Italienisch[17].
Eine Analyse von nur einer Stimmprobe (Text oder gehaltener Vokal) kann auch durchgeführt werden, allerdings entfällt dann die AVQI- und ABI-Berechnung.
Wenn Stimmproben bereits als WAV-Datei vorliegen, können diese einfach in VOXplot geladen und abgespielt werden. Bei Bedarf kann der Signalausschnitt, der in die Analyse eingehen soll, auch nach dem Laden noch angepasst werden. VOXplot versucht, das Aufnahmedatum der Stimmprobe automatisch zu ermitteln. Sollte dies misslingen, kann das Datum manuell korrigiert werden.
Selbstverständlich können Stimmproben auch direkt mit VOXplot aufgenommen, abgespielt, zurechtgeschnitten und als WAV-Datei gespeichert werden.
VOXplot kann sämtliche Aufnahmegeräte nutzen, die an den Computer angeschlossen sind und vom Betriebssystem erkannt und unterstützt werden.
Ein wichtiges Kriterium dafür, ob eine Stimmprobe für die akustische Analyse geeignet ist, ist das Signal-Rausch-Verhältnis (Signal-to-Noise Ratio, SNR). Deshalb bietet VOXplot seit Version 2 die Möglichkeit, SNR für ein konkretes Aufnahme-Setting zu evaluieren, so dass das Aufnahme-Setting ggf. optimiert werden kann, bevor eine Untersuchung durchgeführt wird.
Sobald mindestens eine Stimmprobe vorliegt, kann die Analyse gestartet werden. Wichtig zu beachten ist, dass bei der Analyse des gehaltenen Vokals eine Dauer von 3 Sek. vorausgesetzt wird. Beim Laden von vorhandenen Aufnahmen werden Sie automatisch informiert, wenn die Vokaldauer diese Voraussetzung nicht erfüllt; zu lange Vokale können innerhalb von VOXplot gekürzt werden.
Durch einen Klick auf den grünen Button werden alle relevanten akustischen Stimmparameter vollautomatisch berechnet, es sind keine weiteren Eingaben notwendig. (Abhängig von der Leistungsfähigkeit des Computers, kann die Analyse einige Sekunden dauern.)
Akustische Analyse
VOXplot nutzt die Praat-Version 6.0.48, die in mehreren AVQI- bzw. ABI-Studien validiert wurde, um die folgenden akustischen Stimmparameter zu berechnen (Praat ist in den ausführbaren VOXplot-Paketen bereits enthalten und muss nicht gesondert installiert werden):
- Slope (dB)
- Tilt (dB)
- HF noise (dB)
- HNR-D (dB)
- H1H2 (dB)
- CPPS (dB)
- Jitter local (%)
- Jitter ppq5 (%)
- Shimmer (%)
- Shimmer (dB)
- HNR (dB)
- PSD (ms)
- Voice breaks
- GNE
- Pitch mean (Hz)
- Pitch min (Hz)
- Pitch max (Hz)
- Pitch sd (Hz)
- Pitch range (st)
Wenn zwei Stimmproben vorliegen (Text/CS & Vokal/SV), werden alle Parameter (außer Pitch) auch für die Kombination (MX) beider Proben berechnet sowie die beiden Stimmqualitätsindizes Acoustic Voice Quality Index (AVQI) und Acoustic Breathiness Index (ABI) ermittelt.
Um die Analyseergebnisse besser einschätzen zu können, werden (zusätzlich zu den AVQI- und ABI-Grenzwerten) für vier besonders relevante Vokal-Parameter Normwerte angegeben. Wie in einer aktuellen Studie auf der Basis von 218 Stimmproben gezeigt werden konnte, können diese vier Parameter valide mit der perzeptiven Beurteilung von Heiserkeit bzw. Behauchtheit assoziiert werden[19]. Für die Heiserkeit sind das die beiden Parameter Harmonics-to-Noise Ratio (HNR) und der Pitch-Perturbationsquotient mit einem Glättungsfaktor von 5 Perioden (Jitter ppq5). Mit Behauchtheit assoziiert sind die Smoothed Cepstral Peak Prominence (CPPS) und die Glottal-to-Noise Excitation Ratio (GNE).
Aufgrund der engen Zusammenarbeit mit dem wissenschaftlichen Berater Prof. Ben Barsties v. Latoszek zeichnet sich VOXplot durch qualitativ hochwertige und reliable Analyseverfahren aus. Prof. Barsties v. Latoszek forscht aktiv im Bereich der akustischen Stimmanalyse mit besonderem Fokus auf multiparametrischen Stimmqualitatsindizes (AVQI & ABI), und publiziert regelmäßig in international renommierten Fachzeitschriften (Journal of Voice; The Laryngoscope; Clinical Otolaryngology; Journal of Speech, Language, and Hearing Research; Logopedics Phoniatrics Vocology etc.).
Stimmprofil
Das Analyseergebnis wird in Form eines Stimmprofils auf einer einzelnen Seite präsentiert. Das Profil enthält die Untersuchungsdaten, die numerischen Analyseergebnisse der Vokal-Stimmprobe, ein Schmalbandspektrogramm der Vokal-Stimmprobe sowie ein Diagramm, das Normabweichungen in 6 akustischen Dimensionen (AVQI und ABI sowie 4 relevante Einzelparameter der Vokal-Stimmprobe) mit einem intuitiven Ampelsystem farblich hervorhebt (Normbereich: grün / Abweichung: rot).
In der linken Hälfte des Diagramms sind drei Parameter wiedergegeben, die am besten mit der Stimmanomalie der Heiserkeit (Hoarseness) übereinstimmen. Die rechte Hälfte zeigt die drei Parameter, die am besten mit der pathologischen Subkomponente von Heiserkeit
Das Stimmprofil kann als PDF-, PNG- oder JPG-Datei archiviert werden. Außerdem können die numerischen Analyseergebnisse im CSV-Format exportiert werden, um sie z.B. in Excel oder einem Statistikpaket weiterzuverarbeiten.