KI-Funktionen für Barrierefreiheit: Eine Begriffsklärung
Viele marktreife KI-gestützte Assistenztechnologien, die im Technologie-Monitor von KI-Kompass Inklusiv aufgelistet sind, sind eigenständige Technologien oder Apps und Software von Dritt-Anbietern. Das heißt: Man muss sie extra kaufen oder installieren.
Einige KI-Funktionen für Barrierefreiheit sind jedoch schon in Smartphones und Computern enthalten; kostenlos und ohne Installation. Viele Menschen kennen diese Funktionen unter dem englischen Wort „Accessibility-Features“. „Accessibility“ bedeutet auf Deutsch Barrierefreiheit und „feature“ bedeutet Funktion. Dieser Bericht zeigt, welche Funktionen das sind und stellt die Frage: Wie können diese Funktionen und Apps den Arbeitsalltag von Menschen mit Behinderungen unterstützen?
Was sind KI-Funktionen für Barrierefreiheit?
Mit KI-Funktionen für Barrierefreiheit sind hier Funktionen von Geräten wie Smartphones, Tablets oder Computern sowie von Software gemeint, die Menschen mit Behinderungen
- die Bedienung ihrer Geräte und Programme ermöglichen sollen,
- die Bedienung ihrer Geräte und Programme erleichtern sollen,
- oder Barrieren im Alltag abbauen sollen.
KI-Funktionen für Barrierefreiheit sind in die Betriebs-Systeme von Smartphones und Computern integriert. Sie müssen oft nur noch aktiviert werden.
Funktionen werden dann KI-Funktionen für Barrierefreiheit genannt, wenn darin KI-Methoden vorkommen. Mehr dazu steht in der nächsten Infobox.
KI-Funktionen für Barrierefreiheit können zum Beispiel eine Sprachausgabe oder eine Diktierfunktion sein:
- Mit einer Sprachausgabe muss man nicht alle Texte auf dem Bildschirm lesen, sondern kann sie sich anhören. Heute verwenden viele Sprachausgaben eine KI-Stimme. Manchmal erkennt eine KI-Technologie Inhalte (zum Beispiel Buttons oder Bilder) auf dem Bildschirm automatisch und liest sie vor oder beschreibt sie.
- Mit einer Diktierfunktion muss man einen Text nicht schreiben. Es reicht, etwas zu sagen, und es wird automatisch in einen Text mit der richtigen Grammatik und Rechtschreibung umgewandelt. Die Sprache wird fast immer mit einem KI-System erkannt.
Diese Funktionen sind nicht perfekt, und sie können fehlerhaft sein. Sie können aber praktisch für viele Menschen mit oder ohne Behinderung sein. Zum Beispiel für Menschen, die nicht gut sehen, lesen oder schreiben können. Oder für Menschen mit körperlichen Beeinträchtigungen, die das Display nicht berühren können.
Es gibt noch viele weitere Funktionen für Barrierefreiheit ohne KI-Methoden: Zum Beispiel Farbfilter für den Bildschirm, größere Schrift, eine Bildschirmlupe oder ein Blitzlicht, das einen Klingelton ersetzt oder ergänzt. Ein Fokusmodus oder vereinfachte Menüs können Menschen beim Konzentrieren auf eine Aufgabe helfen. Dieser Artikel stellt aber nur Funktionen mit KI-Methoden vor.
Wie hat das Projektteam die Recherche zu den KI-Funktionen für Barrierefreiheit durchgeführt?
Das Projektteam von KI-Kompass Inklusiv hat recherchiert, welche KI-Funktionen für Barrierefreiheit es schon gibt. Diese Funktionen wurden gesammelt, aber nicht getestet. Danach hat das Team die Mitglieder unseres Begleitgremiums gefragt, inwiefern diese Funktionen sie bei der Arbeit unterstützen können. Im Begleitgremium sind Menschen mit Behinderungen, die in Berufsbildungswerken, Berufsförderungswerken und Werkstätten für behinderte Menschen in Deutschland arbeiten. Sie treffen sich viermal im Jahr und beraten das Projekt KI-Kompass Inklusiv zu seiner Arbeit.
Zunächst hat das Team Funktionen in den Betriebs-Systemen angeschaut, die die meisten Menschen nutzen. Laut einer Statistik waren das Windows, macOS, und Linux bei Computern (weltweit im Jahr 2025, Statcounter, zitiert nach Statista, 2025). Bei Smartphones waren das Android und iOS (Deutschlandweit im Jahr 2025, Statcounter, zitiert nach Statista, 2025).
Um den Stand von April 2025 abzubilden, hat das Team die neuesten Betriebs-Systeme untersucht:
- Windows 11 mit Copilot
- macOS 15 Sequoia
- Android 10 und höher
- iOS 18
Außerdem hat das Team geprüft, welche KI-Funktionen für Barrierefreiheit in Programmen für Video-Konferenzen und Zusammenarbeit enthalten sind. Dafür hat das Team folgende Programme betrachtet:
- Microsoft Teams
- Zoom
- Google Meet
- Cisco Webex Meetings
Bei der Recherche wurden weitere KI-Apps für mehr Barrierefreiheit gefunden, die die Betriebs-System-Hersteller Windows, Apple oder Google extra für ihre eigenen Systeme entwickelt haben. Solche Apps nennt man native Apps. Auch sie wurden in die Auflistung unter Funktionen nach Unterstützungsart aufgenommen.
Weil das Projekt „KI-Kompass Inklusiv“ einen besonderen Fokus auf KI-Assistenztechnologien legt, hat das Team geprüft, ob eine Funktion für Barrierefreiheit KI-Methoden benutzt oder nicht.
Wie hat das Projektteam geprüft, ob eine Funktion KI-Methoden benutzt?
Das Projektteam hat die Hersteller-Beschreibung einer Funktion mit einer anerkannten Definition von KI verglichen. Diese Definition stammt von den Forschern Russell & Norvig (2010). Laut Russell & Norvig sind KI-Technologien Systeme, die ihre Umgebung wahrnehmen, Schlüsse ziehen und handeln, um Ziele zu erreichen.
KI-Technologien kann man laut Russell & Norvig in verschiedene Bereiche einteilen (hier stark vereinfacht und als Fähigkeiten formuliert):
- Problemlösen: Ein KI-System findet Lösungen für komplexe Aufgaben. Zum Beispiel probiert es viele Möglichkeiten aus, bis es die beste Lösung findet.
- Wissensrepräsentation & Schlussfolgern: Ein KI-System speichert Wissen und zieht daraus Schlüsse. Zum Beispiel erstellt es daraus einen Plan für die nächsten Schritte.
- Schlussfolgern unter Unsicherheit: Ein KI-System trifft Entscheidungen, auch wenn nicht alle Informationen vorliegen. Zum Beispiel schätzt es ab, was am wahrscheinlichsten richtig ist.
- Maschinelles Lernen: Ein KI-System lernt aus Daten und Erfahrungen. Zum Beispiel erkennt es Muster und wird durch Übung besser.
- Wahrnehmen, Kommunizieren & Handeln: Ein KI-Systeme erkennt Bilder, Videos, Töne oder Sprache oder erzeugt selbst Sprache. Außerdem können KI-Technologien zum Beispiel Roboter oder Maschinen in der echten Welt steuern.
Manchmal war es nicht eindeutig, ob eine Funktion für Barrierefreiheit wirklich eine KI-Funktion ist. Zum Beispiel, weil die Hersteller auf ihren Webseiten nicht genug Informationen angegeben haben. Deswegen hat das Team eine Einschätzung angegeben, wie sicher es ist:
- Sicher: Die Funktion ist KI-gestützt. Die Hersteller haben das geschrieben und wir haben dafür einen Nachweis gefunden.
- Wahrscheinlich: Die Funktion ist wahrscheinlich KI-gestützt. Die Hersteller haben das nicht genau beschrieben, aber andere Quellen sagen, dass das wahrscheinlich ist.
- Möglich: Für diese Funktion kann man KI-Methoden verwenden, muss es aber nicht. Wir haben keinen Nachweis gefunden, ob das wirklich eine KI-Funktion ist.
In diesem Beitrag stehen nur Funktionen, von denen das Projektteam sagt: Das sind sicher oder wahrscheinlich KI-Funktionen.
Das Ergebnis der Recherchen
Das Projektteam fand über 170 Funktionen für Barrierefreiheit. Darunter sind 67, die wahrscheinlich oder sicher Methoden von Künstlicher Intelligenz nutzen.
Funktionen nach Unterstützungsart
Im Folgenden sind alle KI-Funktionen für Barrierefreiheit aufgelistet, die wahrscheinlich oder sicher KI-Methoden nutzen. Sie sind nach den Unterstützungsarten Sehen und Lesen, Hören, Sprechen, Steuern sowie Arbeiten und Lernen sortiert.
Per Maus-Klick auf das jeweilige Feld öffnet sich eine Liste mit den KI-Funktionen. Die KI-Funktionen sind nach Betriebs-Systemen geordnet und werden kurz beschrieben.
Die Listen zeigen den Stand der KI-Funktionen von April 2025.
Android
- Lookout: Erkennt und benennt Objekte in Fotos in Echtzeit. Bestimmt die Entfernung und Richtung von bestimmten Objekten. Erkennt Texte und liest sie vor (App Lookout).
- TalkBack: Beschreibt den gesamten Bildschirminhalt. Erkennt Bilder und beschreibt sie. Beantwortet Fragen zu Bildern.
- Vorlesen: Liest Inhalte auf dem Bildschirm vor. Erkennt Texte mit der Kamera oder Text in Bildern und liest sie vor. Erkennt Bilder und beschreibt sie.
iOS
- Gesprochene Inhalte: Liest den gesamten Text auf dem Bildschirm vor (ohne VoiceOver).
- Live-Text: Erkennt Texte in Fotos der Bildergalerie. Man kann die Texte kopieren, sie weiterverwenden oder übersetzen.
- Lupe: Beschreibt die Umgebung in Echtzeit. Erkennt Objekte, Personen oder Text. Liest Texte vor, wenn man auf sie zeigt (App Lupe).
- VoiceOver Screenreader: Erkennt Elemente auf dem Bildschirm und liest Inhalte vor.
Linux
- Sprach-Ausgabe beim Orca-Screenreader: Liest Inhalte auf dem Bildschirm vor.
macOS
- Diktier-Funktion: Texte diktieren und bearbeiten. Aufgaben per Sprache erledigen.
- Gesprochene Inhalte: Liest den gesamten Text auf dem Bildschirm vor (ohne VoiceOver).
- Siri: Einen intelligenten Sprach-Assistenten für viele verschiedene Aufgaben verwenden.
- VoiceOver Screenreader: Erkennt Elemente auf dem Bildschirm und liest Inhalte vor.
Windows
- Sprach-Ausgabe: Liest Inhalte auf dem Bildschirm vor. Man kann mit den Inhalten weiterarbeiten. Beschreibt Bilder, Diagramme und Grafiken (nur bei Copilot-PCs).
Android
- Audio-Verstärker: Hebt Gespräche und Audio hervor, reduziert Geräusche (App Audioverstärker).
- Automatische Transkription & Geräusch-Benachrichtigungen: Zeigt in Echtzeit Untertitel für gesprochene Worte und Geräusche. Erkennt bestimmte Geräusche und schickt einen Alarm an Nutzer*innen, zum Beispiel als Vibration oder Lichtblitz (App Automatische Transkription & Geräuschbenachrichtigungen, auf Google-Pixel Smartphones vorinstalliert).
- Automatische Untertitel: Zeigt in Echtzeit Untertitel für Medien (zum Beispiel Videos) oder Telefonate.
- Illustrative Untertitel: Hebt Wörter hervor, die besonders betont werden. Zeigt Geräusche an. Zum Beispiel Lachen, Applaus oder Musik.
iOS
- Geräusch-Erkennung: Erkennt bestimmte Geräusche und schickt einen Alarm an Nutzer*innen.
- Live-Untertitel (nur auf Englisch verfügbar): Zeigt in Echtzeit Untertitel für Medien (zum Beispiel Videos oder Podcasts). Zeigt in Echtzeit Untertitel für gesprochene Worte in der Umgebung.
- Transkription anzeigen: Wandelt Audio-Aufnahmen in Texte um (App Sprachmemos).
- Stimmisolation: Hebt Stimmen in bestimmten Videos oder Apps hervor (App FaceTime).
macOS
- Kopfhörer-Anpassungen: Hebt bestimmte Frequenzen und leise Geräusche hervor. Einstellungen für Telefonate und Medien vornehmen, eigene Audioeinstellungen vornehmen (Bei den Kopfhörern AirPods 2).
- Live-Untertitel: Zeigt in Echtzeit Untertitel für Medien. Zeigt in Echtzeit Untertitel für gesprochene Worte in der Umgebung (nur auf Englisch verfügbar).
- Stimm-Isolation: Hebt Stimmen und Dialoge hervor (App FaceTime).
- Transkript anzeigen: Wandelt Sprach-Nachrichten in Texte um. Man nennt diese Texte Transkripte (App Nachrichten).
Windows
- Live-Untertitel: Zeigt in Echtzeit Untertitel für Videos, Fernseh-Sendungen, Filme oder für Video-Streams.
- Microsoft Translator: Zeigt in Echtzeit Untertitel für gesprochene Worte. Zeichnet Audios auf. Übersetzt Texte in 60 Sprachen (App Microsoft Translator, nicht gebunden an ein bestimmtes Betriebs-System).
Cisco Webex Meetings
- Automatische Untertitel: Zeigt in Echtzeit Untertitel für Video-Konferenzen.
- Live-Transkription: Wandelt Gesprochenes in Echtzeit in Texte um. Erstellt ein Transkript.
Google Meet
- Live-Transkription: Wandelt Gesprochenes in Echtzeit in Texte um. Erstellt ein Transkript (bezahlte Version).
Microsoft Teams
- Live-Untertitel: Zeigt in Echtzeit Untertitel für Video-Konferenzen.
- Reduzierung von Hintergrund-Geräuschen: Filtert störende Geräusche heraus. Hebt Sprache hervor.
- Stimm-Profile und Sprecher*innen-Zuweisung für hybride Besprechungen: Erstellt Stimm-Profile und erkennt, wer gerade spricht. Ordnet Aussagen im Transkript der richtigen Person zu (bei Nutzung von Teams zusammen mit intelligenten Lautsprechern).
Zoom
- Live-Transkription: Wandelt Gesprochenes in Echtzeit in Texte um. Zeigt diese Untertitel in Video-Konferenzen. Erstellt ein Transkript.
Android
- Project Relate: Erkennt atypische Sprache. Wandelt atypische Sprache in Text um. Dieser Text lässt sich in verständlicher Sprache wiederholen. Erkennt Sprach-Befehle in atypischer Sprache. Damit lässt sich der Google Assistant steuern (App Project Relate).
- Sprachausgabe: Liest Nachrichten vor, die man selbst getippt hat (App Automatische Transkription & Geräuschbenachrichtigungen).
- Während eines Anrufs Antworten eingeben: Liest Gesprächs-Partner*innen Antworten vor, die man während eines Telefonats eintippt.
iOS
- Eigene Stimme: Erstellt eine KI-Stimme aus der eigenen Stimme. Besonders für Menschen, die ihre Stimme verlieren werden. Oder für Menschen, die eine Sprach-Beeinträchtigung bekommen werden. Die KI-Stimme kann in persönlichen Gesprächen, Video-Anrufen und Apps für unterstützte Kommunikation benutzt werden.
- Live-Sprachausgabe: Liest Texte, die man eintippt oder gespeicherte Sätze laut vor. In persönlichen Gesprächen oder Video-Anrufen. Man kann die eigene KI-Stimme verwenden.
macOS
- Eigene Stimme: Erstellt eine KI-Stimme aus der eigenen Stimme. Besonders für Menschen, die ihre Stimme verlieren werden. Oder für Menschen, die eine Sprach-Beeinträchtigung bekommen werden. Die KI-Stimme kann in persönlichen Gesprächen, Video-Anrufen und Apps für unterstützte Kommunikation benutzt werden.
- Live-Sprachausgabe: Liest Texte, die man eintippt oder gespeicherte Sätze laut vor. Man kann die eigene KI-Stimme verwenden.
Android
- Entsperrung per Gesichtserkennung: Erkennt das Gesicht. Damit kann man das Smartphone ohne Tippen oder Wischen entsperren. Man kann sich damit in Apps anmelden und einen Online-Einkauf bestätigen.
- Project Activate: Erkennt Bewegungen und Gesichts-Ausdrücke. So kann man SMS senden, jemanden anrufen, einen Satz sprechen oder eine Audio-Datei abspielen (App Project Activate, bisher nur auf Englisch verfügbar).
- Voice Access: Erkennt Sprach-Befehle. Damit kann man das Smartphone steuern (App Voice Access).
iOS
- AssistiveTouch, geräuschbezogene Aktionen: Erkennt Gesten oder Geräusche. Zum Beispiel ein Plopp- oder Zischgeräusch mit dem Mund. Damit kann man eine bestimmte Aktion ausführen.
- Auf atypische Sprache achten: Der Sprach-Assistent Siri erkennt atypische Sprache. Also verschiedene Sprachmuster oder lange Sprechpausen.
- Blickerfassung: Erkennt Augen-Bewegungen. Damit kann man das Smartphone ohne Tippen oder Wischen steuern.
- Face ID: Erkennt das Gesicht. Damit kann man das Smartphone ohne Tippen oder Wischen entsperren. Man muss die Augen nicht öffnen. Man muss auch nicht das Display anschauen, wenn man das nicht kann. Damit kann man sich in Apps anmelden und einen Online-Einkauf bestätigen.
- Kopferfassung: Erkennt Kopf-Bewegungen und Gesichts-Ausdrücke. Damit kann man einen Maus-Zeiger auf dem Bildschirm steuern oder Aktionen ausführen.
- Sprachsteuerung: Steuert das Smartphone per Stimme. Man kann Apps öffnen, Tasten drücken und Text diktieren und bearbeiten.
- Stimmkurzbefehle: Erkennt bestimmte Worte oder Geräusche. Damit kann man das Gerät steuern. Für Menschen mit einer atypischen bis schwer atypischen Aussprache.
macOS
- Alternative Zeigeroptionen: Erkennt Gesichtsausdrücke. Damit kann der Maus-Zeiger gesteuert werden. Zum Beispiel: Rechts-Klick, Links-Klick, Doppel-Klick, Verschieben.
- Auf atypische Sprache achten: Der Sprach-Assistent Siri erkennt atypische Sprache. Also verschiedene Sprachmuster oder lange Sprechpausen.
- Bedienungshilfetastatur: Zeigt eine Bildschirmtastatur mit Schreibvorschlägen. Man kann Verweilaktionen festlegen. Das bedeutet, dass eine Taste automatisch angetippt wird, wenn man den Mauszeiger lange darauf stehen lässt.
- Diktierfunktion: Texte diktieren und bearbeiten. Aufgaben per Sprache erledigen.
- Kopfzeiger, Verweilen: Steuert den Maus-Zeiger mit Kopf- oder Augenbewegungen.
- Sprachsteuerung: Steuert den Mac-Computer mit Sprachkurzbefehlen. Man kann Apps öffnen, Tasten drücken und Text diktieren und bearbeiten.
- Stimmkurzbefehle: Steuert den Mac-Computer mit Worten oder anderen Geräuschen der Wahl (bei moderaten bis schweren atypischen Sprachmustern).
Windows
- Augensteuerung: Steuert den Windows-Computer mit Augen-Bewegungen. Man kann Text mit den Augen über eine Bildschirmtastatur eingeben. Für die Augensteuerung braucht man ein extra Gerät, das die Blick-Richtung erkennt, einen sogenannten „Eyetracker“.
- Spracheingabe: Erkennt Sprache offline, wandelt sie in Texte um und gibt sie im Computer ein.
- Sprachzugriff: Steuert den Windows-Computer offline per Sprache. Maus und Tastatur können mit der Stimme verwendet werden. Man kann Texte diktieren, auswählen und bearbeiten.
Cisco Webex Meetings
- Gesten für Reaktionen: Erkennt Handgesten und wandelt sie in Emoji-Reaktionen um.
Android
- Tastaturvorschläge: Blendet Wort-Vorschläge beim Tippen ein.
iOS
- Textvorschläge: Blendet Wort-Vorschläge beim Tippen ein.
macOS
- Textvorschläge: Blendet Wortvorschläge beim Tippen in Textfeldern ein und korrigiert Tippfehler.
Windows
- Copilot Chat: Mit einem KI-Assistenten sprechen oder chatten. Copilot beantwortet komplexe Fragen, durchsucht das Internet, erstellt Texte, Bilder, Lieder, Code oder andere Inhalte, beschreibt Bilder, übersetzt Texte in bis zu 40 Sprachen (bezahlte Version).
- Copilot in Excel: Erstellt und verwaltet Formeln. Erstellt Visualisierungen. Führt Datenanalysen durch, etc. (bezahlte Version).
- Copilot in Outlook: Schreibt und bearbeitet E-Mails. Priorisiert E-Mails. Fasst den E-Mail-Verlauf zusammen (bezahlte Version).
- Copilot in PowerPoint: Erstellt und bearbeitet PowerPoint-Präsentationen, etc. (bezahlte Version).
- Copilot in Word: Erstellt und bearbeitet Word-Dokumente (Schreibassistenz). Fasst Dokumente zusammen. Vereinfacht die Sprache. Erstellt Grafiken und Tabellen aus Text (bezahlte Version).
- Microsoft Editor: KI-Schreib-Assistent für Microsoft Edge, Chrome, Word und Outlook). Prüft die Grammatik und Rechtschreibung von Texten, schlägt Stilverbesserungen wie Klarheit, Prägnanz oder Förmlichkeit vor, schlägt Vokabeln vor, sagt Text beim Schreiben vorher.
- Plastischer Reader: Vereinfacht die Darstellung von Text in Microsoft Edge, OneNote, Word, Teams, Outlook & PowerPoint. Liest Text laut vor. Teilt Wörter in Silben auf und hebt Wortarten (Substantive, Verben, Adjektive und Adverbien) hervor. Stellt Wörter als Grafik dar (Bildwörterbuch). Übersetzt Webseiten.
- Textvorschläge: Blendet Wortvorschläge beim Tippen in Textfeldern ein und korrigiert Tippfehler.
Cisco Webex Meetings
- Cisco AI Assistant: Fasst Besprechungen und Chats zusammen. Erstellt Aufgabenlisten aus Meetings. Erstellt Untertitel und Transkripte in Echtzeit (bezahlte Version).
Google Meet
- Gemini in Meet: Erstellt automatisch Notizen und fasst Besprechungen zusammen. Übersetzt Untertitel in Echtzeit in über 60 Sprachen (bezahlte Version).
Microsoft Teams
- Copilot in Teams: Fasst Besprechungen und Chats zusammen. Durchsucht und priorisiert Chats. Interpretiert den Tonfall in Sitzungen (bezahlte Version).
Zoom
- Zoom AI Companion: Fasst Besprechungen zusammen und erstellt automatisch Aufgaben und Follow-up-E-Mails. Übersetzt und transkribiert Gespräche in Echtzeit in 46 Sprachen (bezahlte Version).
Wie beurteilen Menschen mit Behinderungen die KI-Funktionen für Barrierefreiheit von Smartphones und Computern?
Im Juni 2025 fand ein Workshop mit den Mitgliedern des Begleitgremiums von KI-Kompass Inklusiv statt. Dabei wurden ihnen die KI-Funktionen für Barrierefreiheit vorgestellt. Die Mitglieder diskutierten kritisch, ob und inwiefern ihnen diese schon heute bei der Arbeit oder im Alltag helfen. Außerdem testeten sie gemeinsam drei KI-Funktionen. Dieses Kapitel beschreibt die Ergebnisse des Workshops.
Erfahrungen der Mitglieder des Begleitgremiums mit KI-Funktionen für Barrierefreiheit
Dabei zeigte sich: Die meisten Mitglieder des Begleitgremiums kennen die KI-Funktionen für Barrierefreiheit schon. Die große Anzahl und die Vielfalt der Funktionen hat sie aber überrascht. Einige nutzen häufig die Diktierfunktion und die Sprachausgabe ihres Smartphones. Damit geben sie E-Mails und Nachrichten ein oder hören sich Bildschirminhalte an. Andere nutzen KI-Funktionen für Barrierefreiheit hingegen selten oder noch gar nicht. Sie haben angemerkt, dass Hersteller von Geräten nicht deutlich genug auf die Funktionen hinweisen und erklären, wie sie genutzt werden können. Den Ansatz, KI-Funktionen für Barrierefreiheit in Geräte direkt zu integrieren, bewerten sie als grundsätzlich positiv: Bedienungshilfen ermöglichen beispielsweise auch Menschen mit starken Seh-Beeinträchtigungen niedrigschwellig die Nutzung von Geräten. Ein wesentlicher Vorteil von integrierten Funktionen für Barrierefreiheit ist, dass sie langfristig durch die Hersteller unterstützt werden. Das heißt, dass die Funktionen meistens auch nach einem Update der Software zur Verfügung stehen.
Am Beispiel der Sprach-Eingabe („Funktionen nach Unterstützungsart“ > „Steuern – von Computern“ > „Windows“) wurde jedoch deutlich, dass KI-Funktionen für Barrierefreiheit manchmal nur eine Basis-Unterstützung bieten. Ein Mitglied des Begleitgremiums berichtete, dass es für Sprach-Eingaben auf der Arbeit spezialisierte Produkte von Dritt-Anbietern bevorzuge, weil diese deutlich ausgereifter seien. Ähnlich war es mit der Sprach-Ausgabe. Die Person gab an, lieber einen etablierten Screenreader zu nutzen, als sich auf die in das Betriebs-System integrierte Sprach-Ausgabe zu verlassen.
In der Diskussion wurde auch deutlich, dass einige Bedienungshilfen nicht vollständig barrierefrei umgesetzt sind. Ein Beispiel sind diktierte Nachrichten auf Android-Smartphones: Diese müssen oft nachbearbeitet werden, weil die Funktion keine „Absatz“- Befehle unterstützt. Eine Person aus dem Begleitgremium schloss daraus, dass Hersteller bei der Entwicklung solcher Funktionen nicht immer Menschen mit Behinderungen einbeziehen. Es wurde außerdem vermutet, dass solche KI-Funktionen von den Herstellern hauptsächlich entwickelt werden, um die Produktivität von allen Nutzer*innen zu steigern und dabei Menschen mit Behinderungen nicht immer im Mittelpunkt stehen.
Test von KI-Funktionen für Barrierefreiheit im Begleitgremium
Die Mitglieder des Begleitgremiums testeten drei KI-Funktionen für Barrierefreiheit auf dem Smartphone anhand von Situationen aus dem Arbeitsalltag. Die Kern-Ergebnisse sind hier aufgelistet:
- Automatische Transkription bei Android:
Die Mitglieder des Begleitgremiums fanden die Transkriptions-Funktion bei Android nützlich, zum Beispiel für persönliche Gespräche. Ihnen fehlte jedoch eine Unterscheidung der verschiedenen Stimmen im Transkript. Das Trankskript ist ein einziger großer Textblock, ohne Kennzeichnung, wer etwas gesagt hat. Laut Mitgliedern des Begleitgremiums wäre zum Beispiel eine farbliche Markierung für verschiedene Personen hilfreich. - Geräusch-Benachrichtigungen bei Android und Geräusch-Erkennung bei iOS:
Nach Einschätzung des Begleitgremiums funktionierte die Geräusch-Erkennung bei beiden Betriebs-Systemen weitgehend zuverlässig. Im Test wurde zum Beispiel Türklopfen erkannt. Zwischen den Systemen haben die Mitglieder des Begleitgremiums Unterschiede festgestellt: Bei iOS können Nutzer*innen eigene Geräusche festlegen, die erkannt werden sollen. Bei Android gibt es bisher nur eine feste Auswahl an Geräuschen. - Die Lupe von iOS zum Vorlesen von Dokumenten und „Point & Speak“ von iOS:
Die Mitglieder des Begleitgremiums beschrieben die Vorlesefunktion der iOS-Lupe als praktisch, zum Beispiel zum Lernen. Ihnen fehlte jedoch ein Modus, der Dokumente und Tabellen erkennt. Ein Mitglied des Begleitgremiums merkte an, dass die „Point & Speak“-Funktion nicht sonderlich intelligent reagiere. Nach Einschätzung des Begleitgremiums wünsche sich die blinde Community eine Umgebungs-Erkennung in Echtzeit. Ein Mitglied des Begleitgremiums berichtete, dafür bisher den Live-Video-Chat der ChatGPT-App zu nutzen.
Welche Bedeutung haben KI-Funktionen für Barrierefreiheit für die berufliche Teilhabe von Menschen mit Behinderungen?
Dieser Beitrag hat gezeigt: Smartphones, Tablets und Computer bieten vielfältige KI-Funktionen für Barrierefreiheit.
Zusammenfassung der Ergebnisse
Für eine schnelle Übersicht wurden die KI-Funktionen ausgezählt. Die Zahlen zeigen nicht, wie gut die Funktionen sind und wie gut sie sich für Menschen mit Behinderungen eignen. Außerdem sind die einzelnen Funktionen unterschiedlich umfangreich. Einige Funktionen sind sehr spezifisch, andere haben viele verschiedene Teil-Funktionen.

Die Auswertung zeigt, dass KI-Funktionen bisher vor allem das Hören und das Steuern von Geräten unterstützen. Auch wenn dieser Beitrag das nicht gesondert zeigt, gibt es zur Unterstützung des Sehens und Lesens schon digitale Lösungen, die ohne KI-Methoden auskommen. Das sind zum Beispiel ein Lesemodus, Vergrößerungen, oder Farbfilter. Die 15 Funktionen zum Arbeiten und Lernen erleichtern oder automatisieren Arbeitsabläufe, zum Beispiel durch Unterstützung beim Schreiben oder durch Zusammenfassungen. Für Menschen mit Lern- oder geistigen Behinderungen kann das bereits hilfreich sein. Gleiches gilt für Sprach-Eingaben und Sprach-Ausgaben. Nur wenige KI-Funktionen unterstützen diese Zielgruppe aber explizit.
Die Diskussion mit unserem Begleitgremium hat gezeigt: KI-Funktionen für Barrierefreiheit können einen ersten Beitrag zur beruflichen Teilhabe leisten, indem sie digitale Barrieren reduzieren. Ihr Vorteil: Sie sind leichter zugänglich als eigenständige, KI-gestützte Assistenztechnologien. Diese müssen extra beschafft, angepasst und in betriebliche IT-Systeme und Prozesse eingebunden werden. Nicht alle Berufe sind aber digital. Einige wenige KI-Funktionen für Barrierefreiheit in Smartphones und Computern helfen zwar auch in der analogen Arbeitswelt, zum Beispiel durch das Erkennen von Texten oder Objekten in der Umgebung. Trotzdem reichen diese allein nicht aus, um alle Barrieren im Arbeitsleben zu überwinden. Dazu kommt, dass sie laut Mitgliedern unseres Begleitgremiums oft nicht so ausgereift sind wie Technologien von Dritt-Anbietern.
KI-Funktionen für Barrierefreiheit und KI-Assistenz-Technologien im Vergleich
Hier kommen KI-gestützte Assistenztechnologien ins Spiel, über die das Projekt KI-Kompass Inklusiv im Technologie-Monitor informiert. KI-Assistenz-Technologien werden als individuelle Hilfsmittel für Menschen mit Behinderungen oder als technische Arbeitshilfe (Institut der deutschen Wirtschaft Köln e.V., 2018ab) für barrierefreie Arbeitsplätze in Unternehmen entwickelt. Diese können besser zur Reduktion von Barrieren geeignet sein als KI-Funktionen für Barrierefreiheit von Smartphones und Computern. Zum Beispiel weil Menschen mit Behinderungen die Entwicklung der KI-Assistenz-Technologien mitgestaltet haben und dadurch bei der Nutzung der Technologien weniger Barrieren auftreten. Andere KI-Assistenz-Technologien werden für den Einsatz in Unternehmen entwickelt und können dadurch besser bei betrieblichen Arbeitsprozessen unterstützen.
Ob eine KI-Funktion für Barrierefreiheit ausreicht oder eine KI-Assistenz-Technologie benötigt wird, muss im Einzelfall entschieden werden und hängt von vielen Faktoren ab. Unter anderem auch davon, ob ein KI-gestütztes Hilfsmittel von Menschen mit Behinderungen bzw. eine Arbeitshilfe von Arbeitgebern durch Kostenträger übernommen und beschafft werden kann. In jedem Fall ist es wichtig, über KI-Funktionen für Barrierefreiheit von End-Geräten und KI-Assistenz-Technologien gleichermaßen zu informieren. Daher ist Folgendes geplant: Der
Technologie-Monitor wird erweitert. Er soll dann auch Informationen über die KI-Funktionen für Barrierefreiheit von Smartphones und Computern enthalten.
Abschließend soll deutlich gemacht werden, dass im Technologie-Monitor nicht alle Funktionen systematisch geprüft werden können. Für weiterführende Informationen und detaillierte Testberichte, etwa zu barrierefreien Online-Meeting-Programmen, empfehlen wir die
Veröffentlichungen der BFIT-Bund (Überwachungsstelle des Bundes für Barrierefreiheit von Informationstechnik, 2024).
Im Wissenspool-Beitrag verwendete Literatur:
Institut der deutschen Wirtschaft Köln e. V. (REHADAT). (2018a). Lexikon zur beruflichen Teilhabe: Technische Arbeitshilfen. Abgerufen am 18. Mai 2026, von https://www.rehadat.de/lexikon/Lex-Technische-Arbeitshilfen/
Institut der deutschen Wirtschaft Köln e. V. (REHADAT). (2018b). Lexikon zur beruflichen Teilhabe: Hilfsmittel. Abgerufen am 18. Mai 2026, von https://www.rehadat.de/lexikon/Lex-Hilfsmittel/
Russell, S. J., & Norvig, P. (2010). Artificial Intelligence: а Modern Approach. Upper Saddle River.
Statcounter (2025). Marktanteile der führenden Betriebssysteme weltweit von Januar 2009 bis Juli 2025 [Datensatz]. Zitiert nach Statista Research Department. Abgerufen am 22. August 2025, von https://de.statista.com/statistik/daten/studie/157902/umfrage/marktanteil-der-genutzten-betriebssysteme-weltweit-seit-2009/
Statcounter (2025). Marktanteile der führenden mobilen Betriebssysteme an der Internetnutzung mit Mobiltelefonen in Deutschland von Januar 2009 bis Juli 2025 [Datensatz]. Zitiert nach Statista Research Department. Abgerufen am 22.08.2025, von https://de.statista.com/statistik/daten/studie/184332/umfrage/marktanteil-der-mobilen-betriebssysteme-in-deutschland-seit-2009/
Überwachungsstelle des Bundes für Barrierefreiheit von Informationstechnik (BFIT). (2024). Vergleich von Online-Meeting-Plattformen. Abgerufen am 18. Mai 2026, von https://www.bfit-bund.de/DE/Publikation/meetingtool-vergleich.html