ChatGPT hat jetzt Augen, Ohren und Mund

Entwickler OpenAI hat seiner Text-KI eine Stimme gegeben. Die Software kann jetzt mit dem Nutzer sprechen. Auch eine weitere neue Funktion beeindruckt.
OpenAI hat seine Text-KI ChatGPT mit Stimmen ausgestattet. Das Unternehmen teilte mit, dass zahlende Nutzer des Dienstes kΓΌnftig mit dem Chatbot per Sprache interagieren kΓΆnnten.
Der Nutzer kann aus fΓΌnf Stimmen β Juniper, Sky, Cove, Ember und Breeze β wΓ€hlen und erhΓ€lt in einem Voice-Chat Antworten auf Fragen in Echtzeit. Die Stimmen seien in Zusammenarbeit mit Synchronsprechern erstellt worden, schreibt OpenAI.
Im Gegensatz zu Sprachassistenten wie Amazons Alexa oder Siri von Apple klingen die Stimmen tatsΓ€chlich weniger kΓΌnstlich. OpenAI hat auf seinem Blog ein paar Textbeispiele verΓΆffentlicht, die von den ChatGPT-Stimmen vorgelesen werden.
Warnung vor Risiken des Sprachmodells
In dem Eintrag warnt OpenAI vor einem Missbrauch der Technologie. Zwar biete die Funktion die MΓΆglichkeit, barrierefreie und kreative Anwendungen zu schaffen.
Allerdings berge sie auch Risiken, wenn Kriminelle sie fΓΌr betrΓΌgerische Handlungen nutzten β etwa um sich als andere Personen auszugeben. Deshalb habe man die Technologie nur fΓΌr diesen einen bestimmten Anwendungsfall, den Voice-Chat, konzipiert.
Mit dem neuen Software-Update bringt OpenAI auch eine Funktion, die der KI das Erkennen von Bildinhalten ermΓΆglicht. ChatGPT lerne sozusagen das Sehen, schreibt OpenAI.
ErklΓ€ren und bei Problemen helfen
Wie funktioniert das? Hier ein Beispiel: Der Nutzer macht ein Foto von einer SehenswΓΌrdigkeit wΓ€hrend einer Reise. AnschlieΓend lΓ€dt er das Bild ΓΌber die ChatGPT-App hoch. Die KI erkennt das Motiv und kann etwas zur Entstehungsgeschichte erzΓ€hlen.
Eine andere AnwendungsmΓΆglichkeit sieht OpenAI beim LΓΆsen von Problemen. Man kΓΆnne zum Beispiel ein Bild eines Grills machen und den Chatbot fragen, warum dieser nicht funktioniert. Die KI kΓΆnne dabei helfen, den Fehler ausfindig zu machen.
Die neuen Funktionen will OpenAI in den kommenden zwei Wochen fΓΌr alle bezahlenden Mitglieder seines Dienstes zur VerfΓΌgung stellen. Die Sprachfunktion komme nur fΓΌr die App unter iOS und Android, heiΓt es. Bilderkennung werde hingegen auf allen Plattformen verfΓΌgbar sein.
- openai.com: "ChatGPT can now see, hear, and speak"