t-online - Nachrichten fΓΌr Deutschland
Such IconE-Mail IconMenΓΌ Icon

MenΓΌ Icont-online - Nachrichten fΓΌr Deutschland
Such Icon
HomeDigitalAktuelles

Neue Sprach- und Bildfunktionen: ChatGPT hat jetzt Augen, Ohren und Mund


ChatGPT hat jetzt Augen, Ohren und Mund

Von t-online, sha

26.09.2023Lesedauer: 2 Min.
imago images 0305811233Vergrâßern des BildesChatGPT auf einem Smartphone: OpenAI hat neue Funktionen des Chatbots verâffentlicht. (Quelle: IMAGO / Andre M. Chang)
Facebook LogoTwitter LogoPinterest LogoWhatsApp Logo

Entwickler OpenAI hat seiner Text-KI eine Stimme gegeben. Die Software kann jetzt mit dem Nutzer sprechen. Auch eine weitere neue Funktion beeindruckt.

OpenAI hat seine Text-KI ChatGPT mit Stimmen ausgestattet. Das Unternehmen teilte mit, dass zahlende Nutzer des Dienstes kΓΌnftig mit dem Chatbot per Sprache interagieren kΓΆnnten.

Der Nutzer kann aus fΓΌnf Stimmen – Juniper, Sky, Cove, Ember und Breeze – wΓ€hlen und erhΓ€lt in einem Voice-Chat Antworten auf Fragen in Echtzeit. Die Stimmen seien in Zusammenarbeit mit Synchronsprechern erstellt worden, schreibt OpenAI.

Im Gegensatz zu Sprachassistenten wie Amazons Alexa oder Siri von Apple klingen die Stimmen tatsΓ€chlich weniger kΓΌnstlich. OpenAI hat auf seinem Blog ein paar Textbeispiele verΓΆffentlicht, die von den ChatGPT-Stimmen vorgelesen werden.

Warnung vor Risiken des Sprachmodells

In dem Eintrag warnt OpenAI vor einem Missbrauch der Technologie. Zwar biete die Funktion die MΓΆglichkeit, barrierefreie und kreative Anwendungen zu schaffen.

Allerdings berge sie auch Risiken, wenn Kriminelle sie fΓΌr betrΓΌgerische Handlungen nutzten – etwa um sich als andere Personen auszugeben. Deshalb habe man die Technologie nur fΓΌr diesen einen bestimmten Anwendungsfall, den Voice-Chat, konzipiert.

Mit dem neuen Software-Update bringt OpenAI auch eine Funktion, die der KI das Erkennen von Bildinhalten ermΓΆglicht. ChatGPT lerne sozusagen das Sehen, schreibt OpenAI.

ErklΓ€ren und bei Problemen helfen

Wie funktioniert das? Hier ein Beispiel: Der Nutzer macht ein Foto von einer Sehenswürdigkeit wÀhrend einer Reise. Anschließend lÀdt er das Bild über die ChatGPT-App hoch. Die KI erkennt das Motiv und kann etwas zur Entstehungsgeschichte erzÀhlen.

Eine andere AnwendungsmΓΆglichkeit sieht OpenAI beim LΓΆsen von Problemen. Man kΓΆnne zum Beispiel ein Bild eines Grills machen und den Chatbot fragen, warum dieser nicht funktioniert. Die KI kΓΆnne dabei helfen, den Fehler ausfindig zu machen.

Die neuen Funktionen will OpenAI in den kommenden zwei Wochen für alle bezahlenden Mitglieder seines Dienstes zur Verfügung stellen. Die Sprachfunktion komme nur für die App unter iOS und Android, heißt es. Bilderkennung werde hingegen auf allen Plattformen verfügbar sein.

Verwendete Quellen
  • openai.com: "ChatGPT can now see, hear, and speak"
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...

ShoppingAnzeigen

Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...

t-online - Nachrichten fΓΌr Deutschland


TelekomCo2 Neutrale Website