Europäische Startups rennen um die Lösung eines Problems beliebter Chatbots mit künstlicher Intelligenz: die Qualität der Antworten in anderen Sprachen als Englisch.
Das in Helsinki ansässige Silo AI wird am Mittwoch eine Initiative starten, um zum Aufbau neuer großer Sprachmodelle beizutragen, die generativen KI-Produkten wie ChatGPT von OpenAI und Bard von Google in europäischen Sprachen wie Schwedisch, Isländisch, Norwegisch und Dänisch zugrunde liegen.
Das finnische Unternehmen schließt sich anderen Gruppen an, die daran arbeiten, die Technologie hinter Chatbots zu verbessern, die realistische Antworten auf schriftliche Aufforderungen geben und dabei Sprachen wie Deutsch, Hebräisch und Arabisch verwenden.
Die Schritte kommen, als Unternehmen auf der ganzen Welt beginnen, KI-Software einzuführen, die von Microsoft-unterstütztem OpenAI und Google entwickelt wurde, was Kritiker dazu veranlasst, Bedenken hinsichtlich einer übermäßigen Abhängigkeit von einer leistungsstarken, geschlossenen Technologie zu äußern, die von einer kleinen Gruppe von hauptsächlich amerikanischen Teilnehmern verwendet wurde.
„Eine europäische Initiative muss . . . erfasst Wissen aus europäischer Perspektive und wir können kontrollieren, welche Art von Daten darin eingespeist werden“, sagte Peter Sarlin, CEO von Silo AI.
Googles Bard funktioniert derzeit nur auf Englisch. ChatGPT von OpenAI unterstützt Dutzende von Sprachen, darunter europäische Sprachen, Hindi, Farsi und andere. Laut denen, die es ausgiebig getestet haben, ist es jedoch nicht in allen Sprachen gleich genau.
Silo AI zielt darauf ab, das Problem zu lösen, indem es ein Team erfahrener KI-Akademiker aus ganz Europa zusammenstellt. Sie werden skandinavische Sprachmodelle auf dem leistungsstärksten Supercomputer des Kontinents bauen, trainieren und ausführen LUMIdas sich in Finnland befindet und so modifiziert wurde, dass es generative KI-Software ausführt.
Die Initiative des neuen Teams, bekannt als SiloGen, plant, im Laufe der Zeit auf weitere Sprachen ausgeweitet zu werden.
Das Problem ist jedoch nicht rein sprachlicher Natur. Durch die Schaffung von Modellen in Europa kann sichergestellt werden, dass die Qualität der für das Training verwendeten Daten für die Kultur und Ethik von Ländern außerhalb der USA repräsentativ ist, auch in Bezug auf Datenschutzfragen, sagte Sarlin.
Das Modell von Silo AI wird ebenfalls Open Source sein, was bedeutet, dass es von jedem analysiert und modifiziert werden kann, der es einsetzen möchte. Dies steht im Gegensatz zu den geschlossenen Modellen von OpenAI und Google, mit denen Unternehmen möglicherweise zögern, ihre vertraulichen oder proprietären Daten zu teilen.
Andere europäische Bemühungen umfassen OpenGPT-X und LEAM, beides Initiativen unter deutscher Führung zur Entwicklung von Open-Source-Sprachmodellen. Die Modelle von OpenGPT-X werden in Zusammenarbeit mit dem deutschen KI-Startup Aleph Alpha gebaut.
Bei seiner Einführung im vergangenen Jahr warnte die Gruppe hinter OpenGPT-X, dass der fehlende Zugang zu Details von Modellen wie GPT-4 Europas „digitale Souveränität und Marktunabhängigkeit“ in der KI bedroht, was das Wachstum europäischer Unternehmen und Forschung behindern könnte.
Marco Trombetti, CEO des italienischen digitalen Übersetzungsunternehmens Translated, sagte, führende Chatbots seien darauf programmiert, ihre besten Ergebnisse auf Englisch zu liefern, was „nicht fair gegenüber dem Rest der Welt“ sei.
Um dem entgegenzuwirken, hat sein Unternehmen ein Live-Übersetzungstool für ChatGPT erstellt, das in 60 Sprachen funktioniert und darauf abzielt, die Antworten des Tools zu verbessern.
„In Bezug auf die Technologie ist es für die nicht-englischsprachige Welt wie ein Sprung zurück von fünf Jahren, wodurch effektiv eine Welt der zwei Geschwindigkeiten geschaffen wird“, sagte Trombetti über aktuelle generative KI-Tools.
Solche Bedenken werden nicht nur in Europa geäußert. Die israelische Innovationsbehörde gab 7,5 Mio. Shk (etwa 2,1 Mio. USD) für die Gründung der Association of Natural Language Processing aus. Die Gruppe versucht, die „schlechte und unzureichende Qualität der hebräischen und arabischen Spracherkennung in verschiedenen Arten von computergestützten Systemen“ umzukehren, sagte Dror Bin, ihr CEO.
Bin sagte, dass angesichts der begrenzten Mittel für die KI-Forschung in arabischsprachigen Ländern und relativ wenigen Hebräischsprachigen auf der Welt befürchtet wird, dass sie zurückbleiben, wenn KI-Produkte in kommerzielle Anwendungen wie Microsoft Office und Google Workspace integriert werden.
„Die Qualität des Verstehens und Erkennens menschlicher Sprache auf Hebräisch und Arabisch ist geringer und stellt ein Hindernis für die Realisierung und Anwendung fortschrittlicher Dienste dar“, fügte er hinzu.
Zusätzliche Berichterstattung von John Thornhill
Hardcore-Musikfanatiker. Food-Evangelist. Freiberuflicher Spieler. Wannabe-Schriftsteller. Wegbereiter der Popkultur. Lebenslanger Unternehmer. Reise-Guru.
+ There are no comments
Add yours