KI-Erweiterung: Stabiler Diffusions-Bildgenerator für LibreOffice

LibreOffice enthält standardmäßig keine künstliche Intelligenz (KI). Viele Nutzer wünschen sich jedoch KI-Funktionen in der Suite – daher ermutigen wir Entwickler, diese als optionale Erweiterungen zur Verfügung zu stellen. Genau das hat Igor Támara getan und die Erweiterung „Stable Diffusion for LibreOffice” für KI-generierte Bilder entwickelt, die auf AI Horde (einem freiwilligen, crowdsourced-basierten, verteilten Cluster von Bildgenerierungs-Workern) basiert.

Wir haben mit Igor über die Erweiterung gesprochen – hier ist, was er zu sagen hatte:

Was macht die Erweiterung?

Sie schreiben einen Text, der ein Bild beschreibt, und erhalten ein KI-Bild, das aus dem angegebenen Text generiert wird. Sie können Parameter anpassen, ein Modell auswählen und das beste Ergebnis in schriftlichen Dokumenten, Präsentationen oder an einem Ort Ihrer Wahl verwenden. Die Bilder werden über AI Horde auf freiwilligen GPUs generiert.

Wann haben Sie damit angefangen?

Vor zwei Wochen habe ich mit einem Gimp-Plugin als Grundlage begonnen. Ich bin ganz neu im LibreOffice-Projekt und habe es als Makro gestartet, um diese Funktionalität in die Software zu integrieren. Eine Woche später habe ich es auf GitHub gestellt.

Später habe ich Hilfe von freundlichen Leuten im Forum bekommen, um es in eine Erweiterung umzuwandeln. Ich habe mich auch dem Chat angeschlossen und einige Anfragen im Bug-Tracker ausgefüllt.

Was sind die aktuellen Einschränkungen und was kommt als Nächstes?

Beachten Sie, dass der von Ihnen eingegebene Text an AI Horde gesendet und von den Maschinen, die das Bild erstellen, gesehen wird. Senden Sie daher keine sensiblen Daten. Außerdem erzielen Sie bessere Ergebnisse, wenn Sie die Beschreibung des gewünschten Bildes auf Englisch senden. Wir empfehlen Ihnen, verschiedene Sprachen auszuprobieren, um die Ergebnisse zu sehen.

Sie benötigen eine Internetverbindung, um die Funktion zu nutzen. Wenn Sie Bilder lokal auf Ihrem Computer erstellen möchten, würde es einige Zeit dauern, Ihre Umgebung mit lokalen KI-Modellen zu konfigurieren, Gigabytes an Speicherplatz für diesen Zweck bereitzustellen und möglicherweise stundenlang zu rechnen, um etwas Brauchbares zu erhalten.

Manchmal kann der Text als NSFW („not safe for work“) markiert sein – in diesem Fall erhalten Sie einen schwarz-weißen Text, der dies angibt.

Derzeit funktioniert die Erweiterung in Writer und Impress. Wenn sie aus anderen LibreOffice-Komponenten aufgerufen wird, öffnet sie ein neues Textdokument und fügt das Bild zusammen mit dem angegebenen Text ein.

Die Roadmap umfasst:

  • Übersetzung des Plugins in andere Sprachen
  • Option zur Vorübersetzung des Textes ins Englische
  • Bessere Integration mit LibreOffice Calc und Draw
  • Verdienen Sie sich Lob und bewerten Sie die Bilder, um bei der Anforderung eines Bildes eine höhere Priorität zu erhalten

Wie können andere dazu beitragen, es zu verbessern?

Melden Sie alle Probleme, die Sie finden, und helfen Sie bei der Übersetzung in Ihre Sprache. Bitte füllen Sie dazu ein Formular aus und geben Sie an, um welche Sprache es sich handelt.

Wenn Sie über eine GPU (und generell gute Grafikhardware) verfügen, können Sie sich freiwillig als Mitarbeiter der Horde melden, um die Rechenleistung zu erhöhen – und Sie können sich Lob verdienen, um bei Bedarf eine höhere Priorität zu erhalten.

Wenn Sie mit einem freundlichen Unternehmen zusammenarbeiten, das die vorhandene Hardware nutzen möchte, können Sie sich ebenfalls der Horde anschließen.

Eines der Ziele von AI Horde ist es, die Bildung zu fördern, wofür es ein spezielles Programm gibt.

Dieses Plugin und AI Horde sind vollständig Open Source, sodass jeder lernen und in dieser sich wandelnden und revolutionären Welt der KI so transparent wie möglich sein kann.

Es könnte Bedenken hinsichtlich der Verwendung von Produkten und des Eigentums an Arbeiten geben. Meiner Meinung nach lernen wir immer anhand von Beispielen und verwenden das, was andere vor Tausenden von Jahren erfunden haben, wie zum Beispiel das Laufen, das Feuermachen, die Kommunikation, das Erkunden, das Nachbilden und das Mischen. Wir können weiterhin lernen und Ressourcen fair nutzen – und auch einen Beitrag leisten.

Klicken Sie hier, um die Erweiterung zu erhalten