FileMaker als Schnittstelle in der KI-Bildbearbeitung

Der Marktplatz für KI-Modelle in der Bildbearbeitung wird zunehmend unübersichtlich. Ständig kommen neue Modelle hinzu oder bestehende werden weiterentwickelt. Um hier auf dem Laufenden zu bleiben, sind meist mehrere kostenpflichtige Accounts bei unterschiedlichen Anbietern nötig – oft verbunden mit hohen monatlichen Kosten, auch wenn die Modelle nur sporadisch genutzt werden.

Da FileMaker hervorragend mit API-Schnittstellen kommunizieren kann, lag es für mich nahe, eine eigene Anwendung zu entwickeln, die den Zugriff auf verschiedene KI-Bildmodelle zentral bündelt.

Die Idee dahinter:
Eine einheitliche Oberfläche, über die sich unterschiedliche KI-Modelle flexibel ansprechen lassen – ohne feste Abos, sondern nutzungsbasiert über die jeweiligen APIs.

So ist die erste Version dieses Werkzeugs entstanden. Aktuell lassen sich unter anderem die Modelle Nano Banana Pro, GPT Image 1.5, Flux2 [flex] und Seedream-4.5 nutzen. Die Ansteuerung erfolgt direkt über die jeweiligen API-Schnittstellen unter Berücksichtigung der modellabhängigen Parameter. Die Abrechnung läuft ausschließlich über die jeweiligen Anbieter und basiert auf dem tatsächlichen Tokenverbrauch. Dadurch entstehen Kosten nur bei aktiver Nutzung und bleiben jederzeit überschaubar.

Mit FileMaker 22 wurden zwar eigene KI-Script-Schritte eingeführt, diese erlauben derzeit jedoch keine Übergabe von Bilddaten oder Dokumenten an die Modelle. Aus diesem Grund wurde die gesamte Kommunikation in dieser Anwendung über cURL und JSON umgesetzt. Je nach Anforderung des jeweiligen Modells werden Referenzdateien entweder per URL oder Base64-kodiert übergeben.

Der aktuelle Funktionsumfang deckt bereits die wichtigsten Anforderungen für die KI-gestützte Bildgenerierung und -bearbeitung ab:

Dies ist erst der Anfang. Wie bei allen meinen FileMaker-Lösungen wächst auch dieses Werkzeug kontinuierlich im realen Praxiseinsatz weiter und wird um zusätzliche Funktionen ergänzt.

Das Projekt zeigt exemplarisch, wie sich FileMaker als flexible Lösungsplattform nutzen lässt – sei es für eigenständige Anwendungen, zur Erweiterung bestehender Lösungen oder zur individuellen Umsetzung kundenspezifischer Workflows rund um APIs, KI-Modelle und Medienverarbeitung.

Für einen übersichtlichen Workflow, ist der Entwurf der Benutzeroberfäche in drei Bereiche aufgeteilt.

Auf der linken Seite befindet sich die Medienübersicht. Hier sind alle in der Anwendung vorhandenen Bilder abgelegt. Neu generierte Inhalte werden automatisch ergänzt und stehen sofort für die weitere Verwendung zur Verfügung.

Im mittleren Bereich wird der Prompt erstellt und bearbeitet. Dieser Bereich dient als zentrale Arbeitsfläche für die Bildgenerierung und -bearbeitung.

Der rechte Bereich enthält die Auswahl des jeweils verwendeten KI-Modells sowie alle modellabhängigen Parameter. Je nach Modell stehen hier unterschiedliche Einstellmöglichkeiten zur Verfügung, die direkt in die API-Abfrage einfließen.

Im unteren rechten Bereich werden die Referenzbilder angezeigt, die bei der aktuellen Anfrage übermittelt werden. Diese können sowohl aus bereits generierten Bildern als auch aus externen Vorlagen stammen. Die Auswahl dieser Referenzbilder erfolgt in der Medienübersicht.