Automatisierung

StockTagger – AI-Metadaten für Stock-Fotografie

Eigenprojekt (Open Source)

CLI-Tool für automatische Stock-Foto-Verschlagwortung via Gemini & Claude

StockTagger – AI-Metadaten für Stock-Fotografie
Gemini + Claude Vision IntegrationSQLite Caching für Batch-ProcessingIPTC/XMP Metadata-Writer15 spezialisierte Module10x schnellere Verschlagwortung

StockTagger ist ein CLI-Tool, das Stock-Fotografen die zeitaufwendige Verschlagwortung ihrer Bilder abnimmt. Durch die Kombination von Gemini und Claude Vision analysiert es Bildinhalte und generiert präzise Metadaten in Sekunden.

Das Problem

Stock-Fotografen verbringen oft mehr Zeit mit dem Verschlagworten ihrer Bilder als mit dem eigentlichen Fotografieren. Keywords, Titel, Beschreibungen – für jede Agentur (Adobe Stock, Shutterstock, Getty) in unterschiedlichen Formaten. StockTagger automatisiert diesen Prozess vollständig.

Technische Architektur

Das Tool besteht aus 15 spezialisierten Modulen: Image-Analyse via Multi-Model AI (Gemini für Kontext, Claude für Details), intelligentes SQLite-Caching für Batch-Verarbeitung, und direkte IPTC/XMP Metadata-Schreibung in die Bilddateien. Die Pipeline verarbeitet hunderte Bilder in einem Durchlauf.

Ergebnis

Ein Workflow, der die Verschlagwortung von Stunden auf Minuten reduziert – mit konsistenter Qualität und agenturspezifischen Optimierungen.

StockTagger – AI-Metadaten für Stock-Fotografie

StockTagger ist ein Open-Source-CLI-Tool, das Stock-Fotografen die komplette Verschlagwortung abnimmt. Statt tausende Bilder manuell mit Keywords, Titeln und Beschreibungen zu versehen, analysiert StockTagger Fotos automatisch mit modernen Vision- und Sprachmodellen und schreibt fertige, IPTC/XMP-konforme Metadaten direkt in die Dateien.

Kernnutzen

  • Bis zu 10× schnellere Verschlagwortung gegenüber manueller Arbeit
  • Im Schnitt ~45 optimierte Keywords pro Bild für maximale Auffindbarkeit
  • 90% weniger API-Kosten durch intelligentes Caching und Wiederverwendung von Analyse-Ergebnissen
  • Direkt uploadbare Dateien für Adobe Stock, Shutterstock, Getty & Co. dank sauberer IPTC/XMP-Integration

Technischer Überblick

  • Sprache: Python 3.11+
  • AI-Modelle:
  • Google Gemini 2.0 Flash (Vision) für Bildanalyse
  • Anthropic Claude als Fallback bei unsicheren Ergebnissen
  • Metadaten: IPTC/XMP-Schreibvorgang über ExifTool
  • Caching: SQLite-Datenbank für Batch-Processing ohne doppelte API-Calls
  • Architektur: 15 spezialisierte Module (Analyzer, Keyword-Optimizer, Validator, IPTC-Writer, CSV-Exporter u.a.)
  • Output:
  • Direkte IPTC/XMP-Embedding in die Bilddateien
  • CSV-Export für den Upload zu Stock-Agenturen

Multi-Modell Vision-Analyse

StockTagger nutzt Gemini Vision, um jedes Bild auf drei Ebenen zu verstehen:

  1. Objekte & Szenen – Erkennung von Motiven, Umgebungen, Perspektiven
  2. Stimmung & Look – Emotionale Wirkung, Farbpalette, Stil
  3. Kommerzielle Use Cases – Typische Einsatzszenarien, Zielgruppen, Branchen

Wenn Gemini unsichere oder inkonsistente Ergebnisse liefert, übernimmt Claude als Qualitäts-Fallback, um robuste, marktgerechte Metadaten zu erzeugen.

Intelligentes Caching

Alle Analyse-Ergebnisse werden in einer SQLite-Datenbank gespeichert. Beim erneuten Durchlauf eines Ordners werden nur neue oder geänderte Dateien erneut analysiert. Das reduziert API-Aufrufe massiv und macht große Batch-Updates wirtschaftlich.

Modulbasierte Architektur

Rund 15 spezialisierte Module sorgen für klare Verantwortlichkeiten und einfache Erweiterbarkeit, z. B.:

  • Image-Analyzer (Vision-Auswertung)