Bildübersetzungs-Skill für jeden KI-Agenten

Die offizielle Skill-Definition, die KI-Agenten ermöglicht, Bilder zu übersetzen, Text zu extrahieren und Wasserzeichen zu entfernen via direkter REST-API-Aufrufe. Kompatibel mit Cursor, Windsurf, Cline, OpenCode, Claude Desktop und jedem KI-Assistenten.

API-Dokumentation ansehen
4API-Endpunkte
130+Sprachen
JederKI-Agent
KI-Agent verwendet TranslateImage-Skill zur Übersetzung von Text in Bildern

Direkter API-Zugriff

REST APIKein MCP erforderlich

Agent-Skill mit direktem API-Zugriff

Laden Sie die SKILL.md-Datei herunter und fügen Sie sie dem Skills-Verzeichnis Ihres Agenten hinzu. Ihr Agent wird direkte REST-API-Aufrufe verwenden, um Bilder zu übersetzen, Text zu extrahieren und Wasserzeichen zu entfernen – kein MCP-Server erforderlich.

REST-API-Dokumentation

Integrieren Sie Bildübersetzung in Ihre Anwendungen

Endpunkte

POST
/api/translate

Text in Bildern übersetzen unter Beibehaltung des ursprünglichen Layouts und Stils

Bereich

translate

Credits

2-15

Content-Type

multipart/form-data

Antwort

application/json (authenticated) | image/* (anonymous)

Anfragekörper (FormData)

ParameterTypErforderlichBeschreibung
imageFile
Erforderlich
Image file to translate (JPG, PNG, WebP, GIF)
configJSON stringOptionalTranslation configuration options

Konfigurationsoptionen (JSON)

OptionTypErforderlichBeschreibung
target_langstring
Erforderlich
Target language code for translation
enjazhkoes+5 more

Default: en

source_langstringOptionalSource language code (auto-detected if not provided)
translatorstring
Erforderlich
AI model to use for translation
gemini-2.5-flashdeepseekgrok-4-fastkimi-k2gpt-5.1
fontstringOptionalFont for rendered text
NotoSansWildWordsBadComicMaShanZhengBangers

Default: NotoSans

modestringOptionalTranslation mode
generalmangadocument

Default: general

Antwortschema

FeldTypBeschreibung
successbooleanWhether translation succeeded
generationIdstringUnique ID for this generation
resultImagestringBase64 data URL of translated image
inpaintedImagestringBase64 data URL of text-removed image
textRegionsarrayArray of detected text regions with translations
uploadobjectPresigned URLs for uploading original/result images
Beispielantwort
{
  "success": true,
  "generationId": "550e8400-e29b-41d4-a716-446655440000",
  "resultImage": "data:image/png;base64,iVBORw0KGgo...",
  "inpaintedImage": "data:image/png;base64,iVBORw0KGgo...",
  "textRegions": [
    {
      "originalText": "こんにちは",
      "translatedText": "Hello",
      "bounds": { "x": 100, "y": 50, "width": 200, "height": 40 }
    }
  ]
}

Code-Beispiele

curl -X POST https://translateimage.io/api/translate \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -F "[email protected]" \
  -F 'config={"target_lang":"ja","translator":"gemini-2.5-flash"}'

So installieren Sie den Skill

1

Install the Skill

Run npx skills add translateimage/translate-image-skills in your project, or copy SKILL.md from our GitHub repo into your agent's skills directory.

2

API-Schlüssel erhalten

Abonnieren Sie unter translateimage.io/pricing, erstellen Sie dann einen API-Schlüssel unter translateimage.io/dashboard und setzen Sie ihn als Umgebungsvariable TRANSLATEIMAGE_API_KEY.

3

Loslegen

Ihr Agent kann jetzt Bilder übersetzen, Text extrahieren und Wasserzeichen entfernen – in natürlicher Sprache via API.

4

SKILL.md herunterladen

Holen Sie sich die offizielle SKILL.md-Datei aus unserem öffentlichen Verzeichnis oder kopieren Sie sie aus der Dokumentation unten.

Skill-Fähigkeiten

Bilder übersetzen

Übersetzen Sie Text in Bildern unter Beibehaltung des ursprünglichen Layouts, der Schriftarten und des Stylings in über 130 Sprachen.

Text extrahieren (OCR)

Hochpräzise optische Zeichenerkennung mit Spracherkennung und Konfidenzwerten.

Text entfernen

KI-gestütztes Inpainting, das Text und Wasserzeichen entfernt und den Hintergrund rekonstruiert.

Image to Text (AI)

Gemini-powered text extraction with optional simultaneous translation to multiple languages in a single call.

Warum diesen Skill verwenden

Visualisierung der mehrsprachigen Übersetzungsunterstützung

130+ Sprachen Unterstützung

Übersetzen Sie zwischen allen Sprachpaaren einschließlich CJK, RTL-Schriften und komplexer Typografie.

Vorher und nachher zeigt beibehaltenes Layout im übersetzten Bild

Layout-Beibehaltung

Intelligente Texterkennung und -darstellung erhält die ursprüngliche Designintegrität Ihrer Bilder.

Oberfläche für Stapel-Bildübersetzung

Stapelverarbeitung

Verarbeiten Sie mehrere Bilder parallel für Übersetzungs-Workflows mit hohem Volumen.

Entwickler fügt TranslateImage-Skill zu seinem KI-Agenten hinzu

Bereit, Ihren KI-Agenten zu erweitern?

Laden Sie den Skill herunter und beginnen Sie mit der Übersetzung von Bildern mit Ihrem bevorzugten KI-Assistenten via direkter API-Aufrufe.

Häufig gestellte Fragen

Alles, was Sie über den TranslateImage Agent-Skill wissen müssen