Bildübersetzungs-Skill für jeden KI-Agenten
Die offizielle Skill-Definition, die KI-Agenten ermöglicht, Bilder zu übersetzen, Text zu extrahieren und Wasserzeichen zu entfernen via direkter REST-API-Aufrufe. Kompatibel mit Cursor, Windsurf, Cline, OpenCode, Claude Desktop und jedem KI-Assistenten.

Direkter API-Zugriff
Agent-Skill mit direktem API-Zugriff
Laden Sie die SKILL.md-Datei herunter und fügen Sie sie dem Skills-Verzeichnis Ihres Agenten hinzu. Ihr Agent wird direkte REST-API-Aufrufe verwenden, um Bilder zu übersetzen, Text zu extrahieren und Wasserzeichen zu entfernen – kein MCP-Server erforderlich.
Endpunkte
/api/translateText in Bildern übersetzen unter Beibehaltung des ursprünglichen Layouts und Stils
Bereich
translateCredits
2-15Content-Type
multipart/form-dataAntwort
application/json (authenticated) | image/* (anonymous)Anfragekörper (FormData)
| Parameter | Typ | Erforderlich | Beschreibung |
|---|---|---|---|
image | File | Erforderlich | Image file to translate (JPG, PNG, WebP, GIF) |
config | JSON string | Optional | Translation configuration options |
Konfigurationsoptionen (JSON)
| Option | Typ | Erforderlich | Beschreibung |
|---|---|---|---|
target_lang | string | Erforderlich | Target language code for translationenjazhkoes+5 moreDefault: |
source_lang | string | Optional | Source language code (auto-detected if not provided) |
translator | string | Erforderlich | AI model to use for translationgemini-2.5-flashdeepseekgrok-4-fastkimi-k2gpt-5.1 |
font | string | Optional | Font for rendered textNotoSansWildWordsBadComicMaShanZhengBangersDefault: |
mode | string | Optional | Translation modegeneralmangadocumentDefault: |
Antwortschema
| Feld | Typ | Beschreibung |
|---|---|---|
success | boolean | Whether translation succeeded |
generationId | string | Unique ID for this generation |
resultImage | string | Base64 data URL of translated image |
inpaintedImage | string | Base64 data URL of text-removed image |
textRegions | array | Array of detected text regions with translations |
upload | object | Presigned URLs for uploading original/result images |
{
"success": true,
"generationId": "550e8400-e29b-41d4-a716-446655440000",
"resultImage": "data:image/png;base64,iVBORw0KGgo...",
"inpaintedImage": "data:image/png;base64,iVBORw0KGgo...",
"textRegions": [
{
"originalText": "こんにちは",
"translatedText": "Hello",
"bounds": { "x": 100, "y": 50, "width": 200, "height": 40 }
}
]
}Code-Beispiele
curl -X POST https://translateimage.io/api/translate \
-H "Authorization: Bearer YOUR_API_KEY" \
-F "[email protected]" \
-F 'config={"target_lang":"ja","translator":"gemini-2.5-flash"}'So installieren Sie den Skill
Install the Skill
Run npx skills add translateimage/translate-image-skills in your project, or copy SKILL.md from our GitHub repo into your agent's skills directory.
API-Schlüssel erhalten
Abonnieren Sie unter translateimage.io/pricing, erstellen Sie dann einen API-Schlüssel unter translateimage.io/dashboard und setzen Sie ihn als Umgebungsvariable TRANSLATEIMAGE_API_KEY.
Loslegen
Ihr Agent kann jetzt Bilder übersetzen, Text extrahieren und Wasserzeichen entfernen – in natürlicher Sprache via API.
SKILL.md herunterladen
Holen Sie sich die offizielle SKILL.md-Datei aus unserem öffentlichen Verzeichnis oder kopieren Sie sie aus der Dokumentation unten.
Skill-Fähigkeiten
Bilder übersetzen
Übersetzen Sie Text in Bildern unter Beibehaltung des ursprünglichen Layouts, der Schriftarten und des Stylings in über 130 Sprachen.
Text extrahieren (OCR)
Hochpräzise optische Zeichenerkennung mit Spracherkennung und Konfidenzwerten.
Text entfernen
KI-gestütztes Inpainting, das Text und Wasserzeichen entfernt und den Hintergrund rekonstruiert.
Image to Text (AI)
Gemini-powered text extraction with optional simultaneous translation to multiple languages in a single call.
Warum diesen Skill verwenden

130+ Sprachen Unterstützung
Übersetzen Sie zwischen allen Sprachpaaren einschließlich CJK, RTL-Schriften und komplexer Typografie.

Layout-Beibehaltung
Intelligente Texterkennung und -darstellung erhält die ursprüngliche Designintegrität Ihrer Bilder.

Stapelverarbeitung
Verarbeiten Sie mehrere Bilder parallel für Übersetzungs-Workflows mit hohem Volumen.

Bereit, Ihren KI-Agenten zu erweitern?
Laden Sie den Skill herunter und beginnen Sie mit der Übersetzung von Bildern mit Ihrem bevorzugten KI-Assistenten via direkter API-Aufrufe.
Häufig gestellte Fragen
Alles, was Sie über den TranslateImage Agent-Skill wissen müssen
Weitere KI-Tools
Verbessern Sie Ihren Workflow mit unserer Suite kostenloser Tools.