适用于任何 AI 代理的图像翻译技能

官方技能定义,使 AI 代理能够通过直接 REST API 调用翻译图像、提取文本和清除水印。兼容 Cursor、Windsurf、Cline、OpenCode、Claude Desktop 以及所有助手。

查看 API 文档
4API 端点
130+种语言
任何AI 代理
AI 代理使用 TranslateImage 技能翻译图像中的文本

直接 API 访问

REST API无需 MCP

具有直接 API 访问权限的代理技能

下载 SKILL.md 文件并将其添加到代理的技能目录中。您的代理将使用直接 REST API 调用来翻译图像、提取文本和移除水印——无需 MCP 服务器。

REST API 文档

将图片翻译集成到您的应用程序中

端点

POST
/api/translate

翻译图片中的文字,同时保持原始布局和样式

范围

translate

积分

2-15

内容类型

multipart/form-data

响应

application/json (authenticated) | image/* (anonymous)

请求体 (FormData)

参数类型必填描述
imageFile
必填
Image file to translate (JPG, PNG, WebP, GIF)
configJSON string可选Translation configuration options

配置选项 (JSON)

选项类型必填描述
target_langstring
必填
Target language code for translation
enjazhkoes+5 more

Default: en

source_langstring可选Source language code (auto-detected if not provided)
translatorstring
必填
AI model to use for translation
gemini-2.5-flashdeepseekgrok-4-fastkimi-k2gpt-5.1
fontstring可选Font for rendered text
NotoSansWildWordsBadComicMaShanZhengBangers

Default: NotoSans

modestring可选Translation mode
generalmangadocument

Default: general

响应格式

字段类型描述
successbooleanWhether translation succeeded
generationIdstringUnique ID for this generation
resultImagestringBase64 data URL of translated image
inpaintedImagestringBase64 data URL of text-removed image
textRegionsarrayArray of detected text regions with translations
uploadobjectPresigned URLs for uploading original/result images
响应示例
{
  "success": true,
  "generationId": "550e8400-e29b-41d4-a716-446655440000",
  "resultImage": "data:image/png;base64,iVBORw0KGgo...",
  "inpaintedImage": "data:image/png;base64,iVBORw0KGgo...",
  "textRegions": [
    {
      "originalText": "こんにちは",
      "translatedText": "Hello",
      "bounds": { "x": 100, "y": 50, "width": 200, "height": 40 }
    }
  ]
}

代码示例

curl -X POST https://translateimage.io/api/translate \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -F "[email protected]" \
  -F 'config={"target_lang":"ja","translator":"gemini-2.5-flash"}'

如何安装技能

1

Install the Skill

Run npx skills add translateimage/translate-image-skills in your project, or copy SKILL.md from our GitHub repo into your agent's skills directory.

2

获取 API 密钥

在 translateimage.io/pricing 订阅,然后在 translateimage.io/dashboard 创建 API 密钥并将其设置为环境变量 TRANSLATEIMAGE_API_KEY。

3

开始使用

您的代理现在可以使用自然语言提示通过 API 翻译图像、提取文本和清除水印。

4

下载 SKILL.md

从我们的公共目录获取官方 SKILL.md 文件,或从下面的文档中复制。

技能能力

翻译图像

翻译图像中的文本,同时保留 130 多种语言的原始版式、字体和样式。

提取文本 (OCR)

高精度光学字符识别,具有语言检测和置信度评分。

移除文本

AI 驱动的修复功能,可在重建背景的同时移除文本和水印。

Image to Text (AI)

Gemini-powered text extraction with optional simultaneous translation to multiple languages in a single call.

为什么使用此技能

多语言翻译支持可视化

支持 130 多种语言

在任何语言对之间进行翻译,包括中日韩、从右到左脚本和复杂的排版。

展示翻译图像中保留版式的对比图

版式保留

智能文本检测和渲染可保持图像原始设计的完整性。

批量图像翻译处理界面

批量处理

并行处理多个图像,适用于高容量翻译工作流。

开发者将 TranslateImage 技能添加到其 AI 代理中

准备好增强您的 AI 代理了吗?

下载技能并开始通过直接 API 调用使用您最喜欢的 AI 助手翻译图像。

常见问题解答

关于 TranslateImage 代理技能您需要了解的一切