「IMA AI 知识库总览」是「龙虾部署大师」技能市场中的多模态生成入口技能:它为 IMA Studio 的文生图、图生图、文生视频、图生视频、首尾帧视频、参考图视频、音乐和语音合成提供统一调用入口和模型路由说明,强调必须使用准确的 model_id,通过脚本查询产品列表、创建任务并轮询完成,同时处理模型默认选择、用户偏好记忆、复杂工作流拆解、视觉一致性等问题,适合规范化的多模型调用。
技能效果
做一张夏季饮品促销海报时,它先解读品类、人群和卖点,再给出画面排版方案和文生图提示词。

多模态生成,难点不在生成而在"调对模型"
当一个平台同时提供图像、视频、音乐和语音生成,每类任务下又有多个模型时,真正的麻烦是路由:一个需求该走哪种 task_type、用哪个准确的 model_id,模型别名(Nano Banana、SeeDream、Wan、Kling、Suno 等)和实际 ID 对不上就调用失败;做宣传片这类复合需求,还要先生成参考图、再生成视频和配乐,多步之间的顺序、积分、参数和轮询都要照看;同一角色或产品要出多张图和视频,外观一致性也容易跑偏。
这个技能怎么统一调度多模态生成
它充当 IMA Studio 多模态能力的统一入口和路由层。面对一个需求,它先解析媒体类型与 task_type(图像、视频、音乐还是语音),再按产品列表匹配准确的 model_id 调用生成脚本创建任务,并处理轮询、积分、输入图片和视频参数;遇到模型别名,它负责把别名映射到正确的 ID。对宣传片、MV 这类多媒体工作流,它会拆解步骤、安排好"先参考图、后视频和音乐"的顺序,并维持同一角色或产品在多张图、多段视频间的视觉一致性,同时记录用户显式的模型偏好。
它的价值在于把"选对模型、串好流程、保持一致"这些容易出错的环节标准化,让多模型调用变得规范、可复用。
用前须知
该技能需要 IMA_API_KEY 和 Python 脚本。图像、视频任务会访问 api.imastudio.com、imapi.liveme.com 及相关存储域;建议先使用测试 Key 验证流程。生成质量与所选用的具体模型能力相关。
怎么用它
用法是把要生成的内容、风格和指定模型用自然语言交给它。例如可以这样对它说:
可以这样对它说
- "用 SeeDream 4.5 生成白底产品海报,画面干净,模型能力要匹配。"
- "把这张参考图做成十秒竖屏视频,角色外观保持一致,别换衣服和脸。"
- "给宣传片配一段三十秒轻快 BGM,适合社媒开场,不要人声。"
它适合这些场景:需要用 IMA 生成图片、视频、配乐或语音并选择合适模型;用户指定 Nano Banana、SeeDream、Wan、Kling、Suno 等模型别名;制作宣传片或 MV、需要先生成参考图再生成视频和音乐;以及同一角色或产品要多张图和视频保持外观一致。
注:技能的实际效果与所选用的 AI 模型能力有关,不同模型下的表现可能存在差异。

提示