欢迎访问:图像编辑进入“思考”时代:腾讯发布混元图像 3.0 图生图模型_新鲜科技_品牌资讯_感知生活GANZH.COM
  • 微信客服微信客服
  • 微信公众号微信公众号

图像编辑进入“思考”时代:腾讯发布混元图像 3.0 图生图模型

收藏  分享
网友发布网友发布0

图像编辑进入“思考”时代:腾讯发布混元图像 3.0 图生图模型

腾讯混元正式发布混元图像3.0图生图(HunyuanImage3.0-Instruct)模型。该模型目前已在腾讯旗下的 AI 助手“元宝”全端及腾讯混元官网同步上线,标志着腾讯在原生多模态图像处理领域取得新突破。

混元图像3.0图生图采用主流的混合专家(MoE)架构,总参数量达80B(激活参数约13B)。不同于传统的滤镜式修图,它被定义为一款“会思考”的图像编辑模型。在接收到用户的提示词和图片后,模型会先深度理解图像内容,随后自主推理出需要修改的区域和步骤,并精准保留无需变动的图像细节,从而实现更具逻辑感的输出效果。

在功能层面,该模型展现了极高的灵活性。它不仅支持基础的元素增删、风格变换及老照片修复,还具备强大的多图融合能力,能将多张照片中的人物或元素提取并合成。对于普通用户而言,这意味着可以直接在元宝上快速制作个性化表情包、虚拟合拍,甚至完成专业的电商海报设计和游戏角色定制。

为了打磨这一模型,混元团队构建了千万量级的图生图数据集,覆盖超过80个细分任务。通过引入思维链训练和自研的 MixGRPO 算法,模型在指令响应速度和图像一致性上均有显著提升。无论是在情绪表现力还是生成真实感上,混元图像3.0图生图都为 AI 图像创作提供了更专业、更易用的工具选择。

划重点:

标签: 区域 情绪 理解
更多>最新的资讯