腾讯混元 DiT 文生图大模型开源 6G 小显存版，一同开源打标模型

IT之家 7 月 4 日消息，腾讯混元文生图大模型（混元 DiT）今日宣布开源小显存版本，仅需 6G 显存即可运行，对使用个人电脑本地部署的开发者比较友好。

此外，腾讯宣布混元文生图打标模型“混元 Captioner”正式对外开源。该模型支持中英文双语，针对文生图场景进行专门优化，可帮助开发者快速制作文生图数据集。

腾讯混元 DiT 模型升级

腾讯混元 DiT 模型宣布了三大更新：推出小显存版本与 Kohya 训练界面，并升级至 1.2 版本，进一步降低使用门槛的同时提升图片质量。

基于 DiT 架构的文生图模型生成图片质感更佳，但对显存的要求却非常高，混元 DiT 因此推出小显存版本，最低 6G 显存即可运行优化推理框架，对使用个人电脑本地部署的开发者比较友好。

经过与 Hugging Face 合作，小显存版本、LoRA 与 ControlNet 插件，都已经适配到 Diffusers 库中。开发者无需下载原始代码，仅用三行代码仅可调用，简化了使用成本。

同时，混元 DiT 宣布接入 Kohya，让开发者可以低门槛地训练专属 LoRA 模型。

Kohya 是一个开源的、轻量化模型微调训练服务，提供了图形化的用户界面，被广泛用于扩散模型类文生图模型的训练。

用户可以通过图形化界面，完成模型的全参精调及 LoRA 训练，无需涉及到代码层面的细节。训练好的模型符合 Kohya 生态架构，可以低成本与 WebUI 等推理界面结合，实现一整套“训练-生图”工作流。

混元 Captioner

在提升模型易用性的同时，腾讯混元团队最新开源了打标模型 —— 混元 Captioner。

借助打标模型，开发者可以快速生成数据集。具体来说，文生图开发者将原始图片集导入混元 Captioner，后者将生成标注；也可以导入图片与原始描述，利用混元 Captioner 过滤其中的无关信息，并完善和优化图片描述，以提高数据质量。

目前，业界对于图片描述文本的生成，主要使用通用多模态 Captioner 模型，存在描述过于简单或繁琐（与画面描述的无关信息过多）、缺少背景知识导致无法识别知名人物和地标等问题，并且许多模型并非中文原生，中文描述不够精准。

▲ 混元 Captioner 对图片描述进行结构化与准确度提升混元

Captioner 模型号称针对文生图场景专门进行优化：

构建了结构化的图片描述体系；
在模型层面，通过注入人工标注、模型输出、公开数据等多种来源提升 Caption 描述的完整性；
注入知名文学作品形象、地标、食物、动物、中国元素与知识等背景知识。

▲ Capiton 模型的背景知识更好，能够识别宫保鸡丁

▲ Captioner 模型结构化图片描述体系

IT之家附腾讯混元开源文生图大模型相关链接：

官网：https://dit.hunyuan.tencent.com/
代码：https://github.com/Tencent/HunyuanDiT
模型：https://huggingface.co/Tencent-Hunyuan/HunyuanDiT
论文：https://tencent.github.io/HunyuanDiT/asset/Hunyuan_DiT_Tech_Report_05140553.pdf

友情提示

本站部分转载文章，皆来自互联网，仅供参考及分享，并不用于任何商业用途；版权归原作者所有，如涉及作品内容、版权和其他问题，请与本网联系，我们将在第一时间删除内容！

联系邮箱：1042463605@qq.com

腾讯混元 DiT 文生图大模型开源 6G 小显存版，一同开源打标模型

友情提示

美光翻大车：英伟达RTX 4070显卡被迫采用GDDR6显存

灵超怼饭？孟美岐周传雄？单依纯王子奇？赵今麦张凌赫？欧阳妮妮

哇塞，腾讯、优酷、芒果都呈上“王炸剧”，到底谁能拔得头筹

腾讯怒喷华为鸿蒙系统不稳定，微信适配堪比重做！

腾讯又出“王炸”剧！才播19集全国收视率第三，演员演技惊艳四座

男子被路虎车撞飞后，司机下车疯狂追赶男子！冲动是魔鬼！

大妈骑三轮撞上路边停车不规范的小车下一秒直接倒车后逃逸！

十三届全国政协教科卫体委员会副主任刘慧被查

小女孩斑马线被车撞倒，后续是。。。#孩子安全#斑马线

蒋欣为什么把关晓彤的手拿下来？真的是手上都戒指被人看到吗？

游客在五台山，喂牛吃牛肉干，用登山杖捅牛屁股，牛反击踩踏

石破茂真的只剩下台一条路可走了吗

泽连斯基为何对乌反腐局出手

祖坟冒青烟了！安徽阜阳，一男生高考之后感觉自己考得不好，去兼职送外卖，不料就在送餐途中，他收到班主任发来的消息，得知是被中国人民解放军空军航空大学录取，他说当时

陈若琳估计后槽牙都咬碎了，原本以为，全红婵偶尔划划船也就算了，可万万没料到，她竟然变胖了！ 7月17日，全红婵戴着草帽划船的视频，突然在网上爆火，比起全妹划船时

大快人心日本突然宣布了！7月22号，日本内阁官房长官林芳正突然放话，说要推动跨党派讨论价格措施。这消息听着是好事？可日本老百姓的钱包早被物价狂飙掏空啦！鸡蛋、面

快讯！快讯！印度突然宣布！ 2025年7月22日，印度宣布继续对中国苯胺产品实施为期5年的反倾销税，这是该国第三次延长该关税政策，此举导致中国化工企业对印出口

腾讯混元 DiT 文生图大模型开源 6G 小显存版，一同开源打标模型

友情提示

美光翻大车：英伟达RTX 4070显卡被迫采用GDDR6显存

灵超怼饭？孟美岐周传雄？单依纯王子奇？赵今麦张凌赫？欧阳妮妮

哇塞，腾讯、优酷、芒果都呈上“王炸剧”，到底谁能拔得头筹

腾讯怒喷华为鸿蒙系统不稳定，微信适配堪比重做！

腾讯又出“王炸”剧！才播19集全国收视率第三，演员演技惊艳四座

男子被路虎车撞飞后，司机下车疯狂追赶男子！冲动是魔鬼！

大妈骑三轮撞上路边停车不规范的小车下一秒直接倒车后逃逸！

十三届全国政协教科卫体委员会副主任刘慧被查

小女孩斑马线被车撞倒，后续是。。。#孩子安全#斑马线

蒋欣为什么把关晓彤的手拿下来？真的是手上都戒指被人看到吗？

游客在五台山，喂牛吃牛肉干，用登山杖捅牛屁股，牛反击踩踏

石破茂真的只剩下台一条路可走了吗

泽连斯基为何对乌反腐局出手

祖坟冒青烟了！安徽阜阳，一男生高考之后感觉自己考得不好，去兼职送外卖，不料就在送餐途中，他收到班主任发来的消息，得知是被中国人民解放军空军航空大学录取，他说当时

陈若琳估计后槽牙都咬碎了，原本以为，全红婵偶尔划划船也就算了，可万万没料到，她竟然变胖了！ 7月17日，全红婵戴着草帽划船的视频，突然在网上爆火，比起全妹划船时

大快人心日本突然宣布了！7月22号，日本内阁官房长官林芳正突然放话，说要推动跨党派讨论价格措施。这消息听着是好事？可日本老百姓的钱包早被物价狂飙掏空啦！鸡蛋、面

快讯！快讯！ 印度突然宣布！ 2025年7月22日，印度宣布继续对中国苯胺产品实施为期5年的反倾销税，这是该国第三次延长该关税政策，此举导致中国化工企业对印出口

快讯！快讯！印度突然宣布！ 2025年7月22日，印度宣布继续对中国苯胺产品实施为期5年的反倾销税，这是该国第三次延长该关税政策，此举导致中国化工企业对印出口