AI闯进设计圈腾讯混元大模型最新技术进展披露

aircraft
2024-05-11 00:00:00 3021

+关注

数字浪潮下的创新革命：人工智能赋能设计领域

在当今数字化时代，人工智能技术的迅猛发展正在颠覆各行各业的传统格局，尤其在设计领域，这种影响尤为显著。不仅为专业设计师提供了前所未有的创新工具，也为普通创作者开启了表达创意的大门。

腾讯混元产品负责人陈妍在近期的分享中，揭示了混元大模型在设计领域的应用亮点及其在腾讯业务场景中的最新技术突破。混元大模型不仅在基础的文本生成文本能力上展现出色，更在文生图、文生视频、文生3D等多模态探索中取得了重要进展。

在文生图领域，腾讯混元大模型展现出了显著的本土化优势。相比国际同类产品，其在理解和呈现中国元素方面表现出更强的能力，无论是广告还是游戏设计，都能更精准地捕捉和再现中国的文化特色。去年十月份，腾讯混元大模型的全面升级，使其中文效果超越了GPT-3.5，代码能力更是提升了20%，达到了业界领先水平。目前，该功能已在创意广告、人像风格化等领域广泛应用，并计划于下周一在北京举行的发布会上，宣布开源文生图能力。

文生视频方面，腾讯混元大模型的性能同样令人瞩目。通过算法优化，其生成视频的能力得到了显著提升，从四秒延长至十六秒，这一过程充满挑战，却也展示了强大的技术创新潜力。此外，腾讯混元大模型还支持图生视频、视频生视频等多种应用，包括将实拍图片转换为卡通、人脸风格化等，实现局部替换和骨骼驱动视频生成，极大地拓展了创意表达的边界。

在文生3D领域，尽管当前应用尚未广泛普及，但腾讯已进行了初步研究，探索了生成模型的可编辑性，即导出至3D编辑工具进行二次调整的可能性。对于3D人物的应用，如伴手礼等热门领域，腾讯正积极寻求创新实践。

随着腾讯混元大模型的参数规模扩大至万亿级，其在实用性和技术创新方面取得了显著成就。目前，已有超过400个业务和场景接入混元大模型进行测试，部分成果已公开发布。

面对人工智能技术的发展，腾讯集团副总裁、腾讯研究院总顾问杨健表示：“这是一次实验性的尝试。我们希望通过将人工智能新技术应用于特定场景，汇聚城市规划、设计专业人士与对AI感兴趣的社会大众，共同探索如何利用这些技术提高设计效率，同时也期待借此机会深化混元大模型的核心能力和理念在实际场景中的应用。”

随着新一轮科技革命的推进，人工智能技术的快速演进为设计领域带来了无限可能。国际建筑师协会副主席、清华大学建筑学院院长张利指出，AI技术不仅为各学科和行业带来了挑战，也在推动高质量城市更新的过程中催生了新的规划范式。虽然AI的具体影响尚待进一步探索，但其带来的创新机遇和可能性不容忽视。腾讯未来城市AI创意设计大赛的启动，正是为了激发公众对科技与设计融合的兴趣，探索AI技术与人类创造力相结合的新方向。