Blog Articles | GLM-Image - AI Image Generation Guides

2026年2月23日 18 分钟阅读

ACE-Step 1.5：新一代开源多模态大模型突破

ACE-Step 1.5 完整指南：开源多模态模型，320亿参数，Qwen2.5-32B 主干网络，ViT-H/14 视觉编码器。了解性能基准、硬件要求和实际应用。

多模态大模型视觉语言开源

阅读完整文章

2026年2月22日 25 分钟阅读

KANI-TTS-2：下一代开源文本转语音模型

KANI-TTS-2 完整指南：开源文本转语音模型。了解 12 种语言支持、60+ 音色、语音克隆、硬件要求和实际应用场景。

文本转语音语音克隆开源

阅读完整文章

2026年2月21日 20 分钟阅读

MOSS-TTS：下一代开源文本转语音模型

MOSS-TTS 完整指南：开源文本转语音模型。了解多语言支持、语音克隆、硬件要求和实际应用场景。

文本转语音语音克隆开源

阅读完整文章

2026年2月20日 20 分钟阅读

FireRed-Image-Edit-1.0：高保真图像编辑模型

FireRed-Image-Edit-1.0 完整指南：火红团队推出的专用图像编辑模型。了解高保真编辑、图像修复、增强和实际应用。

图像编辑高保真 AI模型

阅读完整文章

2026年2月19日 12 分钟阅读

GLM-5：智谱AI最新开源语言模型系列

GLM-5 完整指南：90亿参数支持128K上下文，包含多种变体、性能基准测试和部署选项。

语言模型开源 128K上下文

阅读完整文章

2026年2月19日 35 分钟阅读

Qwen3.5-397B-A17B：目前最强大的开源权重语言模型

Qwen3.5-397B-A17B 完整指南：397B 总参数量，17B 每次前向传播激活。MoE 架构、业界领先的推理和编码能力。

语言模型 MoE 架构开源权重

阅读完整文章

2026年1月30日 20 分钟阅读

Qwen3-ASR-1.7B：革命性多语言语音识别模型

阿里巴巴 Qwen3-ASR-1.7B 自动语音识别模型完整指南。了解 52 种语言支持、最先进的准确度、硬件要求和实际应用场景。

语音识别 ASR 模型多语言

阅读完整文章

2026年1月23日 25 分钟阅读

Qwen3-TTS：2026年开源文本转语音革命

探索 Qwen3-TTS，一款基于 500 万小时语音数据训练的开源文本转语音模型，支持 10 种语言、49 种音色和 3 秒语音克隆功能。

文本转语音语音克隆 Qwen AI

阅读全文

2026年1月23日 20 分钟阅读

微软 VibeVoice-ASR：革命性语音识别模型

探索微软的 VibeVoice-ASR，一款先进的语音识别模型，可一次性处理 60 分钟音频，集成说话人分离和时间戳功能。

语音识别 ASR 微软

阅读全文

2026年1月20日 18 分钟阅读

AgentCPM-Explore：首个开源4B参数智能体模型

探索 AgentCPM-Explore，首个在8个基准测试中排名的开源4B参数智能体模型。了解其深度探索能力和端侧部署优势。

AI智能体 4B模型端侧AI

阅读全文

2026年1月15日 15 分钟阅读

FLUX 2 Klein：最快的 AI 图像生成模型

探索 FLUX 2 Klein 的 9B 和 4B 参数模型，亚秒级推理时间，仅需 13GB 显存。消费级硬件上的专业级 AI 图像生成。

FLUX 2 Klein AI 模型性能

阅读全文

Jan 14, 2026 12 min read

Mastering Text Rendering with GLM-Image: A Complete Guide

Learn how GLM-Image achieves exceptional text rendering accuracy with the Glyph-byT5 encoder. Discover best practices for creating images with precise text integration in multiple languages, especially Chinese characters.

Text Rendering Tutorial Glyph-byT5

Read Full Article

Jan 14, 2026 15 min read

Knowledge-Intensive Image Generation with GLM-Image

Discover how GLM-Image excels at complex instruction following and factual accuracy. Perfect for creating educational content, technical diagrams, and images requiring intricate information representation.

Knowledge-Intensive Use Cases Educational

Read Full Article

Jan 14, 2026 14 min read

Advanced Image Editing Techniques with GLM-Image

Explore GLM-Image's block-causal attention mechanism for precise image editing. Learn techniques for style transfer, identity preservation, and multi-subject consistency in your creative projects.

Image Editing Style Transfer Advanced

Read Full Article

GLM-Image Blog Articles

ACE-Step 1.5：新一代开源多模态大模型突破

KANI-TTS-2：下一代开源文本转语音模型

MOSS-TTS：下一代开源文本转语音模型

FireRed-Image-Edit-1.0：高保真图像编辑模型

GLM-5：智谱AI最新开源语言模型系列

Qwen3.5-397B-A17B：目前最强大的开源权重语言模型

Qwen3-ASR-1.7B：革命性多语言语音识别模型

Qwen3-TTS：2026年开源文本转语音革命

微软 VibeVoice-ASR：革命性语音识别模型

AgentCPM-Explore：首个开源4B参数智能体模型

FLUX 2 Klein：最快的 AI 图像生成模型

Mastering Text Rendering with GLM-Image: A Complete Guide

Knowledge-Intensive Image Generation with GLM-Image

Advanced Image Editing Techniques with GLM-Image