GLM-Image Blog Articles

Explore comprehensive guides, tutorials, and insights about GLM-Image's capabilities, from text rendering to knowledge-intensive generation.

2026年2月23日 18 分钟阅读

ACE-Step 1.5:新一代开源多模态大模型突破

ACE-Step 1.5 完整指南:开源多模态模型,320亿参数,Qwen2.5-32B 主干网络,ViT-H/14 视觉编码器。了解性能基准、硬件要求和实际应用。

多模态大模型 视觉语言 开源
阅读完整文章
2026年2月22日 25 分钟阅读

KANI-TTS-2:下一代开源文本转语音模型

KANI-TTS-2 完整指南:开源文本转语音模型。了解 12 种语言支持、60+ 音色、语音克隆、硬件要求和实际应用场景。

文本转语音 语音克隆 开源
阅读完整文章
2026年2月21日 20 分钟阅读

MOSS-TTS:下一代开源文本转语音模型

MOSS-TTS 完整指南:开源文本转语音模型。了解多语言支持、语音克隆、硬件要求和实际应用场景。

文本转语音 语音克隆 开源
阅读完整文章
2026年2月20日 20 分钟阅读

FireRed-Image-Edit-1.0:高保真图像编辑模型

FireRed-Image-Edit-1.0 完整指南:火红团队推出的专用图像编辑模型。了解高保真编辑、图像修复、增强和实际应用。

图像编辑 高保真 AI模型
阅读完整文章
2026年2月19日 12 分钟阅读

GLM-5:智谱AI最新开源语言模型系列

GLM-5 完整指南:90亿参数支持128K上下文,包含多种变体、性能基准测试和部署选项。

语言模型 开源 128K上下文
阅读完整文章
2026年2月19日 35 分钟阅读

Qwen3.5-397B-A17B:目前最强大的开源权重语言模型

Qwen3.5-397B-A17B 完整指南:397B 总参数量,17B 每次前向传播激活。MoE 架构、业界领先的推理和编码能力。

语言模型 MoE 架构 开源权重
阅读完整文章
2026年1月30日 20 分钟阅读

Qwen3-ASR-1.7B:革命性多语言语音识别模型

阿里巴巴 Qwen3-ASR-1.7B 自动语音识别模型完整指南。了解 52 种语言支持、最先进的准确度、硬件要求和实际应用场景。

语音识别 ASR 模型 多语言
阅读完整文章
2026年1月23日 25 分钟阅读

Qwen3-TTS:2026年开源文本转语音革命

探索 Qwen3-TTS,一款基于 500 万小时语音数据训练的开源文本转语音模型,支持 10 种语言、49 种音色和 3 秒语音克隆功能。

文本转语音 语音克隆 Qwen AI
阅读全文
2026年1月23日 20 分钟阅读

微软 VibeVoice-ASR:革命性语音识别模型

探索微软的 VibeVoice-ASR,一款先进的语音识别模型,可一次性处理 60 分钟音频,集成说话人分离和时间戳功能。

语音识别 ASR 微软
阅读全文
2026年1月20日 18 分钟阅读

AgentCPM-Explore:首个开源4B参数智能体模型

探索 AgentCPM-Explore,首个在8个基准测试中排名的开源4B参数智能体模型。了解其深度探索能力和端侧部署优势。

AI智能体 4B模型 端侧AI
阅读全文
2026年1月15日 15 分钟阅读

FLUX 2 Klein:最快的 AI 图像生成模型

探索 FLUX 2 Klein 的 9B 和 4B 参数模型,亚秒级推理时间,仅需 13GB 显存。消费级硬件上的专业级 AI 图像生成。

FLUX 2 Klein AI 模型 性能
阅读全文
Jan 14, 2026 12 min read

Mastering Text Rendering with GLM-Image: A Complete Guide

Learn how GLM-Image achieves exceptional text rendering accuracy with the Glyph-byT5 encoder. Discover best practices for creating images with precise text integration in multiple languages, especially Chinese characters.

Text Rendering Tutorial Glyph-byT5
Read Full Article
Jan 14, 2026 15 min read

Knowledge-Intensive Image Generation with GLM-Image

Discover how GLM-Image excels at complex instruction following and factual accuracy. Perfect for creating educational content, technical diagrams, and images requiring intricate information representation.

Knowledge-Intensive Use Cases Educational
Read Full Article
Jan 14, 2026 14 min read

Advanced Image Editing Techniques with GLM-Image

Explore GLM-Image's block-causal attention mechanism for precise image editing. Learn techniques for style transfer, identity preservation, and multi-subject consistency in your creative projects.

Image Editing Style Transfer Advanced
Read Full Article