一张图看懂46个主流大模型架构,9亿像素免费领

你能一眼看出 kimi 2.5 / GLM 5 / Deepseek R1 的架构有哪些区别么?

有人把 46 个主流大模型的架构图画了出来,还拼成了一张全景海报——官方售价 27 美金。我用 50 行 Python 免费复刻了一张 9 亿像素的版本。代码和图片文末免费领取。

下图就是那张官方海报。它在 redbubble 上卖实体版,Medium 版(26.9 in x 23.4 in)大概 27 美金;gumroad 上的电子版也要至少 9 美金。而我的版本?免费,且包含最新模型。

llm-arc-gallery-poster

这是 AI 学者、畅销书作家 Sebastian Raschka 推出的一个神仙项目:《LLM Architecture Gallery》

在这个网页里,老哥用统一、美观、极其清晰的风格,手工重绘了市面上几乎所有主流大模型的架构图。 包括最近比较火的国内模型 Kimi K2.5 / MiniMax 2.5 / Qwen 3.5 / GLM-5,都已经收录在内。

llm-arc-kimi-k2

网页里面可以一对一比对模型架构。比如从这些开放的架构图里,就可以很直观地看到 LLM 从 GPT-2 到最新开源 / 开放权重模型的演进,包括注意力机制、层结构、MoE(Mixture of Experts)、混合架构、KV Cache 等关键设计选择。

不过网页里面只有每个模型单独的架构图。电子版全景拼接图则需要在 gumroad 购买。

但是,既然网站上的架构图本身都是公开的,何不自己做一张?

简单查看网页结构之后,我给 Gemini 描述了想法:

https://sebastianraschka.com/llm-architecture-gallery/#card-kimi-k2-5

我想写一个 Python 脚本,把该页面所有以 /llm-architecture-gallery/images/architectures/*.webp 格式的图片爬取下来,然后把这些图片拼成一个大图。每张图片宽高不太一样,但是差不太多,我想的是按照每排 7 张图放置,拼成一张大图,给出你的方案细节

然后它给了我一个 Python 脚本。脚本几乎不用修改,直接就跑起来了。大概一分钟,成了:下载了 46 张最新的架构图,以及合成了一张超大全景图。

llm-arc-crawler

看看效果:

llm_architectures_grid-small

比较糊是吧,没关系,这是因为拼成的图片很大,29329 x 29910,接近 9 亿像素,46M内存占用。这里只放了一个缩小版。下面是动图缩放展示,可以看出每一个架构图其实都非常清晰。

把这个打印出来,挂墙上比挂明星照片 geek 多了。

以上,爬虫代码和图片我都准备免费放出来,欢迎自取: