“通过揭开 Transformer 背后的所有数学原理,了解 Transformer 的工作原理” – Hugging Face 的 Omar Sanseviero 使用 Python 和 numpy 从头开始精心实现了 LLM 背后的 Transformer 架构。这里有很多东西需要了解,但都解释得非常清楚。
通过黑客新闻
原文: https://simonwillison.net/2024/Jan/10/the-random-transformer/#atom-everything
翻译英文优质信息和名人推特
“通过揭开 Transformer 背后的所有数学原理,了解 Transformer 的工作原理” – Hugging Face 的 Omar Sanseviero 使用 Python 和 numpy 从头开始精心实现了 LLM 背后的 Transformer 架构。这里有很多东西需要了解,但都解释得非常清楚。
通过黑客新闻
原文: https://simonwillison.net/2024/Jan/10/the-random-transformer/#atom-everything