本文为 960字 ,建议阅读 2分钟
今天 hackernews 上最火的网站是这个:https://spreadsheets-are-all-you-need.ai用一个excel 表格来学习 chatgpt 的工作原理,不用写任何代码,配有三个油管视频,非常形象。 最让人震惊的是它用 excel 实现了一个简易的 gpt2,可以下载:不过特别大,有 1.25 个g,大家如果感兴趣可以试试看。 excel 太强大了,干啥都行。
具体来说,这个平台通过在excel里完全实现早年间最先进的gpt-2大型语言模型(也是chatgpt的前辈)的前向传播过程,直观展示现今各类大型语言模型如chatgpt、claude、bard/gemini和llama背后所依赖的transformer架构是如何工作的。
它并非空谈理论,而是实实在在地引导用户通过一系列实用的excel表格实例学习。比如在其中的一个课程里,详尽解析了gpt模型的第一步——字节对编码(byte pair encoding,简称bpe)和分词技术,这是包括chatgpt在内的诸多先进模型都会用到的关键步骤。课程会细致地探讨bpe算法的训练过程及其在语言数据分词中的应用,并通过实际的电子表格模拟来展示gpt-2模型如何进行分词操作,同时也会讨论bpe和其他分词方法各自的局限性和替代方案。
更重要的是,这个项目鼓励实践参与,你可以直接从github仓库下载xlsb格式的excel文件,在mac或pc上的excel应用程序中运行这个完整的gpt-2小型模型(拥有12400万参数,包括字节对编码、嵌入层、多头注意力机制和多层感知机等各个阶段),不过请注意,此版本只支持前向推断而不含训练功能,输入文本上下文长度有限定在10个令牌,且每个单词最多10个字符,输出结果固定
考虑到模拟文件体积庞大,尤其在mac系统上可能会导致excel反应迟钝甚至卡死,强烈推荐在使用时开启excel的手动计算模式,并尽量在windows环境下运行,或者通过parallels在mac上安装windows版本的excel以确保流畅度。
github地址:https://github.com/ianand/spreadsheets-are-all-you-need
结语
“spreadsheets are all you need”这个名字源自著名的《attention is all you need》论文,这篇论文第一次提出了如今chatgpt等生成式ai所采用的transformer架构。虽然你在excel中搭建的模型无法像chatgpt那样进行交互式对话,因为缺乏人类反馈强化学习(rlhf)和专门针对聊天场景的调优,但它确实帮助你通过简单易懂的电子表格界面,逐步揭示了大型语言模型内部运作的神秘面纱。只需一键订阅,即可跟随更多即将上线的课程视频,深度挖掘现代ai的内在细节。从此,打开excel,探索ai的世界,你会发现,原来理解ai真的只需要一张张表格的距离!
⭐星标ai寒武纪,好内容不错过⭐
用你的赞和在看告诉我~
还得是excel
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
notice: the content above (including the pictures and videos if any) is uploaded and posted by a user of netease hao, which is a social media platform and only provides information storage services.