可以运行在手机上的大语言模型还是大语言模型吗 2024 Week 17 回顾

2024-04-27

生活

Contents

本周，微软和苹果分别开源了自己的模型 Phi3 和 OpenELM。这两个模型都不大，在笔记本和手机这样的设备上运行起来也不费力，性能也还可以。

这种模型有了一个新分类：SLM——Small Language Model。

去年这个时候，谈论的还是 GPT-4，谈它的强大，以及难以复制。只过了一年，我们谈的是如何在本机运行一个模型，加上自己的文档来实现 RAG；谈的是如何使用多个 Agents 来解决复杂问题，谈的是如何在手机上运行一个小模型。

这种狂飙猛进，让人有些害怕。

不知道这会不会是一波新的泡沫；显然，现在涌向 AI 领域的资金、算力、数据已经疯狂；而能够真正有帮助的产品，似乎并不多。

也许在 AI 还没能学会自我学习自我迭代之前，这个领域还是在疯狂的摸索中。近两年会有大量大语言模型公司失败，而他们积累的知识和能力，可能会促进下一个时代的 AI 发展。

通用人工智能也许会在几年内实现；若是不然，那将会带来下一个人工智能寒冬。

我不知道哪种未来更好。一种可能意味着人类这个物种的悲壮落幕；另一种则可能意味着人类的悄无声息消失。

robots

本文由 ChatGPT 和 Github Copilot 协助完成。未标明出处的配图由 DALL·E 3 生成。

本周的成果

比较轻松地完成了日常工作
看了几集剧集
看了一点书

本周的改变

作息好了一点
稍微加了一点日常运动

做得还不错

稍微有了点运动
早起看书感觉不错

做得不太好

运动不够
能早起的天数不多

下周的目标

继续改善作息
参与暂停实验室的产品《有效努力》

Author 猛犸

LastMod 2024-04-27

License CC BY-NC-ND 4.0