可以运行在手机上的大语言模型还是大语言模型吗 2024 Week 17 回顾
Contents
本周,微软和苹果分别开源了自己的模型 Phi3 和 OpenELM。这两个模型都不大,在笔记本和手机这样的设备上运行起来也不费力,性能也还可以。
这种模型有了一个新分类:SLM——Small Language Model。
去年这个时候,谈论的还是 GPT-4,谈它的强大,以及难以复制。只过了一年,我们谈的是如何在本机运行一个模型,加上自己的文档来实现 RAG;谈的是如何使用多个 Agents 来解决复杂问题,谈的是如何在手机上运行一个小模型。
这种狂飙猛进,让人有些害怕。
不知道这会不会是一波新的泡沫;显然,现在涌向 AI 领域的资金、算力、数据已经疯狂;而能够真正有帮助的产品,似乎并不多。
也许在 AI 还没能学会自我学习自我迭代之前,这个领域还是在疯狂的摸索中。近两年会有大量大语言模型公司失败,而他们积累的知识和能力,可能会促进下一个时代的 AI 发展。
通用人工智能也许会在几年内实现;若是不然,那将会带来下一个人工智能寒冬。
我不知道哪种未来更好。一种可能意味着人类这个物种的悲壮落幕;另一种则可能意味着人类的悄无声息消失。
本文由 ChatGPT 和 Github Copilot 协助完成。未标明出处的配图由 DALL·E 3 生成。
本周的成果
- 比较轻松地完成了日常工作
- 看了几集剧集
- 看了一点书
本周的改变
- 作息好了一点
- 稍微加了一点日常运动
做得还不错
- 稍微有了点运动
- 早起看书感觉不错
做得不太好
- 运动不够
- 能早起的天数不多
下周的目标
- 继续改善作息
- 参与暂停实验室的产品《有效努力》