2025年11月17日,今天安装马斯克的大模型grok一代。
努力了这么久,终于可以安装大模型了,还是很高兴的。
在github上,马斯克共享了他的大模型grok。源代码大概1兆,有7个文件,还有就是模型本体大概980G。
先下了主程序,首先得把主程序跑起来。
用的是微软的visual studio 2026 社区版。
主要是他的python 插件安装比较容易。
下载了源程序,解压,然后用 visual studio 建立新的python 项目,然后添加所有文件。
跑了一下,报错,需要安装文件包。
打开model文件,里面有两个包表了错误提示。
然后复制了问豆包,按照要求安装。
然后运行,还是报错,看不懂,复制粘贴,又问豆包。
说是要8个cpu,不过提示那段代码里修改,主要是run文件和model两个文件里的参数。
修改成一个cpu运行。
系统跑起来了,但持续停留在加载模型文件那里。
然后复制提示,豆包说要下载模型。
github上没有。于是用搜索引擎搜,grok1 模型文件。
找到了一些网址,有一个是有下载的,不过是bt 的。
于是打开百度网盘,希望能同步进入,结果失败,但提示可以下载到电脑,298G,确实够大。一共大概970个文件,每个1.5G。查了一下,说是为了保证不超最大文件限制,还有就是可以分片加载。
下载估计得几个小时。
大模型的控制程序用的不是tensorflow的包,是一个没见过的haiku和jax ,哈哈,没学过。
我的机器配置不高,I7 cpu,16G内存,rtx2070显卡。是否很多年前买的笔记本。
模型代码跑起来用了2G内存。也就是visual studio 占用的内存,其他的都是一些别的,总共用掉10G,cpu的占用不高,大概百分之五十。
主要是因为没有加载模型数据。
干了一天,还是很有收获的。
以前用人家的傻瓜式安装小模型,看不见源代码,这次自己搭一个还是很有成就感的。
最近在哔哩哔哩上看tensorflow的课程,一步一步跟着打代码。
不懂得还要求助豆包AI解答。
很多时候程序报错都是全复制,粘贴到豆包,豆包会给出很多的解释以及解决方案。
实在不行,整个代码复制进去,豆包会告诉我哪里有问题,然后给出正确的代码。
有了人工智能,编程方便很多。
有时候会把所有代码复制给豆包,然后让他把注释写在每一行的前面,这样即使看不懂,也可以参考注释。
前两天小孩说喜欢佩奇,也就是动画片的人物小猪佩奇。
我对大宝说,爸爸让佩奇在屏幕里飞怎么样,哈哈。
于是去网上搜了几个佩奇照片,大宝选了一个,我对豆包说,写一个图片在屏幕上飞的python 程序。
豆包1分钟就写完了,然后我改了图片的名字,一运行,图片就在电脑屏幕上乱飞,孩子还是觉得挺有趣的,哈哈
请大家记得我们的网站:侠客书屋(m.xiakeshuwu.com)职场小聪明更新速度全网最快。