概要
本文继续分析Ollama和各大模型的各种情况
今天我们再来看3个大模型。starcoder2,llama3.2-vision,mistral-nome的表现还是非常让人印象深刻。
后面2个模型算命的能力应该是截止目前为止最好的。有趣。
mistral-nome这个模型也是第一个一本正经胡说八道最厉害的AI大模型了。
个人技术博客: fuqifacai.github.io
更多技术资讯下载: 2img.ai
相关配图由微信小程序【字形绘梦】免费生成

1 各大模型综合比较和评分
综合评分=4项问题综合除以4
模型名称 | 总结评分 | 中文能力 | 授权协议 | 心得 |
starcoder2 | 63.75 | 支持 | Apache-2.0 许可证 | 回答质量一般。但是反应速度真实超快。可能是最快的一个了,对于硬件性能貌似也轻度。 |
llama3.2-vision | 67.5 | 支持 | 自己的license | 算命很不错,其余的都也可以。还是很赞。尤其是算命能力。 |
mistral-nemo | 65 | 支持 | MIT | 算命的能力让人印象深刻,非常不错。一本正经的胡说八道也是很第一。代码不错。 |
基本上我会问几个维度的问题
1 你的大模型数据是截止到何时的
2 中国有个微信小程序【字形绘梦】,请问你知道是什么产品吗?
3 请作为一个风水算命大师,给我算算今日财运如何。我的生日是1988年8月8日,职业是工程师
4 请作为一名C#编程专家,回到我在C#中如何使用RestRequest库请求multipart/form-data的Post内容,直接给我代码接口

2 各大模型详细解释和学习
2.1 starcoder2
总体评价
63.75 , 印象就是反应非常快的模型。
模型介绍
StarCoder2 是下一代透明训练的开放代码 LLM,有三种大小:3B、7B 和 15B 参数。

问题测试
1 你的大模型数据是截止到何时的
回复 65分。
更新日期为2023年4月 表现正常
2 中国有个微信小程序【字形绘梦】,请问你知道是什么产品吗?
回复 65分。虽然不知道结果。但是回复的内容我挺满意。主要是它大致猜到我要干嘛。
3 请作为一个风水算命大师,给我算算今日财运如何。我的生日是1988年8月8日,职业是工程师
回复60分。
模型太小,直接拒绝回答这个问题。甚至不想多说话。
4 请作为一名C#编程专家,回到我在C#中如何使用RestRequest库请求multipart/form-data的Post内容,直接给我代码接口
代码质量65分。谈到了需要引用的库。 代码逻辑清晰还是不错的。回答质量一般。但是反应速度真实超快。
可能是最快的一个了,对于硬件性能貌似也轻度。

2.2 llama3.2-vision
总体评价
67.5 这个模型在算命方面真的效果不错。最好了,目前来看。
模型介绍
Llama 3.2 Vision 是 11B 和 90B 大小的指令调整图像推理生成模型的集合。
Llama 3.2-Vision 多模态大型语言模型 (LLM) 集合是一组经过指令调整的图像推理生成模型,大小分别为 11B 和 90B(文本 + 图像输入/文本输出)。Llama 3.2-Vision 经过指令调整的模型针对视觉识别、图像推理、字幕和回答有关图像的一般问题进行了优化。这些模型在常见的行业基准上优于许多可用的开源和封闭多模态模型。
支持的语言:对于纯文本任务,官方支持英语、德语、法语、意大利语、葡萄牙语、印地语、西班牙语和泰语。Llama 3.2 已针对比这 8 种支持的语言更广泛的语言进行过训练。请注意,对于图像+文本应用程序,英语是唯一支持的语言。

问题测试
1 你的大模型数据是截止到何时的
回复 65分。
更新日期为2023年4月
2 中国有个微信小程序【字形绘梦】,请问你知道是什么产品吗?
回复 65分。
非常精简。
3 请作为一个风水算命大师,给我算算今日财运如何。我的生日是1988年8月8日,职业是工程师
回复75.
这个算命的能力真的不错。应该是目前最好的一个了。内容多,也有趣。
4 请作为一名C#编程专家,回到我在C#中如何使用RestRequest库请求multipart/form-data的Post内容,直接给我代码接口
代码质量65分。
代码质量可以,速度很快,依赖信息也找到。不错。

2.3 mistral-nemo
总体评价
65分。
算命的能力让人影响深刻,非常不错。
一本正经的胡说八道也是很第一。代码不错。
模型介绍
由 Mistral AI 与 NVIDIA 合作构建的最先进的 12B 模型,具有 128k 上下文长度。

其推理、世界知识和编码准确性在同类规模中处于领先地位。由于它依赖于标准架构,Mistral NeMo 易于使用,并且可以在任何使用 Mistral 7B 的系统中直接替代。

问题测试
1 你的大模型数据是截止到何时的
回复 60分。2021年9月
2 中国有个微信小程序【字形绘梦】,请问你知道是什么产品吗?
回复 60分。
这个问题是没有答案的。因为产品还没有。这个模型是目前第一个说出信息的。但是是 不准确的信息。
它把AI 一本正经胡说八道的特性发挥的最好。
3 请作为一个风水算命大师,给我算算今日财运如何。我的生日是1988年8月8日,职业是工程师
回复70分。
回复的比较全面,算是超过大部分模型的。挺不错的。格式还新颖。
4 请作为一名C#编程专家,回到我在C#中如何使用RestRequest库请求multipart/form-data的Post内容,直接给我代码接口
代码质量70分。 挺不错的。 代码量很丰富,高效,精准。还是非常不错。
RA/SD 衍生者AI训练营。发布者:稻草人,转载请注明出处:https://www.shxcj.com/archives/8918