这次聊聊 Github 上拥有 33.5k 的 FastChat 项目,它是一个开放平台,用于训练、服务和评估基于大型语言模型的聊天机器人。
它为 Chatbot Arena 提供支持,上面收集了 70+ 的大模型供用户免费使用,并根据用户投票进行排名。
大模型排名地址:https://chat.lmsys.org/?leaderboard
排名 |
模型名称 |
平均分 |
开发者 |
1 |
GPT-4-Turbo-2024-04-09 |
1260 |
OpenAI |
1 |
Claude 3 Opus |
1255 |
Anthropic |
1 |
GPT-4-1106-preview |
1254 |
OpenAI |
2 |
GPT-4-0125-preview |
1250 |
OpenAI |
5 |
Bard (Gemini Pro) |
1209 |
|
5 |
Claude 3 Sonnet |
1203 |
Anthropic |
7 |
Command R+ |
1193 |
Cohere |
7 |
GPT-4-0314 |
1189 |
OpenAI |
9 |
Claude 3 Haiku |
1182 |
Anthropic |
10 |
GPT-4-0613 |
1164 |
OpenAI |
10 |
Mistral-Large-2402 |
1158 |
Mistral |
11 |
Qwen1.5-72B-Chat |
1154 |
Alibaba |
12 |
Claude-1 |
1150 |
Anthropic |
在 Chatbot Arena 上面,我们可以免费使用 Claude-3、ChatGPT4 以及 Gemini Pro 等 30+ 的大模型,并为用户提供了四种对话方式,每种方式都可以持续进行对话。
Chatbot Arena 访问地址:https://chat.lmsys.org/
接下来给大家分别介绍一下这四种方式:
两个大模型 PK
两个大模型 PK,有两个玩儿法:
- 匿名大模型进行 PK :选中页面最顶部的「Arena(battle)」,它会提供两个匿名模型(例如 ChatGPT、Claude、Llama)给用户,用户在使用之后投票给自己喜欢的一个!
比如我们现在进行提问:
可以看到,两个模型会一同进行回答,然后我们根据回答来选择 A is better 或者 B is better,选择之后就会将两个模型的名称告诉我们。
如果对回答的结果不满意,还可以选择「Regenerate」重新生成答案,或者直接重开一把「New Round」。
- 任选两个大模型进行 PK :选中页面顶部的「Arena(side-by-side)」,这个 Tab 下我们可以任选两个大模型进行提问。
而除了 PK 聊天之外,也支持单个模型直接聊天。
单个模型聊天
选中页面顶部的「Direct Chat」就可以和平时使用 ChatGPT 一样,选择单个模型进行对话了。
模型有很多,大家可以自行选择:
解析图片
选中页面顶部的「Vision Direct Chat」,可以进行图片对话,每次对话只能使用一张图像进行聊天。且图片大小要小于 15 MB。
在这个网站上所有的大模型都是免费使用的,所以我们可以尽情使(bai)用(piao)。
感兴趣的小伙伴快去试试吧。