OpenAI反超Claude3，GPT4.5-Turbo正式版发布，AI王座再次易主

曾确令 • 2024年4月14日 pm7:58 • Blog, 令爷收藏 • 阅读 99

OpenAI反超Claude3，GPT4.5-Turbo正式版发布，AI王座再次易主

夕小瑶AI精选

没想到，仅仅过了两个月，全球最强AI的宝座又易主了！

几个月前，Claude3 Opus全面超越GPT-4，全球的网友纷纷抛弃GPT，投向Claude3的怀抱，并纷纷分享Claude3带来的惊艳体验。

如今，OpenAI再次用实力证明了，GPT依然是AI世界最强的玩家！在最新的AI基准测试中，OpenAI几天前刚刚发布的GPT-4-Turbo-2024-04-09版本，大幅超越了Claude3 Opus，重新夺回了全球第一的AI王座：

Tableau免费了

值得一提的是，这个版本不是一个普通的测试版本，而是作为一个正式版本GPT-4-Turbo发布的。

这也是GPT-4-Turbo系列首次发布正式版，足以看出这个版本的份量。网友甚至纷纷直接将其改名为GPT-4.5-Turbo了。

笔者第一时间通过国内最稳、更新最快的AI镜像站AskManyAI进行了GPT-4.5-Turbo体验。

Tableau免费了

附AskManyAI地址（GPT-4、Claude3、Gemini都是最新版本）：

https://askmanyai.cn

值得一提的是，AskManyAI的有个独特的AI混战模式，你的一个问题，可以指定多个最强的AI同时给你回答，简直就是做大模型测试的理想环境：

Tableau免费了

好了，话不多说，我们这就开始测评了！

最新版GPT-4.5-Turbo 大战 Claude 3 Opus

代码能力测试

首先我们来看看代码debug方面的表现：

Tableau免费了

Tableau免费了

Tableau免费了

这是一个很隐蔽的bug，Claude 3 Opus完全没找到bug在哪，其实这个bug，以前的GPT-4也找不到。但是刚刚更新的这个GPT-4.5-Turbo竟然找到了bug！

而且给到了非常正确的修复bug后的代码！

简直惊呆我了，这是第一个能修复这个bug的AI。

附AskManyAI地址（以上案例可在AskManyAI直接复现）：

https://askmanyai.cn

科研学术能力测试

然后我们来看看专业学术问题的表现。

我们这次加大难度，上传一个生物样品图片给AI：

Tableau免费了

然后我们在AskManyAI网站同时选中Claude、GPT和Gemini这三个地表最强的多模态AI，看他们对这个图片分析的结果：

Tableau免费了

结果发现，最新版的GPT-4在图片问答方面还是不如Claude-3 Opus。这方面的能力排序是 Claude-3 > Gemini Pro > GPT-4。

附AskManyAI地址（以上案例可在AskManyAI直接复现）：

https://askmanyai.cn

我们再换一个专业问题：

Tableau免费了

Tableau免费了

Tableau免费了

Tableau免费了

关于Sora技术原理的解释，所有的AI中，只有最新的GPT-4没有出现知识性的错误，Kimi和Gemini的错误是最离谱的，竟然说Sora是GAN的架构。。。而Claude-3的视频片段选择这个地方的讲解出现了错误——Sora是生成式的，不是检索式的。

我猜测这可能是因为只有GPT-4的知识库已经更新到了2024年的4月份。而Sora是2月份刚发布的，所以只有GPT-4学到了这方面的知识。

最新版GPT-4完胜！

附AskManyAI地址（以上案例可在AskManyAI直接复现）：

https://askmanyai.cn

营销能力测试

这次测试加大难度，直接丢给AI一个产品文档PDF，让他去生成一篇营销文案和搜索SEO的标题。

Tableau免费了

同样，这次GPT-4完胜！

AI写作能力测试

最后测试下AI写作能力！

Tableau免费了

Tableau免费了

Tableau免费了

Tableau免费了

Tableau免费了

Tableau免费了

Tableau免费了

写作的测试结果就要见仁见智了，每个人的看法都可能不一样。

这里面我最喜欢的是GPT-4和Claude-3写的文章，但Gemini Pro的写作速度非常快，不到5秒就写完了全篇。而GPT-4和Claude-3则写了一分钟不止。

附AskManyAI地址（以上案例可在AskManyAI直接复现）：

https://askmanyai.cn

好了，今天的评测就到这里了。你们更喜欢哪个AI呢？

原创文章，作者：曾确令，如若转载，请注明出处：https://www.zengqueling.com/ofccgtzsbfbawzzcyz/

chatgpt Claude OpenAI

赞 (0)

微信扫一扫

微信扫一扫

Facefusion是一款最新的开源AI视频/图片换脸项目

« 上一篇 2024年3月13日 am10:40

普通人也能理解的 Transformer

下一篇 » 2024年4月16日 pm12:06

联系我们

15602395067

在线咨询：

邮件：eden7@qq.com

工作时间：周一至周五，9:30-18:30，节假日休息

QR code