咖啡店里,隔壁的程序员正抱怨自己的IDE卡顿,我顺势聊起了最近的AI编程赛道。有人提到马斯克刚刚在X上抛出一句“六月”,暗指Grok要在代码生成上把Claude甩到身后。于是我们不约而同地把话题拧到“Grok能在六月超越Claude吗”。
自从Grok 4.2测试版上线,官方就把焦点放在“多模态对话”和“实时事实核查”。在X的社交流里,你能看到它几秒钟内把一条新闻的来源列出来,甚至把代码片段的运行结果直接贴上截图。马斯克在一次AMA里透露,团队正把这套快速检索能力搬进编程模式,计划在六月推出专门的“代码助理”。如果真能把搜索速度和代码补全结合,开发者的调试时间可能从几个小时压到几分钟。
Claude 3.5在最近的编程基准测试里依旧保持高分,尤其在函数生成和单元测试覆盖率上领先。Anthropic提供的“安全层”让它在处理敏感代码时更稳妥,这也是不少企业选它的理由。不过,它的调用费用比起普通模型要高出近两倍,导致一些小团队望而却步。
说白了,六月对Grok来说是一次公开的“技术秀”。如果他们真的在那个月把模型调优到能在LeetCode难题上跑出和Claude相当的分数,社交媒体的转发量会像火箭一样冲刺。反之,若只是噱头,用户流失的速度或许比涨粉更快。眼下我们只能看官方的demo视频、几位早期测试者的反馈,甚至是X上那条“刚用了Grok写完一个爬虫,半小时搞定”的短评。
时间会给出答案。
所有资源来源于网络,如有侵权请联系站长。
参与讨论
太贵了吧这也,Claude对企业友好但对我们就是割韭菜