bt体育在线官方网站入口

GPT-5:所有领域都达到“博士”水平,国内免费访问,不用白不用!_DeepSee_能力_王珏
栏目分类
GPT-5:所有领域都达到“博士”水平,国内免费访问,不用白不用!_DeepSee_能力_王珏
发布日期:2025-08-19 10:27    点击次数:73

昨天GPT-5重磅发布,

Sam Altaman称“在所有领域都达到“博士”水平。

听到这个消息,很多老师都想赶紧试试。

王珏老师推荐一个网站,

国内能够免翻访问

其中nano版还可免费访问:

https://askmany.cn/login?i=afad3e1d

或扫码访问:

进入网站后,如果找不到GPT-5的话,可以按下图操作:

【特别注意】GPT-5分为三个版本:GPT-5普通版、mini版、nano版。

其中,nano版(参数量最小)是可以免费访问的!一般任务也足够用了!

展开剩余89%

而且,即便是GPT-5付费版,定价也非常便宜,比GPT-4、Grok、Claude等便宜太多了!如有需要的话,咱们普通人也完全花得起。

————————————

以下先介绍一下GPT-5的总体性能情况,然后是王珏老师用一些常见的教育场景所做的测评,供大家参考。

【GPT-5总体性能情况】

首先,看测评分值的话,GPT-5确实在所有领域都达到了大模型的顶峰!

AIME(美国数学邀请赛),即便在不允许编程的情况下,GPT-5普通版也可以得到94.6分

GPQA(博士级别科学问题解决)方面,GPT-5普通版、在深度思考模式下,可以得到85.7分——而人类博士的平均分仅70分左右!

专为大模型“超能力”而编写的“人类终极测试”,GPT-5 Pro+允许编程的模式,倒是可以取得“冠军”成绩:达到惊人的42分,不允许用编程方式解决问题的GPT-5 Pro可以得到30.7分——这比两周前发布的Grok 4的25.4分,又提高了一个层级了!

在编程能力方面,无论是代码编写能力(上左图)、还是实际工程代码修补能力,都取得了大幅提高!而且,都拿到了No.1!

而且,请注意:GPT-5是一个融合语言模式、推理模式、以及多模态能力(如图片、视频等)的“大一统”大模型——其本意是奔着AGI(通用人工智能)云的,不过目前还达不到那种高度,不过离那一天也许很近了!

————————————

【王珏老师的教育场景测试】

在本部分中,王珏老师用我自己编写的一些常用的教育场景,测试一下GPT-5,看它的实际表现如何。

1、中文创作能力

【提示词】国内高考作文一卷

其它作文创作类的题目,如:模仿汪伦《回赠李太白》、模仿鲁迅写《AI时代的狂人日记》等,水平均较DeepSee有较大差距。

2、数学推理能力

对于全国I卷数学压轴题,我以前测试过,DeepSeek推导不出来,当时仅Google 的Gemini 2.5 Pro可以解出来。

而我将这道题交给GPT-5,它仅用了1分钟,就用极为简洁的方法解了出来——而且,即便是mini版,也解得完全正确!(nano版则少解了一问)

对于大学级别的竞赛题,同样在1~2分钟内,均能正确解答:

GPT-5的解(过程略,仅截取最终结论):

其它两个版本,看结论倒是一样的,但是公式的显示比较凌乱,不知道是AskManyAI网站的解析问题、还是GPT-5的输出就有问题……

3、大学物理竞赛题

这回,还是GPT-5既快、格式又清爽、结论也对(其它两个版本的过程和结果也都对,另外DeepSeek也可以解出来,不过稍慢一些):

而且,GPT-5这个版本,在每次输出完成后,都会提出一个建议,而且每次都非常贴心,挠到痒处!

我顺着它的建议,让它编写了一段html代码,来模拟上述场景:

编代码的速度也是极快!点击“运行html”按钮,就可以在网页上运行这个模拟仿真程序了:

4、识图能力

猜城市,这是王珏老师最喜爱的测试环节了:

GPT-5三个版本均能非常笃定地判断出了正确答案(这一点比DeepSeek强,DS有时能判断出来,有时判断不对、甚至判断不出)

GPT-5测评就做到这里吧,最后总结:

在中文创作上,DeepSeek > GPT-5,英文不用测,肯定是GPT-5强

在数理逻辑上,GPT-5堪称世界顶尖,既快、又准、公式表达也非常准确(目前nano、mini两个版本公式呈现方式似乎差一些),

编程能力上,GPT-5同样飞快、能力超强

在识图能力上,GPT-5同样表现出了极高的水准

在中文创作上,DeepSeek > GPT-5,英文不用测,肯定是GPT-5强

在数理逻辑上,GPT-5堪称世界顶尖,既快、又准、公式表达也非常准确(目前nano、mini两个版本公式呈现方式似乎差一些),

编程能力上,GPT-5同样飞快、能力超强

在识图能力上,GPT-5同样表现出了极高的水准

最后,说明一下:

如果你特别在意生成图片功能的话,AskManyAI做不到,也许只能用GPT-5官网了……

发布于:北京市