网站地图官方微信:
网站首页 包装产品加工 印章用品 一体机办公设备 学校家具 学生 信封

当前位置: 首页 >

如何看待机器之心重测高考数学全卷,Gemini夺冠,豆包DeepSeek并列第二?

当务之急最该解决的问题是大众对于 AI大模型的正确认知以及最基本的AI用法。

你看这是前两天的测试结果,突出了一个政治正确,6款大模型,OpenAI的o3倒数第一,我当时看到的时候就觉得很奇怪,o3好歹也是曾经的一代王者,高考数学这种题它排名这么低怕不是有什么猫腻。

我们就拿单选题的第五题来测试下,因为这道题除了o3,其他的国产模型都答对了。

这是第五题的原题,正确答案是A. - 1/2。

这是之前的第三方的测试结果,6个模型…。

如何看待机器之心重测高考数学全卷,Gemini夺冠,豆包DeepSeek并列第二?

  • | 程序员都干过哪些很刺激的事情? |

    用友政务有个小工具,叫msde小工具,里面可以执行一些sql...

    查看详情>>
  • | 宁波东方理工大学学费每人每学年 9.6 万,为什么会这么贵? |

  • | 公司就一个后端一个前端,有必要搞微服务吗? |

  • | 为什么 Go 语言的 Error Handling 被某些人认为是一个败笔? |

  • | 为什么 J***aScript 在国外逐渐用于前端+后端开发,而国内还是只用它做前端? |

  • | ***拍大尺度片子时摄影师不会看光吗? |

  • | 为什么章若楠和杨超越长得很像,男人却更喜欢章若楠,认为有女人味,而觉得杨超越像小女孩? |

  • | 周杰伦为什么不告粥饼伦黑伦侵犯他的名誉权? |

  • | 娃哈哈被曝 2025 年已关停 18 家工厂,此前曾回应纯净水由今麦郎代工,娃哈哈到底在布局什么? |

  • | Centos为什么突然没人用了? |

  • | 有哪些值得一提的生活窍门? |

  • 两年以前,我在这个回答下边写了一千来字草稿,试图论证 cla...

    2025-06-27
  • 倒腾数据不累吗, 不追求24*7的业务上线时间,就不要组RA...

    2025-06-27
  • 之前一直想做笔记软件分享,今天恰好非常有分享欲。 大学毕业...

    2025-06-27
  • B2和国道大运一样,有基本的生活设施,微波炉,床铺,卫生间都...

    2025-06-27

关注我们

添加微信好友,关注最新动态