久久精品欧美日韩精品/狠狠色婷婷久久一区二区三区/国产精品午夜无码av体验区/丰满人妻av无码一区二区三区/成人做爰A片免费看网站爱酱

北京電標出分了,哪款大模型猜對了?

撰文 | 小不董

編輯 | 李信馬

題圖 | 文心一格

就在5月26日,北京市新能源小客車指標發布了。

根據此前截至2024年3月8日24時的申請,經審核,新能源小客車指標申請數量如下:?

2023年,北京家庭新能源指標配置的積分排序入圍名單中,分數最高的家庭為258分,分數最低的家庭為60分,入圍“分數線”比2022年提高了4分。

在積分排序入圍名單上,排在第一位、總積分258分的家庭有三代人參與搖號,成員最早注冊時間為2011年2月19日。

并且,有將近1600個家庭的積分都是60。以最后一名入圍的60分家庭來看,共有三代人參與搖號,成員最早注冊時間為2013年3月3日。數相同的情況下,按家庭成員中最早在系統注冊時間先后排序。

以過去三年間,從最低入圍分數來看在逐步上升,難度一年大過一年,不少人都在擔心,自己的積分夠了嗎?會不會有一個配額屬于自己呢??

對此,我們決定用幾款大模型對于2024年家庭新能源指標入圍積分線進行了預測,看看哪款大模型更了解中國的實際情況,給出的答案最準確。經整理結果如下:?

首先,是直接選擇“棄權”的選手,比如字節跳動旗下的豆包大模型就表示無法準確預測,建議關注官方。?

圖片來源:豆包

與之類似的還有訊飛星火大模型,只是模糊的表示,競爭會更激烈。?

圖片來源:訊飛星火?

騰訊的混元大模型 也是無法預測,不過給出了些建議,俗稱 “甩鍋”。?

圖片來源:騰訊混元助手?

相比之下,阿里云的通義千問,雖然沒有給出具體答案,但是認為會超過60,即使這個范圍很寬泛,但比前三個還是要有進步。

圖片來源:通義千問?

而給出的答案最符合要求的大模型,當屬百度的文心一言,明確給出會在64-66分之間,理由也比較清晰。?

圖片來源:文心一言?

此外,作為對比 ,我們還向chatGPT也詢問了這個問題 ,其干脆利落地給出了無法提供未來數據的答案。?

不過最終,在5月26日實際發布的的本期配置中,分數最高的家庭282分,分數最低的家庭60分,與去年的入圍“分數線”持平。某種意義上來說,是“全軍覆沒”了,可見在預測方面,大模型還有不小的進步空間。最后,恭喜成功入圍的朋友們啦!

標簽: 新能源
北京電標出分了,哪款大模型猜對了?
掃描二維碼查看原文
分享自DoNews
Copyright ? DoNews 2000-2025 All Rights Reserved