(原标题:364元就能树立DeepSeek模子?假的!)
近日,一则“炸裂”的AI新闻激发大家暖和。
斯坦福大学和华盛顿大学的决议东谈主员发表的一篇决论说文暴露,他们以不到50好意思元(约364元)的云盘算用度,施行出一款名为S1的推理模子。该模子在数学和编码智商测试中,与OpenAI的o1和DeepSeek的R1阐明不相坎坷。
这是AI边界的又一次错误迫害吗?事实并非如斯。
字据决论说文,S1模子并不是从零运转施行,而所以阿里通义千问Qwen2.5-32B开源模子为底座,然后在16块H100 GPU上进行了26分钟的监督微调,最终施行出新模子S1-32B。
在推明智商方面,决议东谈主员则通过蒸馏工夫,从谷歌的AI推理模子Gemini 2.0中提真金不怕火了推明智商。
某大模子厂商的研发东谈主员告诉21世纪经济报谈记者,S1模子实质上是在前东谈主决议的基础上复制了推明智商,而非着实翻新。
但S1模子的出现九游体育app官网,也为头部大模子厂商敲响警钟。要是头部大模子厂商参加浩瀚资源施行出来的模子,其他东谈主用少许的资源就能复制并收场相通的智商,那头部厂商的“护城河”究竟是什么?