新浪科技讯 1月21日下午消息,DeepSeek于官方GitHub仓库更新了一系列FlashMLA代码,在这些更新中,一个名为“Model 1”的模型引起了广泛关注。
据悉,目前这个还很神秘的Model1不仅出现在了代码与注释中,甚至还有与DeepSeek-V3.2并驾齐驱的文件。这也不禁引发广大网友猜测,大地外网单点
最新消息显示,Model1是DeepSeek FlashMLA中支持的两个主要模型架构之一,另一个是DeepSeek-V3.2。这很可能是一个高效推理模型,相比V3.2内存占用更低,适合边缘设备或成本敏感场景。此外,大地外网单点针对16K+序列优化,适合文档理解、代码分析等长上下文任务。(文猛)
海量资讯、精准解读,尽在新浪财经APP 责任编辑:杨赐
顶: 429踩: 7159
DeepSeek新模型“Model 1”曝光,疑似“高效推理模型”
人参与 | 时间:2026-02-04 13:25:38
相关文章
- 【自营】Herschel Classic 中号双肩包电脑包10485书包背包时尚
- za家 新款纯色褶皱包手提大包 腋下云朵托特包 百搭饺子单肩包女
- 麦米可/MCMIKO 原创设计小众包包奶白色单肩斜挎小包马鞍包半圆包
- CES举办方主席:机器人是今年绝对主角|直击CES
- 瑞士军刀拉杆包男大容量拉杆旅行包高中学生拉杆书包大电脑背包新
- 韩版真皮双肩背包女2021新款时尚百搭大容量软皮简约背包妈咪背包
- PUSUZE真牛皮男女创意驾驶证皮套情侣款真皮牛皮行驶证证件保护套
- 粉色花朵小羊适用iPhone13pro max苹果12手机壳二合一11可爱xs/xr
- 段永平再谈泡泡玛特:确实蛮厉害的,不过依然无法理解为什么会需要
- Kidszoo丹麦进口DHA海藻油糖果宝宝营养品儿童dha藻油软糖60粒/瓶






评论专区