Deepseek Example - 搜索 News

23 小时

DeepSeek V4 Adds Blackwell SM100 and FP4 Support for Lower-Cost Scaling

DeepSeek V4 ships native multimodal input with lower latency, plus support for Blackwell SM100 and FP4 compute scaling.

报道：DeepSeek将于2月发布下一代AI模型V4，具备“强大”的编程能力

据科技媒体The Information周五报道，DeepSeek将于2月发布新一代旗舰AI模型DeepSeek V4，该模型具备强大的编程能力，预计将对当前的AI竞争格局产生重大影响。 V4是DeepSeek继2024年12月发布的V3模型之后的最新版本。报道援引两位知情人士称，DeepSeek内部的初步测试表明 ...

腾讯网

编程表现超越Claude和GPT？DeepSeek准备第二次震惊全世界

去年7月，由于DeepSeek下载量从高峰期的8000多万暴跌至2000多万，下滑72.2%，“DeepSeek跌落神坛”就成为了当时互联网最热门的话题。但据多位知情人士透露，DeepSeek即将重登王座。他们计划在二月中旬发布新一代模型DeepSeek-V4。也就是农历2026年新年期间，距离上一 ...

新浪网

DeepSeek又放大招！梁文锋署名新论文引关注

DeepSeek近日发布论文，阐述了一种更为高效的人工智能开发方法。该论文由创始人梁文锋参与撰写，提出了名为“流形约束超连接”（mHC）的框架。作者称，该框架旨在提升可扩展性，同时降低训练先进人工智能系统的算力和能源需求。DeepSeek下一代旗舰系统R2 ...

新浪网

刚刚，DeepSeek又探索新架构了，开源OCR 2

嘿！刚刚，DeepSeek 又更新了！这次是更新了十月份推出的 DeepSeek-OCR 模型。当时 DeepSeek-OCR 的出世，引起了大家对视觉压缩的关注与讨论，而这一次，DeepSeek 对视觉编码下手了。可以说，刚刚发布的 DeepSeek-OCR 2 通过引入 DeepEncoder V2 架构，实现了视觉编码从「 ...

电子工程专辑

DeepSeek新架构“MODEL1”代码曝光，最快2月发布

此次曝光源于DeepSeek对其开源推理加速库FlashMLA的更新。在横跨114个文件的代码变动中，出现了28处“MODEL1”标识符，其技术路径与现有的V32（即DeepSeek-V3.2）架构存在显著差异，暗示这是一个经过彻底重构的新设计。近日， DeepSeek在GitHub上的代码库更新中，意外 ...

经济观察网

DeepSeek变冷淡了

2月11日，深度求索（DeepSeek）悄悄地对其旗舰模型进行灰度测试。此次更新的核心亮点是，模型上下文窗口从原先的128K Tokens大幅提升至1M Tokens，实现了近8倍的容量增长。在AI大模型领域，上下文窗口决定了模型在单次交互中能够记忆和处理的信息量上限。

第一财经

DeepSeek新年炸场！梁文锋署名论文发布

前述内容由第一财经“星翼大模型”智能生成，相关AI内容力求但不保证准确性、时效性、完整性等。请用户注意甄别，第一财经不承担由此产生的任何责任。如您有疑问或需要更多信息，可以联系我们 yonghu@yicai.com 给AI“水管”加智能阀。 1月1日消息，DeepSeek赶 ...

爱范儿

DeepSeek R1发布一年了，不卷功能、不融资、不着急，凭什么「硬控」硅谷

使用微信扫码将网页分享到微信「服务器繁忙，请稍后再试。」一年前，我也是被这句话硬控的用户之一。 DeepSeek 带着 R1 在一年前的今天（2025.1.20）横空出世，一出场就吸引了全球的目光。那时候为了能顺畅用上 DeepSeek，我翻遍了自部署教程，也下载过不少 ...

36氪

DeepSeek 把R1论文又更新了60多页，V4呼之欲出了吧

DeepSeek开源了R1的更多技术细节。 1月4日，DeepSeek在arXiv上更新了R1论文。没有官宣，没有推文，只是版本号从v1变成了v2。但打开PDF的人都会发现一个变化，页数从22页膨胀到了86页，文件大小从928KB涨到1562KB。新增内容包括完整的训练管线拆解、20多个评测基准的 ...

36氪

DeepSeek母公司去年进账50亿，够烧2380个R1

R1横空出世一年后，DeepSeek依然没有新融资。在大模型玩家上市的上市、融资的融资的热闹中，DeepSeek还是那么高冷，并且几乎没有任何商业化的动作。即便如此，AGI也没有落下—— 持续产出高水平论文，作者名单也相当稳定，新版R1论文甚至还「回流」了一位。

第一财经

DeepSeek新模型真的要来了？“MODEL1”曝光

前述内容由第一财经“星翼大模型”智能生成，相关AI内容力求但不保证准确性、时效性、完整性等。请用户注意甄别，第一财经不承担由此产生的任何责任。如您有疑问或需要更多信息，可以联系我们 yonghu@yicai.com “MODEL1”很可能已接近训练完成或推理部署阶段 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果