DeepSeek策略揭秘：压缩推理成本，全力聚焦内部AGI研发-科技数码-数据世界

在AI界掀起巨浪的DeepSeek R1，自其诞生以来的128天里，已对整个大模型市场造成了深远影响。这款模型以惊人的力量，推动了推理模型价格的急剧下滑，使得OpenAI在六月更新的o3价格相较于o1版本，直接降至两成。

值得注意的是，DeepSeek模型的托管使用量在第三方平台上呈现出爆炸式增长，与初发布时相比，几乎激增了20倍，这一变化极大地促进了众多云计算企业的发展。然而，令人意外的是，DeepSeek自家的网站和API市场份额却并未随之水涨船高，反而出现了下滑趋势，与上半年AI产品的持续增长态势形成了鲜明对比。

据SemiAnalysis发布的一份深度报告分析，DeepSeek不仅改变了AI模型市场的竞争格局，也揭示了当前AI市场份额的最新动态。尽管DeepSeek V3与R1模型经过迭代升级，性能较1月发布时有了显著提升，且价格更为亲民，但其官方平台的使用情况却并未因此受益。

数据显示，截至5月，全网DeepSeek模型生成的token中，仅有16%来自DeepSeek官方平台。同时，其网页版聊天机器人的流量也遭遇了大幅下滑，而与此同时，其他主要大模型的网页版流量却在持续攀升。这种“墙内开花墙外香”的现象背后，实则隐藏着DeepSeek为降低成本所做的诸多妥协。

SemiAnalysis指出，用户在DeepSeek官方平台上使用模型时，往往需要等待数秒才能看到首个字符的出现，这一延迟现象在业内被称为“首token延迟”。相比之下，尽管其他平台的价格普遍更高，但其响应速度却快得多，部分平台甚至能实现几乎零延迟的体验。例如，在Parasail或Friendli等平台，用户仅需支付3-4美元，即可获得几乎没有延迟的100万token额度。而若选择更大更稳定的服务商，如微软Azure平台，虽然其价格是DeepSeek官方的2.5倍，但延迟却减少了整整25秒。

DeepSeek官方甚至不是同等延迟条件下价格最低的DeepSeek模型服务商。在价格与性能的权衡上，DeepSeek选择了在有限的推理计算资源下，仅提供64k的上下文窗口服务，这在主流模型提供商中属于最小之一。对于需要读取整个代码库的编程场景而言，64K的上下文窗口显然不够用，用户因此更倾向于选择第三方平台。而在同等价格下，Lambda和Nebius等平台能提供2.5倍以上的上下文窗口。

DeepSeek为了降低成本，还将多个用户的请求打包处理，虽然每个token的成本因此降低，但每个用户的等待时间却相应增加。这一系列降本策略均显示出DeepSeek目前对用户体验的重视程度不高，其更多地将算力资源投入到内部研发中，以实现AGI为目标。同时，通过开源策略，DeepSeek鼓励其他云服务托管其模型，以此扩大影响力和培养生态。

在DeepSeek的影响下，其他大模型供应商也开始调整策略。Claude为了缓解算力紧张的问题，降低了输出速度，但仍努力在用户体验与营收之间寻找平衡。自Claude 4 Sonnet发布以来，其输出速度已下降了40%，但仍比DeepSeek快不少。Claude模型被设计成生成更简洁的回复，相同问题下，DeepSeek和Gemini可能需要多花3倍的token。

种种迹象表明，大模型供应商正在从多个维度对模型进行改进，不仅追求模型智能上限的提升，更注重每个token所能提供的智能价值。

回到刚开始说的 FaceTime 裸露检测：从苹果的初衷来看，这是一个为了更好保护青少年而推出的安全特性，它有助于防止青少年在视频通话中接触到不适当的裸露内容——类似的手机视频通话性骚扰和欺诈案例，全球范围…

目前外媒已经带来了关于将在今年年内发布的多款新Mac设备的爆料。此外，关于在下一代苹果M6系列芯片的消息也被曝光，消息称这可能是第一款集成5G调制解调器的M系列芯片将采用台积电(TSMC)的N2节点制造。台…

在此之前，同一位博主的爆料还提到过，“SM8850新机标配6.85"±2K LTPO，三星定制屏，同样是四窄边大直屏，支持Pol-less去偏光技术，有AR扛眩光膜，能上的新硬件新技术都上了，目前子系新旗舰…

7月2日，荣耀推出了新一代旗舰大折叠手机——荣耀Magic V5，这款手机不仅再创多项大折叠手机纤薄世界纪录，还具有大折叠满血配置，并将AI与手机深度融合，搭载更为智慧化的使用方式。在护眼方面，此前在荣耀直板…

【环球网科技综合报道】7月2日消息，据外媒路透社报道，两位匿名知情人士透露，英特尔新任首席执行官陈立武正推动公司芯片代工业务进行根本性战略调整，计划停止向外部客户推销其长期投入的18A（1.8纳米）制程技术，…

IT之家 7 月 2 日消息，科技媒体 SamLover 昨日（7 月 1 日）发布博文，报道称三星正研发名为“SUSCAN”的新技术，从明年开始装备钢壳电池。消息称这种钢壳电池结构比较复杂，包含端子、正…

根据NVIDIA的说法，其将提供GTX700（Maxwell）、900（Maxwell）、10（Pascal）和Volta系列显卡的最后一次驱动更新，这些更新将包含在580版本的驱动程序中。目前，NVI…

与此同时，安卓 16 系统的稳定版已正式在谷歌 Pixel设备上推出，而其他原始设备制造商（OEM）预计将在“未来几个月”开始为旗下设备提供安卓 16 的升级。可以看到，此次确认的机型涵盖了多款热门旗舰…

2025年5月份全球手机销量份额出炉了，大家比较关心国产机的排名情况，虽然可能跟我们关系不算大，也不能增加我们工资，但是国产在科技领域的进步，必然对民生造成发展，毕竟星星之火可以燎原，像印度三哥它们科技不强，…

近期，荣耀400系列手机在全球市场上的表现引发了广泛关注。据行业消息透露，该系列全球激活量已迅速突破100万台大关，这一成绩不仅彰显了其市场认可度，也激发了业界对于其具体市场表现的好奇与讨论。尤其令人瞩目的是，尽管全球数据亮眼，但国内与国外市场的具体占比情况当时并未明确。

虽然苹果将修改相应机型中 Logo 徽标位置，不过该公司并不会同步调整手机中的 MagSafe 无线充电线圈设计，作为比较，苹果公司预计将对其MagSafe 保护壳进行修改，以匹配新设计。此前消息显示苹…

近日，格力电器主导发布两项 ISO 制冷压缩机国际标准，为该领域 20年来首次成功立项并发布。对此，朱磊在论坛上表示，通过一个国际标准实在是太难了。朱磊表示，一项 ISO 标准通过需要在整个立项审核发布…

月 28 日消息，博主 @数码闲聊站发文，披露苹果将在今年 9 月推出 A19 Pro 处理器，高通将紧随其后（9 月末）推出 SM8850处理器，其声称这代芯片“频率会再刷新高”，这是因为其采用的 N3…

IT之家 6 月 28日消息，中核集团中国原子能科学研究院今日宣布：我国首个乏燃料干法后处理主工艺设备科研样机集成台架（IT之家以下简称“干法后处理科研样机集成台架”）在葫芦岛基地完成安装。这标志着一体化…