DeepSeek-V4发布：华为昇腾助力，性能提升，价格亲民开启新篇章-科技数码-数据世界

DeepSeek近日正式推出V4系列大模型，包含Pro与Flash两个版本，分别对应官方网页端专家模式与APP快速模式。此次升级在模型架构、长上下文处理能力及价格策略上实现突破，同时宣布与华为昇腾达成算力合作，引发行业广泛关注。

技术参数方面，V4-Pro模型参数达1.6万亿，激活量490亿，预训练数据规模33万亿；Flash版本参数2840亿，激活量130亿，预训练数据32万亿。两个版本均支持100万tokens上下文窗口，提供非思考与思考双模式选择。DeepSeek强调，通过全新注意力机制与DSA稀疏注意力技术，V4系列在保持全球领先长上下文能力的同时，将计算资源需求降低40%以上。

价格体系呈现显著差异化：V4-Pro输入定价每百万tokens 1元，输出12元；Flash版本输入0.2元，输出2元。这种梯度定价策略被网友评价为"普惠型创新"。值得注意的是，受制于高端算力供应，Pro版本当前服务吞吐量受限，预计昇腾950超节点下半年批量上市后，其成本将下降60%以上。

性能评测显示，V4-Pro在Agentic Coding任务中达到开源模型最优水平，成为DeepSeek内部开发主力工具。世界知识测试中，该模型超越所有开源竞品，仅落后于Gemini-Pro-3.1；数学与竞赛编程领域则比肩GPT-5.4等顶级闭源模型。推理能力方面，Pro-Max模式在标准基准测试中优于GPT-5.2，但与最新闭源模型存在3-6个月代差。

Flash版本在保持90%核心性能的同时，将响应速度提升3倍，特别适合实时交互场景。在简单Agent任务中，其表现与Pro版本持平，但复杂任务处理能力存在15%-20%差距。两个版本均已同步上线DeepSeek API，兼容OpenAI与Anthropic接口标准。

技术白皮书披露，V4系列在架构层面实现三大创新：混合注意力机制使长文本处理效率提升2.3倍；流形约束超连接技术解决深层网络信号衰减问题；Muon优化器将训练收敛速度加快40%。但研究团队也承认，为追求极致效率，当前架构包含较多经验性组件，在复杂指令遵循与极端摘要任务上仍有改进空间。

此次发布前夕，DeepSeek被曝启动首轮外部融资，计划以超100亿美元估值募集3亿美元。知情人士透露，融资将主要用于算力基础设施扩建与顶尖人才招募。此前坚持独立发展的DeepSeek，此次战略调整被解读为应对多模态竞争的必要举措——目前其模型仍局限于文本领域，而主要竞品均已实现图文音视频全模态覆盖。

综合来看，2026年在暗光夜景拍摄这个细分赛道上，OPPO Find X9 Ultra 凭借其哈苏全大底五摄的硬件碾压、第二代丹霞镜头对色彩和动态范围的革命性提升、以及哈苏大师模式带来的专业级氛围感，体验优…

特别是4月20日发布的全球首款大阔折华为Pura XMax，凭借全新形态与小艺伴随式AI智慧体验，引发了行业与消费者的高度关注，也让2026年折叠屏推荐的焦点再次汇聚到华为身上。作为折叠屏行业的开创者与引…

活动现场，一个被反复提及的判断是：随着模型基础能力逐步拉平，企业对Agent的关注点，正在从“会不会生成、能不能对话”，转向“能不能接入系统、嵌入流程、稳定交付结果”。这也是百度智能云在现场重点强调的方向：…

如果说华为Mate X7双折叠是商务旗舰，那么Pura X阔折叠则是华为为年轻用户打造的潮流精致首选。从外折到内折，从双折叠到三折叠，再到即将发布的大阔折，华为已构建起覆盖全形态的折叠产品矩阵，一次次通过创…

事实上，早在今年3月，还未等公司市值突破万亿大关，站在中际旭创身后的王伟修父子便以1050亿元的财富，荣登《2026胡润全球富豪榜》烟台首富（以居住地为标准）之位。根据Lightcounting的预测，2…

模型发布后，一些用GPT-Image-2生成的AI假图已经开始在网络上开始传播。据了解，生成的图片之所以真假难辨，是因为该大模型解决了以往AI细节粗糙、文字乱码扭曲的问题。此外，GPT-Image-2的…

AI模型迎来“近两年最大能力跃迁”，供应链全线告急，美国民愤情绪一触即发——这是SemiAnalysis创始人Dylan Patel在最新访谈中给出了对当下AI革命最直白、最辛辣的判断。Patel强调，“An…

IT之家援引播客内容，古尔曼指出苹果正在积极拓展生态边界，主要包括可穿戴设备与智能家居两大核心赛道，其中 AI AirPods是现有耳机产品的延伸，但其余 5 款均代表苹果从未涉足的全新领域。在智能家居…

模型分为两个版本：DeepSeek-V4-Pro拥有1.6万亿参数，在Agent能力、世界知识和推理性能上均达到国内与开源领域的领先水平；DeepSeek-V4-Flash则以更小的参数量提供接近的推理能力，…

从技术特点上看，过去的文生图主要是“理解指令后拼贴素材”，但这次，则是以信息产品的逻辑直接生成可媲美照片、设计师作品的成品。新的技术降低了视觉表达的门槛，这固然是大模型能力升级的关键进步，但也对虚假信息等问…

据了解，“听我讲完”的梗源自李想早年参与的一档企业家真人秀节目。近期，李想本人也在宣传视频中主动玩梗，在宣传理想L9Livis参加北京车展视频中，“AI 李想”假装暴怒大喊“你听我讲完！”，冷静后，理想…