4090显卡一手一足就能跑满血版DeepSeek-R1 清华团队突破大模子算力难题
2025-02-182月10日,清华大学KVCache.AI团队集中趋境科技发布的KTransformers开源神气迎来紧要更新,得手冲突大模子推理算力门槛。此前,领有671B参数的MoE架构大模子DeepSeek-R1在推理时珍藏重重。推理作事器常因高负荷宕机,专属版云作事器按GPU小时计费的华贵老本让中小团队无力承担,而市面上的“土产货部署”有预备多为参数目大幅缩水的蒸馏版,在土产货小鸿沟硬件上动手满血版 DeepSeek-R1 被以为果真不能能。 这次KTransformers神气更新带来紧要突破,援救在2