端侧轻松跑 DeepSeek,第四范式推出大模子推理端
发布时间:2025-02-26 23:50
明天,第四范式推出年夜模子推理端侧处理计划ModelHub AIoT,用户在端侧可轻松安排如DeepSeek R1、Qwen 2.5、Llama 2/3系列等小尺寸蒸馏模子,离线运转,并可机动在多个模子之间切换,统筹了模子紧缩、推感性能,处理了安排与优化的庞杂性。该计划不只可能满意用户对隐衷跟及时性的需要,还极年夜下降了AI年夜模子推理本钱。无需联网,端侧低延时运转优良的端侧推理框架在端侧算力的支撑下,展示出出色的机能与适配性。模子在当地即时处置恳求,供给流利的用户休会。在收集不稳固或离线情况下,端侧模子仍能畸形运转,确保效劳的持续性。数据隐衷与保险性晋升在端侧安排模子,数据无需上传至云端,全部盘算跟处置都在当地装备上实现,防止了云端传输跟存储进程中的潜伏泄漏危险,下降了数据被黑客攻打或滥用的可能性。本钱效力与资本优化端侧安排无效下降对云端资本的依附,当地处置增加了云端盘算跟存储的需要,下降了效劳器本钱跟API挪用本钱,无需频仍上传大批数据,节俭了收集带宽资本。