加速大模型应用落地:DeepSeek-R1满血版分布式自建实战
作者:suliuer在开源大模型领域,DeepSeek-R1作为拥有超过600亿参数的混合专家(MoE)模型,凭借其强大的语言理解和卓越的性能表现成为当前最受关注的开源大模型之一。本文将基于官方推荐的 SGLang 推理框架,详细介绍如何使...
作者:suliuer在开源大模型领域,DeepSeek-R1作为拥有超过600亿参数的混合专家(MoE)模型,凭借其强大的语言理解和卓越的性能表现成为当前最受关注的开源大模型之一。本文将基于官方推荐的 SGLang 推理框架,详细介绍如何使...
作者:罗培羽游戏与web服务器的差异是个话题,近来也有争议哪个更先进。游戏服务器一般会手动抽象各种逻辑功能,而web是个更大的领域,开放的解决方案也多一些,小厂会沿用大厂的各种成熟中间件,nginx、uwsgi、celery、rabbitm...
作者:MiAo引言记得以前刚刚入职的时候,有一次同事们在谈论'JBus'的问题,当时的我完全没听过这个组件,心想果然要学的东西还有很多呀,好奇地凑过去一看才恍然大悟,原来大家说的是这个。计算机技术诞生于英语系国家,构造出的产物多以英语命名。...
作者:Sea Bean、苇哥背景自从OpenAI的ChatGPT横空出世以来,各类大语言模型(Large Language Model,简称LLM)以其丰富而强大的自然语言处理能力点燃了人们对AI的热情。无论是在教育、医疗、金融、法律还是娱...
背景笔者在网上冲浪的时候,看到了一个词,前端渲染模式。然后就产生了一个疑问,这是什么东西?在了解之后呢,才恍然大悟,原来我们每天在浏览器浏览的页面背后,在呈现给我们的过程也有一些不同的方法和策略,最终将页面展现给我们。那接下来就由笔者带大家...