Loading...
本文介绍了如何使用Qwen2.5-0.5B-Instruct模型快速启动一个模型服务,包括下载模型、安装git-lfs、使用git clone下载模型、编写推理代码、使用vLLM加速推理,并通过Docker部署服务。同时也分享了部署时的一些经验。
本文详细介绍了在 Linux 系统上配置深度学习环境的步骤,包括配置 SSH 登录、安装显卡驱动及禁用 Nouveau、安装并配置 Docker 以支持 GPU 以及切换至普通用户并安装 Miniconda。此外,文章还提供了如何配置 conda 和 PyPI 镜像的方法,并给出了若干实用建议,以避免常见问题和潜在风险,提高配置效率和安全性。
长短期记忆网络(Long Short-Term Memory Network,LSTM)是循环神经网络的一个变体,可以有效地解决简单循环神经网络的梯度爆炸或消失问题。通过引入一个新的内部状态和门控机制来实现长短期记忆的功能。
在 Word2Vec 中,Embedding 是一个映射,将词从原先所属的空间映射到新的多维空间中,也就是把词从原先所在空间嵌入到一个新的空间中去。本文介绍的 CBOW 和 Skip-Gram 是生成 Embedding 矩阵比较著名的两种无监督训练方法。