V2AS
问路
意见反馈
↓ 按住下拉
安卓机上 4G 内存跑 alpaca,欢迎试用轻量级 LLM 模型推理框架
InferLLM
从 LLM 火爆以来,社区已经出现了非常多优秀的模型,当然他们最大的特点就是体积大,最近为了让大模型可以在更低端的设备上运行,社区做了非常多的工作, gptq 实现了 ......
内存
模型
32
InferLLM
llama
V2AS = Way To Ask
V2AS 一个技术分享与创造的静土
手机扫一扫
移动阅读更方便
近15日热搜文章
oslab oranges 一个操作系统的实现 实验三 认识保护模式(二):分页
note03-计算机网络
高效处理报表,掌握原生JS打印和导出报表为PDF的顺畅技巧!
4
Oracle学习笔记七 锁
5
Mac OS安装Python的pip
6
SpringBoot获取树状结构数据-SQL处理
7
一文读懂PRBS定义、生成办法、作用
8
Linux Ubuntu18.04 安装配置 clash
9
Util应用框架Web Api开发快速入门
10
【Azure K8S | AKS】在不丢失文件/不影响POD运行的情况下增加PVC的大小