Ettore Di Giacinto
|
bdf3f95346
|
feat(python-grpc): allow to set max workers with PYTHON_GRPC_MAX_WORKERS (#1081)
**Description**
this allows to customize the maximum number of grpc workers for python
backends
Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
|
2023-09-19 21:30:39 +02:00 |
|
Ettore Di Giacinto
|
afdc0ebfd7
|
feat: add --single-active-backend to allow only one backend active at the time (#925)
Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
|
2023-08-19 01:49:33 +02:00 |
|
Ettore Di Giacinto
|
a843e64fc2
|
feat: add initial AutoGPTQ backend implementation
|
2023-08-07 22:53:28 +02:00 |
|
Ettore Di Giacinto
|
b96e30e66c
|
fix: use bytes in gRPC proto instead of strings (#813)
Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
|
2023-07-27 18:41:04 +02:00 |
|
Ettore Di Giacinto
|
982a7e86a8
|
feat: add huggingface embeddings backend
Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
|
2023-07-20 22:10:42 +02:00 |
|