Add ollama

2024-05-05 18:59:39 -04:00 · 2024-05-05 18:59:39 -04:00 · 714b400ae1
commit 714b400ae1
parent a25bc56303
5 changed files with 52 additions and 54 deletions
--- a/localai/local-ai-deployment.yaml
+++ b/localai/local-ai-deployment.yaml
@ -1,37 +0,0 @@
 apiVersion: apps/v1
 kind: Deployment
 metadata:
  name: local-ai
  namespace: local-ai-ns
  labels:
    app: local-ai
 spec:
  selector:
    matchLabels:
      app: local-ai
  replicas: 1
  template:
    metadata:
      labels:
        app: local-ai
      name: local-ai
    spec:
      containers:
        - args:
          - dolphin-2.5-mixtral-8x7b
          env:
          - name: DEBUG
            value: "true"
          name: local-ai
          image: quay.io/go-skynet/local-ai:v2.14.0-cublas-cuda12
          imagePullPolicy: IfNotPresent
          resources:
            limits:
              nvidia.com/gpu: 2
          volumeMounts:
            - name: models-volume
              mountPath: /build/models
      volumes:
        - name: models-volume
          persistentVolumeClaim:
            claimName: models-pvc
--- a/localai/local-ai-service.yaml
+++ b/localai/local-ai-service.yaml
@ -1,13 +0,0 @@
 apiVersion: v1
 kind: Service
 metadata:
  name: local-ai
  namespace: local-ai-ns
 spec:
  selector:
    app: local-ai
  type: LoadBalancer
  ports:
    - protocol: TCP
      port: 80
      targetPort: 8080
--- a/ollama/ollama-deployment.yaml
+++ b/ollama/ollama-deployment.yaml
@ -0,0 +1,36 @@
 apiVersion: apps/v1
 kind: Deployment
 metadata:
  name: ollama-deployment
  namespace: ollama-ns
 spec:
  replicas: 1
  selector:
    matchLabels:
      app: ollama
  template:
    metadata:
      labels:
        app: ollama
    spec:
      runtimeClassName: nvidia
      containers:
      - name: ollama
        image: ollama/ollama
        env:
        - name: OLLAMA_HOST
          value: 0.0.0.0
        - name: OLLAMA_MODELS
          value: "/models"
        ports:
        - containerPort: 11434
        resources:
          limits:
            nvidia.com/gpu: 2
        volumeMounts:
        - name: ollama-volume
          mountPath: "/my-models"
      volumes:
      - name: ollama-volume
        persistentVolumeClaim:
          claimName: ollama-pvc
--- a/localai/local-ai-pvc.yaml
+++ b/localai/local-ai-pvc.yaml
@ -1,12 +1,12 @@
 apiVersion: v1
 kind: PersistentVolumeClaim
 metadata:
-  name: models-pvc
+  name: ollama-pvc
-  namespace: local-ai-ns
+  namespace: ollama-ns
 spec:
  accessModes:
-    - ReadWriteMany
+    - ReadWriteOnce
  storageClassName: longhorn
  resources:
    requests:
-      storage: 100Gi
+      storage: 200Gi
--- a/ollama/ollama-service.yaml
+++ b/ollama/ollama-service.yaml
@ -0,0 +1,12 @@
 apiVersion: v1
 kind: Service
 metadata:
  name: ollama-service
  namespace: ollama-ns
 spec:
  type: LoadBalancer
  ports:
  - port: 11434
    targetPort: 11434
  selector:
    app: ollama