LocalAI/core/http/endpoints/openai/completion.go

package openai

import (
	"bufio"
	"bytes"
	"encoding/json"
	"fmt"

	fiberContext "github.com/go-skynet/LocalAI/core/http/ctx"
	"github.com/go-skynet/LocalAI/core/services"

	"github.com/go-skynet/LocalAI/core/schema"
	"github.com/gofiber/fiber/v2"
	"github.com/rs/zerolog/log"
	"github.com/valyala/fasthttp"
)

// CompletionEndpoint is the OpenAI Completion API endpoint https://platform.openai.com/docs/api-reference/completions
// @Summary Generate completions for a given prompt and model.
// @Param request body schema.OpenAIRequest true "query params"
// @Success 200 {object} schema.OpenAIResponse "Response"
// @Router /v1/completions [post]
func CompletionEndpoint(fce *fiberContext.FiberContextExtractor, oais *services.OpenAIService) func(c *fiber.Ctx) error {
	return func(c *fiber.Ctx) error {
		_, request, err := fce.OpenAIRequestFromContext(c, false)
		if err != nil {
			return fmt.Errorf("failed reading parameters from request:%w", err)
		}

		log.Debug().Msgf("`OpenAIRequest`: %+v", request)

		traceID, finalResultChannel, _, _, tokenChannel, err := oais.Completion(request, false, request.Stream)
		if err != nil {
			return err
		}

		if request.Stream {
			log.Debug().Msgf("Completion Stream request received")

			c.Context().SetContentType("text/event-stream")
			//c.Response().Header.SetContentType(fiber.MIMETextHTMLCharsetUTF8)
			//c.Set("Content-Type", "text/event-stream")
			c.Set("Cache-Control", "no-cache")
			c.Set("Connection", "keep-alive")
			c.Set("Transfer-Encoding", "chunked")

			c.Context().SetBodyStreamWriter(fasthttp.StreamWriter(func(w *bufio.Writer) {
				for ev := range tokenChannel {
					var buf bytes.Buffer
					enc := json.NewEncoder(&buf)
					if ev.Error != nil {
						log.Debug().Msgf("[CompletionEndpoint] error to debug during tokenChannel handler: %q", ev.Error)
						enc.Encode(ev.Error)
					} else {
						enc.Encode(ev.Value)
					}

					log.Debug().Msgf("completion streaming sending chunk: %s", buf.String())
					fmt.Fprintf(w, "data: %v\n", buf.String())
					w.Flush()
				}

				resp := &schema.OpenAIResponse{
					ID:      traceID.ID,
					Created: traceID.Created,
					Model:   request.Model, // we have to return what the user sent here, due to OpenAI spec.
					Choices: []schema.Choice{
						{
							Index:        0,
							FinishReason: "stop",
						},
					},
					Object: "text_completion",
				}
				respData, _ := json.Marshal(resp)

				w.WriteString(fmt.Sprintf("data: %s\n\n", respData))
				w.WriteString("data: [DONE]\n\n")
				w.Flush()
			}))
			return nil
		}
		// TODO is this proper to have exclusive from Stream, or do we need to issue both responses?
		rawResponse := <-finalResultChannel
		if rawResponse.Error != nil {
			return rawResponse.Error
		}
		jsonResult, _ := json.Marshal(rawResponse.Value)
		log.Debug().Msgf("Response: %s", jsonResult)

		// Return the prediction in the response body
		return c.JSON(rawResponse.Value)
	}
}
Revert "[Refactor]: Core/API Split" (#1550) Revert "[Refactor]: Core/API Split (#1506)" This reverts commit ab7b4d5ee9448e533a342bd1771393acd2967191. 2024-01-05 17:04:46 +00:00			`package openai`

			`import (`
			`"bufio"`
			`"bytes"`
			`"encoding/json"`
			`"fmt"`

refactor: backend/service split, channel-based llm flow (#1963) Refactor: channel based llm flow and services split --------- Signed-off-by: Dave Lee <dave@gray101.com> 2024-04-13 07:45:34 +00:00			`fiberContext "github.com/go-skynet/LocalAI/core/http/ctx"`
			`"github.com/go-skynet/LocalAI/core/services"`
refactor: move remaining api packages to core (#1731) * core 1 * api/openai/files fix * core 2 - core/config * move over core api.go and tests to the start of core/http * move over localai specific endpoints to core/http, begin the service/endpoint split there * refactor big chunk on the plane * refactor chunk 2 on plane, next step: port and modify changes to request.go * easy fixes for request.go, major changes not done yet * lintfix * json tag lintfix? * gitignore and .keep files * strange fix attempt: rename the config dir? 2024-03-01 15:19:53 +00:00
MQTT Startup Refactoring Part 1: core/ packages part 1 (#1728) This PR specifically introduces a `core` folder and moves the following packages over, without any other changes: - `api/backend` - `api/config` - `api/options` - `api/schema` Once this is merged and we confirm there's no regressions, I can migrate over the remaining changes piece by piece to split up application startup, backend services, http, and mqtt as was the goal of the earlier PRs! 2024-02-21 01:21:19 +00:00			`"github.com/go-skynet/LocalAI/core/schema"`
Revert "[Refactor]: Core/API Split" (#1550) Revert "[Refactor]: Core/API Split (#1506)" This reverts commit ab7b4d5ee9448e533a342bd1771393acd2967191. 2024-01-05 17:04:46 +00:00			`"github.com/gofiber/fiber/v2"`
			`"github.com/rs/zerolog/log"`
			`"github.com/valyala/fasthttp"`
			`)`

feat(swagger): Add swagger API doc (#1926) * makefile(build): add minimal and api build target * feat(swagger): Add swagger 2024-03-29 21:29:33 +00:00			`// CompletionEndpoint is the OpenAI Completion API endpoint https://platform.openai.com/docs/api-reference/completions`
			`// @Summary Generate completions for a given prompt and model.`
			`// @Param request body schema.OpenAIRequest true "query params"`
			`// @Success 200 {object} schema.OpenAIResponse "Response"`
			`// @Router /v1/completions [post]`
refactor: backend/service split, channel-based llm flow (#1963) Refactor: channel based llm flow and services split --------- Signed-off-by: Dave Lee <dave@gray101.com> 2024-04-13 07:45:34 +00:00			`func CompletionEndpoint(fce fiberContext.FiberContextExtractor, oais services.OpenAIService) func(c *fiber.Ctx) error {`
Revert "[Refactor]: Core/API Split" (#1550) Revert "[Refactor]: Core/API Split (#1506)" This reverts commit ab7b4d5ee9448e533a342bd1771393acd2967191. 2024-01-05 17:04:46 +00:00			`return func(c *fiber.Ctx) error {`
refactor: backend/service split, channel-based llm flow (#1963) Refactor: channel based llm flow and services split --------- Signed-off-by: Dave Lee <dave@gray101.com> 2024-04-13 07:45:34 +00:00			`_, request, err := fce.OpenAIRequestFromContext(c, false)`
Revert "[Refactor]: Core/API Split" (#1550) Revert "[Refactor]: Core/API Split (#1506)" This reverts commit ab7b4d5ee9448e533a342bd1771393acd2967191. 2024-01-05 17:04:46 +00:00			`if err != nil {`
			`return fmt.Errorf("failed reading parameters from request:%w", err)`
			`}`

refactor: backend/service split, channel-based llm flow (#1963) Refactor: channel based llm flow and services split --------- Signed-off-by: Dave Lee <dave@gray101.com> 2024-04-13 07:45:34 +00:00			log.Debug().Msgf("`OpenAIRequest`: %+v", request)
Revert "[Refactor]: Core/API Split" (#1550) Revert "[Refactor]: Core/API Split (#1506)" This reverts commit ab7b4d5ee9448e533a342bd1771393acd2967191. 2024-01-05 17:04:46 +00:00
refactor: backend/service split, channel-based llm flow (#1963) Refactor: channel based llm flow and services split --------- Signed-off-by: Dave Lee <dave@gray101.com> 2024-04-13 07:45:34 +00:00			`traceID, finalResultChannel, _, _, tokenChannel, err := oais.Completion(request, false, request.Stream)`
Revert "[Refactor]: Core/API Split" (#1550) Revert "[Refactor]: Core/API Split (#1506)" This reverts commit ab7b4d5ee9448e533a342bd1771393acd2967191. 2024-01-05 17:04:46 +00:00			`if err != nil {`
refactor: backend/service split, channel-based llm flow (#1963) Refactor: channel based llm flow and services split --------- Signed-off-by: Dave Lee <dave@gray101.com> 2024-04-13 07:45:34 +00:00			`return err`
Revert "[Refactor]: Core/API Split" (#1550) Revert "[Refactor]: Core/API Split (#1506)" This reverts commit ab7b4d5ee9448e533a342bd1771393acd2967191. 2024-01-05 17:04:46 +00:00			`}`

refactor: backend/service split, channel-based llm flow (#1963) Refactor: channel based llm flow and services split --------- Signed-off-by: Dave Lee <dave@gray101.com> 2024-04-13 07:45:34 +00:00			`if request.Stream {`
			`log.Debug().Msgf("Completion Stream request received")`
Revert "[Refactor]: Core/API Split" (#1550) Revert "[Refactor]: Core/API Split (#1506)" This reverts commit ab7b4d5ee9448e533a342bd1771393acd2967191. 2024-01-05 17:04:46 +00:00
			`c.Context().SetContentType("text/event-stream")`
			`//c.Response().Header.SetContentType(fiber.MIMETextHTMLCharsetUTF8)`
			`//c.Set("Content-Type", "text/event-stream")`
			`c.Set("Cache-Control", "no-cache")`
			`c.Set("Connection", "keep-alive")`
			`c.Set("Transfer-Encoding", "chunked")`

			`c.Context().SetBodyStreamWriter(fasthttp.StreamWriter(func(w *bufio.Writer) {`
refactor: backend/service split, channel-based llm flow (#1963) Refactor: channel based llm flow and services split --------- Signed-off-by: Dave Lee <dave@gray101.com> 2024-04-13 07:45:34 +00:00			`for ev := range tokenChannel {`
Revert "[Refactor]: Core/API Split" (#1550) Revert "[Refactor]: Core/API Split (#1506)" This reverts commit ab7b4d5ee9448e533a342bd1771393acd2967191. 2024-01-05 17:04:46 +00:00			`var buf bytes.Buffer`
			`enc := json.NewEncoder(&buf)`
refactor: backend/service split, channel-based llm flow (#1963) Refactor: channel based llm flow and services split --------- Signed-off-by: Dave Lee <dave@gray101.com> 2024-04-13 07:45:34 +00:00			`if ev.Error != nil {`
			`log.Debug().Msgf("[CompletionEndpoint] error to debug during tokenChannel handler: %q", ev.Error)`
			`enc.Encode(ev.Error)`
			`} else {`
			`enc.Encode(ev.Value)`
			`}`

			`log.Debug().Msgf("completion streaming sending chunk: %s", buf.String())`
Revert "[Refactor]: Core/API Split" (#1550) Revert "[Refactor]: Core/API Split (#1506)" This reverts commit ab7b4d5ee9448e533a342bd1771393acd2967191. 2024-01-05 17:04:46 +00:00			`fmt.Fprintf(w, "data: %v\n", buf.String())`
			`w.Flush()`
			`}`

			`resp := &schema.OpenAIResponse{`
refactor: backend/service split, channel-based llm flow (#1963) Refactor: channel based llm flow and services split --------- Signed-off-by: Dave Lee <dave@gray101.com> 2024-04-13 07:45:34 +00:00			`ID: traceID.ID,`
			`Created: traceID.Created,`
			`Model: request.Model, // we have to return what the user sent here, due to OpenAI spec.`
Revert "[Refactor]: Core/API Split" (#1550) Revert "[Refactor]: Core/API Split (#1506)" This reverts commit ab7b4d5ee9448e533a342bd1771393acd2967191. 2024-01-05 17:04:46 +00:00			`Choices: []schema.Choice{`
			`{`
			`Index: 0,`
			`FinishReason: "stop",`
			`},`
			`},`
			`Object: "text_completion",`
			`}`
			`respData, _ := json.Marshal(resp)`

			`w.WriteString(fmt.Sprintf("data: %s\n\n", respData))`
			`w.WriteString("data: [DONE]\n\n")`
			`w.Flush()`
			`}))`
			`return nil`
			`}`
refactor: backend/service split, channel-based llm flow (#1963) Refactor: channel based llm flow and services split --------- Signed-off-by: Dave Lee <dave@gray101.com> 2024-04-13 07:45:34 +00:00			`// TODO is this proper to have exclusive from Stream, or do we need to issue both responses?`
			`rawResponse := <-finalResultChannel`
			`if rawResponse.Error != nil {`
			`return rawResponse.Error`
Revert "[Refactor]: Core/API Split" (#1550) Revert "[Refactor]: Core/API Split (#1506)" This reverts commit ab7b4d5ee9448e533a342bd1771393acd2967191. 2024-01-05 17:04:46 +00:00			`}`
refactor: backend/service split, channel-based llm flow (#1963) Refactor: channel based llm flow and services split --------- Signed-off-by: Dave Lee <dave@gray101.com> 2024-04-13 07:45:34 +00:00			`jsonResult, _ := json.Marshal(rawResponse.Value)`
Revert "[Refactor]: Core/API Split" (#1550) Revert "[Refactor]: Core/API Split (#1506)" This reverts commit ab7b4d5ee9448e533a342bd1771393acd2967191. 2024-01-05 17:04:46 +00:00			`log.Debug().Msgf("Response: %s", jsonResult)`

			`// Return the prediction in the response body`
refactor: backend/service split, channel-based llm flow (#1963) Refactor: channel based llm flow and services split --------- Signed-off-by: Dave Lee <dave@gray101.com> 2024-04-13 07:45:34 +00:00			`return c.JSON(rawResponse.Value)`
Revert "[Refactor]: Core/API Split" (#1550) Revert "[Refactor]: Core/API Split (#1506)" This reverts commit ab7b4d5ee9448e533a342bd1771393acd2967191. 2024-01-05 17:04:46 +00:00			`}`
			`}`