Streaming responses от LLM в Next.js

npm init -y
npm install next@14 react react-dom

import { NextResponse } from 'next/server'

export async function GET(req: Request) {
  const encoder = new TextEncoder()
  const stream = new ReadableStream({
    start(controller) {
      controller.enqueue(encoder.encode('data: starting

'))
      let i = 0
      const interval = setInterval(() => {
        i++
        controller.enqueue(encoder.encode(`data: token-${i}

`))
        if (i >= 5) {
          controller.enqueue(encoder.encode('data: [DONE]

'))
          clearInterval(interval)
          controller.close()
        }
      }, 200) // каждые 200ms — пример
    }
  })

  return new NextResponse(stream, {
    headers: {
      'Content-Type': 'text/event-stream',
      'Cache-Control': 'no-store',
    }
  })
}

$ curl -N http://localhost:3000/api/stream
data: starting

data: token-1

data: token-2

... 
data: [DONE]

npm install ai@0.20.0

import { NextResponse } from 'next/server'
import { createClient } from 'ai'

const client = createClient({ apiKey: process.env.VERCEL_AI_API_KEY })

export async function POST(req: Request) {
  const { prompt } = await req.json()
  const encoder = new TextEncoder()

  const stream = new ReadableStream({
    async start(controller) {
      try {
        // SDK предоставляет метод stream, который вызывает onToken
        await client.stream({
          model: 'gpt-4o-mini',
          prompt,
          onToken(token) {
            controller.enqueue(encoder.encode(`data: ${token}

`))
          }
        })
        controller.enqueue(encoder.encode('data: [DONE]

'))
        controller.close()
      } catch (err) {
        controller.enqueue(encoder.encode(`data: [ERROR] ${String(err)}

`))
        controller.close()
      }
    }
  })

  return new NextResponse(stream, {
    headers: {
      'Content-Type': 'text/event-stream',
      'Cache-Control': 'no-store',
    }
  })
}

$ curl -N -X POST http://localhost:3000/api/ai-stream -d '{"prompt":"Hello\

Streaming responses от LLM в Next.js | KtoHto

Streaming responses от LLM в Next.js

Комментарии (0)

Что вы изучите

Требования

Зачем streaming?

Шаг 1: server-sent events

Шаг 2: AI SDK от Vercel