超出了服务“aiplatform.googleapis.com”的配额指标“LLM 实用程序请求”和限制“每个区域每分钟 LLM 实用程序请求”的配额

问题描述 投票:0回答:1

我正在尝试在 Micronaut 应用程序中使用 Langchain4J 来使用顶点 API 文本嵌入

@Singleton
public record VertexAiEmbedding(GoogleCloudConfiguration googleCloudConfiguration, VertexAiConfig vertexAiConfig) implements IVertexAiEmbedding {
    private static Embedding embedding;
    @Override
    public float[] embedVector(String text) {
        EmbeddingModel embeddingModel = VertexAiEmbeddingModel.builder()
                .endpoint(vertexAiConfig.endPoint())
                .project(googleCloudConfiguration.getProjectId())
                .location(vertexAiConfig.location())
                .publisher(vertexAiConfig.publisher())
                .modelName(vertexAiConfig.modelName())
                .build();
        Response<Embedding> response = embeddingModel.embed(text);
        embedding = response.content();
        return embedding.vector();
    }

例外:

Caused by: com.google.api.gax.rpc.ResourceExhaustedException: io.grpc.StatusRuntimeException: RESOURCE_EXHAUSTED: Quota exceeded for quota metric 'LLM utility requests' and limit 'LLM utility requests per minute per region' of service 'aiplatform.googleapis.com' for consumer 'project_number:974067563912'.

我正在使用 GCP 的免费试用期。

google-cloud-platform google-cloud-vertex-ai gcp-ai-platform-training langchain4j
1个回答
0
投票

这里的问题是由于免费GCP路径中配额限制的限制。根据此文档,如果您使用的是免费试用版的 GCP,则无法提出增加项目配额限制的请求。

因此,您需要创建一个计费帐户并链接到GCP计费,这样您就可以获得更少的配额限制,即使您遇到任何与配额相关的问题,您也可以提出增加配额的请求,如果您有计费帐户。

© www.soinside.com 2019 - 2024. All rights reserved.