我有一个谷歌云计算大型部署,有几个表和几个读取/写入的工作。有一段时间,有人会开始一项工作,这会占用大部分可用带宽,而其他工作则无法访问bigtable。
有没有办法我可以指定每个作业的qps限制或优先级,以便一个作业不使用所有的带宽或CPU?
Cloud Bigtable不支持每个作业的QPS限制。但是,我们现在支持Replication,它可以帮助将工作负载分离和隔离到不同的群集中,以避免批量查询影响实时服务流量。您可以创建具有多个不同大小的群集的设置,并使用application profiles指导各个查询组的路由方式。
您可以配置不同的作业以使用具有不同路由策略的不同应用程序配置文件
对于速率限制和其他复杂的工作和客户端管理,我建议您查看Istio,它可以帮助您将这些类型的策略应用于您的工作负载。