AWS为Bedrock引入提示缓存与智能路由，降低大模型使用成本

2024年12月05日来源：techcrunch分类：科技

AWS在其Bedrock大语言模型（LLM）托管服务中新增提示缓存和智能路由功能，旨在帮助企业在生成式AI的生产环境中降低运营成本。提示缓存可减少重复处理成本高达90%，同时降低响应时间高达85%。智能路由功能则通过分析查询复杂度，将简单请求分配给更经济高效的小型模型，从而实现性能与成本的平衡。此外，AWS推出Bedrock专用模型市场，支持企业接入数百种新兴和专业模型，为生成式AI的实际应用提供更大灵活性和选择空间。

支持率<5%