@@ -41,12 +41,12 @@ var (
4141
4242 modelPricingRules = []modelPricingRule {
4343 {model : "gpt-5.5" , pricing : ModelPricing {
44- InputPricePerMToken : 5.0 ,
45- InputPricePerMTokenPriority : 12.5 ,
46- OutputPricePerMToken : 30.0 ,
47- OutputPricePerMTokenPriority : 75.0 ,
48- CacheReadPricePerMToken : 0.5 ,
49- CacheReadPricePerMTokenPriority : 1.25 ,
44+ InputPricePerMToken : 5.0 ,
45+ InputPricePerMTokenPriority : 12.5 ,
46+ OutputPricePerMToken : 30.0 ,
47+ OutputPricePerMTokenPriority : 75.0 ,
48+ CacheReadPricePerMToken : 0.5 ,
49+ CacheReadPricePerMTokenPriority : 1.25 ,
5050 LongInputPricePerMToken : 10.0 ,
5151 LongInputPricePerMTokenPriority : 25.0 ,
5252 LongOutputPricePerMToken : 45.0 ,
@@ -55,10 +55,10 @@ var (
5555 LongCacheReadPricePerMTokenPriority : 2.5 ,
5656 }},
5757 {model : "gpt-5.5-pro" , pricing : ModelPricing {
58- InputPricePerMToken : 30.0 ,
59- InputPricePerMTokenPriority : 75.0 ,
60- OutputPricePerMToken : 180.0 ,
61- OutputPricePerMTokenPriority : 450.0 ,
58+ InputPricePerMToken : 30.0 ,
59+ InputPricePerMTokenPriority : 75.0 ,
60+ OutputPricePerMToken : 180.0 ,
61+ OutputPricePerMTokenPriority : 450.0 ,
6262 LongInputPricePerMToken : 60.0 ,
6363 LongInputPricePerMTokenPriority : 150.0 ,
6464 LongOutputPricePerMToken : 270.0 ,
@@ -67,12 +67,12 @@ var (
6767 {model : "gpt-5.4-mini" , pricing : ModelPricing {InputPricePerMToken : 0.75 , OutputPricePerMToken : 4.5 , CacheReadPricePerMToken : 0.075 }},
6868 {model : "gpt-5.4-nano" , pricing : ModelPricing {InputPricePerMToken : 0.2 , OutputPricePerMToken : 1.25 , CacheReadPricePerMToken : 0.02 }},
6969 {model : "gpt-5.4" , pricing : ModelPricing {
70- InputPricePerMToken : 2.5 ,
71- InputPricePerMTokenPriority : 5.0 ,
72- OutputPricePerMToken : 15.0 ,
73- OutputPricePerMTokenPriority : 30.0 ,
74- CacheReadPricePerMToken : 0.25 ,
75- CacheReadPricePerMTokenPriority : 0.5 ,
70+ InputPricePerMToken : 2.5 ,
71+ InputPricePerMTokenPriority : 5.0 ,
72+ OutputPricePerMToken : 15.0 ,
73+ OutputPricePerMTokenPriority : 30.0 ,
74+ CacheReadPricePerMToken : 0.25 ,
75+ CacheReadPricePerMTokenPriority : 0.5 ,
7676 LongInputPricePerMToken : 5.0 ,
7777 LongInputPricePerMTokenPriority : 10.0 ,
7878 LongOutputPricePerMToken : 22.5 ,
@@ -81,10 +81,10 @@ var (
8181 LongCacheReadPricePerMTokenPriority : 1.0 ,
8282 }},
8383 {model : "gpt-5.4-pro" , pricing : ModelPricing {
84- InputPricePerMToken : 30.0 ,
85- InputPricePerMTokenPriority : 75.0 ,
86- OutputPricePerMToken : 180.0 ,
87- OutputPricePerMTokenPriority : 450.0 ,
84+ InputPricePerMToken : 30.0 ,
85+ InputPricePerMTokenPriority : 75.0 ,
86+ OutputPricePerMToken : 180.0 ,
87+ OutputPricePerMTokenPriority : 450.0 ,
8888 LongInputPricePerMToken : 60.0 ,
8989 LongInputPricePerMTokenPriority : 150.0 ,
9090 LongOutputPricePerMToken : 270.0 ,
@@ -326,7 +326,8 @@ func geminiFamilyPricing(model string) *ModelPricing {
326326}
327327
328328func usePriorityPricing (serviceTier string , pricing * ModelPricing ) bool {
329- if normalizeServiceTier (serviceTier ) != "priority" {
329+ tier := normalizeServiceTier (serviceTier )
330+ if tier != "priority" && tier != "fast" {
330331 return false
331332 }
332333 return pricing .InputPricePerMTokenPriority > 0 ||
@@ -336,8 +337,6 @@ func usePriorityPricing(serviceTier string, pricing *ModelPricing) bool {
336337
337338func serviceTierCostMultiplier (serviceTier string ) float64 {
338339 switch normalizeServiceTier (serviceTier ) {
339- case "priority" :
340- return 2.0
341340 case "flex" :
342341 return 0.5
343342 default :
0 commit comments