CodeLinaro
diff --git a/‎google-bert-bert-base-multilingual-cased/aitk/bert-base-multilingual-cased_qnn_gpu.json‎
Lines changed: 95 additions & 0 deletions b/‎google-bert-bert-base-multilingual-cased/aitk/bert-base-multilingual-cased_qnn_gpu.json‎
Lines changed: 95 additions & 0 deletions
diff --git a/‎google-bert-bert-base-multilingual-cased/aitk/bert-base-multilingual-cased_qnn_gpu.json.config‎
Lines changed: 38 additions & 0 deletions b/‎google-bert-bert-base-multilingual-cased/aitk/bert-base-multilingual-cased_qnn_gpu.json.config‎
Lines changed: 38 additions & 0 deletions
diff --git a/‎google-bert-bert-base-multilingual-cased/aitk/info.yml‎
Lines changed: 3 additions & 0 deletions b/‎google-bert-bert-base-multilingual-cased/aitk/info.yml‎
Lines changed: 3 additions & 0 deletions
diff --git a/‎google-vit-base-patch16-224/aitk/info.yml‎
Lines changed: 3 additions & 0 deletions b/‎google-vit-base-patch16-224/aitk/info.yml‎
Lines changed: 3 additions & 0 deletions
diff --git a/‎google-vit-base-patch16-224/aitk/vit-base-patch16-224_qnn_gpu.json‎
Lines changed: 95 additions & 0 deletions b/‎google-vit-base-patch16-224/aitk/vit-base-patch16-224_qnn_gpu.json‎
Lines changed: 95 additions & 0 deletions
diff --git a/‎google-vit-base-patch16-224/aitk/vit-base-patch16-224_qnn_gpu.json.config‎
Lines changed: 38 additions & 0 deletions b/‎google-vit-base-patch16-224/aitk/vit-base-patch16-224_qnn_gpu.json.config‎
Lines changed: 38 additions & 0 deletions
diff --git a/‎intel-bert-base-uncased-mrpc/aitk/bert_qnn_gpu.json‎
Lines changed: 103 additions & 0 deletions b/‎intel-bert-base-uncased-mrpc/aitk/bert_qnn_gpu.json‎
Lines changed: 103 additions & 0 deletions
@@ -0,0 +1,95 @@
+{
+    "input_model": {
+        "type": "HfModel",
+        "model_path": "google-bert/bert-base-multilingual-cased",
+        "task": "feature-extraction",
+        "io_config": {
+            "input_names": [
+                "input_ids",
+                "attention_mask",
+                "token_type_ids"
+            ],
+            "input_shapes": [
+                [
+                    1,
+                    128
+                ],
+                [
+                    1,
+                    128
+                ],
+                [
+                    1,
+                    128
+                ]
+            ],
+            "input_types": [
+                "int64",
+                "int64",
+                "int64"
+            ],
+            "output_names": [
+                "last_hidden_state"
+            ]
+        }
+    },
+    "systems": {
+        "target_system": {
+            "type": "LocalSystem",
+            "accelerators": [
+                {
+                    "device": "gpu",
+                    "execution_providers": [
+                        "QNNExecutionProvider"
+                    ]
+                }
+            ]
+        }
+    },
+    "data_configs": [
+        {
+            "name": "quantization_data_config",
+            "type": "HuggingfaceContainer",
+            "load_dataset_config": {
+                "data_name": "facebook/xnli",
+                "subset": "en",
+                "split": "validation"
+            },
+            "pre_process_data_config": {
+                "input_cols": [
+                    "premise"
+                ],
+                "padding": "max_length",
+                "max_length": 128,
+                "max_samples": 10
+            },
+            "dataloader_config": {
+                "batch_size": 1
+            }
+        },
+        {
+            "name": "evaluation_data_config",
+            "type": "HuggingfaceContainer",
+            "load_dataset_config": {
+                "data_name": "facebook/xnli",
+                "subset": "en",
+                "split": "validation"
+            },
+            "pre_process_data_config": {
+                "input_cols": [
+                    "premise"
+                ],
+                "padding": "max_length",
+                "max_length": 128,
+                "max_samples": 10
+            },
+            "dataloader_config": {
+                "batch_size": 1
+            }
+        }
+    ],
+    "target": "target_system",
+    "cache_dir": "cache",
+    "output_dir": "model/google_bert",
+    "evaluate_input_model": false
+}
@@ -0,0 +1,38 @@
+{
+    "name": "Convert to Qualcomm GPU",
+    "oliveFile": "bert/qnn/google_bert_qnn_gpu.json",
+    "runtime": {
+        "autoGenerated": true,
+        "name": "Evaluate on",
+        "type": "enum",
+        "displayNames": [
+            "Qualcomm GPU",
+            "CPU"
+        ],
+        "path": "systems.target_system.accelerators.0.execution_providers.0",
+        "values": [
+            "QNNExecutionProvider",
+            "CPUExecutionProvider"
+        ],
+        "readOnly": false
+    },
+    "sections": [
+        {
+            "autoGenerated": true,
+            "name": "Convert",
+            "phase": "Conversion",
+            "parameters": [],
+            "toggle": {
+                "autoGenerated": true,
+                "name": "Convert to ONNX format",
+                "type": "bool",
+                "path": "passes.conversion",
+                "actions": [
+                    [],
+                    []
+                ],
+                "readOnly": true
+            }
+        }
+    ]
+}
@@ -23,6 +23,9 @@ recipes:
     - file: "bert-base-multilingual-cased_migraphx.json"
       device: gpu
       ep: MIGraphXExecutionProvider
+    - file: "bert-base-multilingual-cased_qnn_gpu.json"
+      device: gpu
+      ep: QNNExecutionProvider
 aitk:
     modelInfo:
         id: "huggingface/google-bert/bert-base-multilingual-cased"
 
@@ -23,6 +23,9 @@ recipes:
     - file: "vit-base-patch16-224_migraphx.json"
       device: gpu
       ep: MIGraphXExecutionProvider
+    - file: "vit-base-patch16-224_qnn_gpu.json"
+      device: gpu
+      ep: QNNExecutionProvider
 aitk:
     modelInfo:
         id: "huggingface/google/vit-base-patch16-224"
 
@@ -0,0 +1,95 @@
+{
+    "input_model": {
+        "type": "HfModel",
+        "model_path": "google/vit-base-patch16-224",
+        "task": "image-classification",
+        "io_config": {
+            "input_names": [
+                "pixel_values"
+            ],
+            "input_shapes": [
+                [
+                    1,
+                    3,
+                    224,
+                    224
+                ]
+            ],
+            "output_names": [
+                "output"
+            ]
+        }
+    },
+    "systems": {
+        "target_system": {
+            "type": "LocalSystem",
+            "accelerators": [
+                {
+                    "device": "gpu",
+                    "execution_providers": [
+                        "QNNExecutionProvider"
+                    ]
+                }
+            ]
+        }
+    },
+    "data_configs": [
+        {
+            "name": "quantize_data_config",
+            "type": "HuggingfaceContainer",
+            "user_script": "vit-base-patch16-224.py",
+            "load_dataset_config": {
+                "data_name": "timm/mini-imagenet",
+                "split": "train",
+                "streaming": true,
+                "trust_remote_code": true
+            },
+            "pre_process_data_config": {
+                "type": "dataset_pre_process",
+                "size": 256,
+                "cache_key": "imagedata_quantization"
+            },
+            "post_process_data_config": {
+                "type": "dataset_post_process"
+            }
+        },
+        {
+            "name": "evaluation_data_config",
+            "type": "HuggingfaceContainer",
+            "user_script": "vit-base-patch16-224.py",
+            "load_dataset_config": {
+                "data_name": "timm/mini-imagenet",
+                "split": "validation",
+                "streaming": true,
+                "trust_remote_code": true
+            },
+            "pre_process_data_config": {
+                "type": "dataset_pre_process",
+                "size": 1000,
+                "cache_key": "imagedata_evaluation"
+            },
+            "post_process_data_config": {
+                "type": "dataset_post_process"
+            }
+        }
+    ],
+    "passes": {
+        "conversion": {
+            "type": "OnnxConversion",
+            "target_opset": 20,
+            "save_as_external_data": true
+        },
+        "surgery": {
+            "type": "GraphSurgeries",
+            "surgeries": [
+                {
+                    "surgeon": "MatMulAddToGemm"
+                }
+            ]
+        }
+    },
+    "target": "target_system",
+    "output_dir": "model/vit",
+    "evaluate_input_model": false,
+    "cache_dir": "cache"
+}
@@ -0,0 +1,38 @@
+{
+    "name": "Convert to Qualcomm GPU",
+    "oliveFile": "vit/qnn/vit_qnn_gpu.json",
+    "runtime": {
+        "autoGenerated": true,
+        "name": "Evaluate on",
+        "type": "enum",
+        "displayNames": [
+            "Qualcomm GPU",
+            "CPU"
+        ],
+        "path": "systems.target_system.accelerators.0.execution_providers.0",
+        "values": [
+            "QNNExecutionProvider",
+            "CPUExecutionProvider"
+        ],
+        "readOnly": false
+    },
+    "sections": [
+        {
+            "autoGenerated": true,
+            "name": "Convert",
+            "phase": "Conversion",
+            "parameters": [],
+            "toggle": {
+                "autoGenerated": true,
+                "name": "Convert to ONNX format",
+                "type": "bool",
+                "path": "passes.conversion",
+                "actions": [
+                    [],
+                    []
+                ],
+                "readOnly": true
+            }
+        }
+    ]
+}
@@ -0,0 +1,103 @@
+{
+    "input_model": {
+        "type": "HfModel",
+        "model_path": "Intel/bert-base-uncased-mrpc",
+        "task": "text-classification",
+        "load_kwargs": {
+            "attn_implementation": "eager"
+        }
+    },
+    "systems": {
+        "local_system": {
+            "type": "LocalSystem",
+            "accelerators": [
+                {
+                    "device": "gpu",
+                    "execution_providers": [
+                        "QNNExecutionProvider"
+                    ]
+                }
+            ]
+        }
+    },
+    "data_configs": [
+        {
+            "name": "glue_mrpc",
+            "type": "HuggingfaceContainer",
+            "load_dataset_config": {
+                "data_name": "glue",
+                "subset": "mrpc",
+                "split": "validation"
+            },
+            "pre_process_data_config": {
+                "max_length": 128,
+                "padding": "max_length",
+                "input_cols": [
+                    "sentence1",
+                    "sentence2"
+                ],
+                "max_samples": 100
+            },
+            "dataloader_config": {
+                "batch_size": 1
+            }
+        },
+        {
+            "name": "glue_mrpc_eval",
+            "type": "HuggingfaceContainer",
+            "load_dataset_config": {
+                "data_name": "glue",
+                "subset": "mrpc",
+                "split": "validation"
+            },
+            "pre_process_data_config": {
+                "max_length": 128,
+                "padding": "max_length",
+                "input_cols": [
+                    "sentence1",
+                    "sentence2"
+                ],
+                "max_samples": 100
+            },
+            "dataloader_config": {
+                "batch_size": 1
+            }
+        }
+    ],
+    "passes": {
+        "conversion": {
+            "type": "OnnxConversion",
+            "target_opset": 20,
+            "save_as_external_data": true
+        },
+        "onnx_simplify": {
+            "type": "OnnxPeepholeOptimizer"
+        },
+        "dynamic_shape_to_fixed": {
+            "type": "DynamicToFixedShape",
+            "dim_param": [
+                "batch_size",
+                "sequence_length"
+            ],
+            "dim_value": [
+                1,
+                128
+            ]
+        },
+        "surgery": {
+            "type": "GraphSurgeries",
+            "surgeries": [
+                {
+                    "surgeon": "ReplaceAttentionMaskValue"
+                },
+                {
+                    "surgeon": "MatMulAddToGemm"
+                }
+            ]
+        }
+    },
+    "evaluate_input_model": false,
+    "target": "local_system",
+    "cache_dir": "cache",
+    "output_dir": "model/bert_ptq_qnn"
+}