Xilinx · tuhinp-amd · Sep 18, 2025 · Sep 18, 2025 · Sep 19, 2025 · Sep 19, 2025
diff --git a/src/Compiler/OnnxToMlirPasses.cpp b/src/Compiler/OnnxToMlirPasses.cpp
@@ -96,6 +96,9 @@ void addONNXToMLIRPasses(mlir::PassManager &pm, bool targetCPU,
   // Passes for removing redundant concat, slice and cast QDQ Ops
   if (opts.enableRemoveDqQOp)
     pm.addPass(createQDQOptONNXToONNXPass());
+  // Pass to convert conv with bias to onnx.QLinearConv
+  if (opts.enableQConvLinear)
+    pm.addPass(createConvToQLinearConvPass());
 
   // One more call to ONNX shape inference/canonicalization/... to update
   // shape if possible.

diff --git a/src/Compiler/OnnxToMlirPasses.hpp b/src/Compiler/OnnxToMlirPasses.hpp
@@ -19,6 +19,7 @@ struct OnnxToMlirOptions {
   bool enableRemoveDqQOp = true;
   bool enableRemoveDqQAroundOp = true;
   bool enableRemoveBinary = false;
+  bool enableQConvLinear = false;
 
   bool disableRecomposeOption = false;
   bool enableONNXHybridPass = true;

diff --git a/src/Dialect/ONNX/Transforms/CMakeLists.txt b/src/Dialect/ONNX/Transforms/CMakeLists.txt
@@ -44,7 +44,8 @@ add_onnx_mlir_library(OMONNXRewrite
   ConstProp.cpp
   QDQAroundOpOpt.cpp    
   QDQOpt.cpp
-  DQBinaryQOpt.cpp  
+  DQBinaryQOpt.cpp
+  QlinearConvPass.cpp  
   ConvOpt.cpp
   Decompose.cpp
   DecomposeEinsum.cpp

diff --git a/src/Dialect/ONNX/Transforms/QlinearConvPass.cpp b/src/Dialect/ONNX/Transforms/QlinearConvPass.cpp
@@ -0,0 +1,327 @@
+//===- ConvToQLinearConvPass.cpp ---------------------------------*- C++
+//-*-===//
+//
+// Convert pattern: DQ(X_q) -> DQ(W_q) -> [DQ(B_q)] -> Conv -> Q
+// into: QLinearConv
+//
+// This pass looks for the exact shape of a quantized conv subgraph and replaces
+// it with a single QLinearConv that consumes the real quantization parameters
+// already present in the graph.
+//
+
+#include "mlir/IR/PatternMatch.h"
+#include "mlir/Pass/Pass.h"
+#include "mlir/Transforms/GreedyPatternRewriteDriver.h"
+#include "src/Dialect/ONNX/ONNXOps.hpp"
+#include "src/Dialect/ONNX/ONNXOps/OpHelper.hpp"
+#include "src/Pass/Passes.hpp"
+#include <cmath>
+
+using namespace mlir;
+using namespace onnx_mlir;
+
+namespace {
+
+// ---- Helper: check scale is scalar f32 ----
+static bool isScalarF32(Value v) {
+  auto ty = v.getType().dyn_cast<RankedTensorType>();
+  if (!ty)
+    return false;
+  if (!ty.getElementType().isF32())
+    return false;
+  // Must be scalar (rank-0) or single element tensor (rank-1 with size=1)
+  if (ty.getRank() == 0)
+    return true;
+  if (ty.getRank() == 1 && ty.getDimSize(0) == 1)
+    return true;
+  return false;
+}
+
+// ---- Helper: check zero point is scalar int8/uint8 ----
+static bool isScalarI8OrU8(Value v) {
+  auto ty = v.getType().dyn_cast<RankedTensorType>();
+  if (!ty)
+    return false;
+  auto elemTy = ty.getElementType();
+  if (!(elemTy.isInteger(8) || elemTy.isUnsignedInteger(8)))
+    return false;
+  if (ty.getRank() == 0)
+    return true;
+  if (ty.getRank() == 1 && ty.getDimSize(0) == 1)
+    return true;
+  return false;
+}
+
+// ---- Helper: check tensor is int8/uint8 ----
+static bool isTensorI8OrU8(Value v) {
+  auto ty = v.getType().dyn_cast<RankedTensorType>();
+  if (!ty)
+    return false;
+  auto elemTy = ty.getElementType();
+  return elemTy.isInteger(8) || elemTy.isUnsignedInteger(8);
+}
+
+static bool extractScalarFloatFromConst(mlir::Value v, float &out) {
+  auto def = v.getDefiningOp<ONNXConstantOp>();
+  if (!def)
+    return false;
+
+  mlir::Attribute raw;
+  if (def.getValue().has_value())
+    raw = *def.getValue();
+  else
+    raw = def.getValueAttr();
+
+  if (auto elts = raw.dyn_cast<mlir::ElementsAttr>()) {
+    for (auto apf : elts.getValues<llvm::APFloat>()) {
+      out = apf.convertToFloat();
+      return true;
+    }
+    return false;
+  }
+
+  return false;
+}
+
+static mlir::DenseElementsAttr extractDenseFloatFromConst(
+    ONNXConstantOp constBiasOp, mlir::Value biasFloatValue) {
+  mlir::DenseElementsAttr denseBiasF;
+
+  if (!constBiasOp.getValue().has_value())
+    return denseBiasF; // empty, caller must check
+
+  mlir::Attribute opt = *constBiasOp.getValue();
+
+  if (auto elts = opt.dyn_cast<mlir::ElementsAttr>()) {
+    // Collect floats
+    llvm::SmallVector<float, 32> floats;
+    floats.reserve(elts.getNumElements());
+    for (auto v : elts.getValues<llvm::APFloat>())
+      floats.push_back(v.convertToFloat());
+
+    // Ensure correct tensor type shape
+    auto desiredTy =
+        biasFloatValue.getType().dyn_cast<mlir::RankedTensorType>();
+    if (!desiredTy)
+      return mlir::DenseElementsAttr(); // invalid → return empty
+
+    // Build DenseElementsAttr
+    denseBiasF =
+        mlir::DenseElementsAttr::get(desiredTy, llvm::ArrayRef<float>(floats));
+  }
+
+  return denseBiasF;
+}
+
+static llvm::SmallVector<mlir::Attribute, 32> createBiasI32Attrs(
+    mlir::DenseElementsAttr denseBiasF, double xScaleS, double wScaleS,
+    mlir::PatternRewriter &rewriter) {
+  llvm::SmallVector<mlir::Attribute, 32> biasI32Attrs;
+
+  double denom = static_cast<double>(xScaleS) * static_cast<double>(wScaleS);
+  if (denom == 0.0)
+    return biasI32Attrs; // empty, caller should check
+
+  biasI32Attrs.reserve(denseBiasF.getNumElements());
+  for (auto apf : denseBiasF.getValues<llvm::APFloat>()) {
+    double f = apf.convertToFloat();
+    double qd = std::nearbyint(f / denom);
+    int64_t qi = static_cast<int64_t>(qd);
+
+    // clamp to int32 range
+    if (qi > std::numeric_limits<int32_t>::max())
+      qi = std::numeric_limits<int32_t>::max();
+    if (qi < std::numeric_limits<int32_t>::min())
+      qi = std::numeric_limits<int32_t>::min();
+
+    biasI32Attrs.push_back(
+        rewriter.getI32IntegerAttr(static_cast<int32_t>(qi)));
+  }
+
+  return biasI32Attrs;
+}
+
+/// Pattern that matches Conv fed by DequantizeLinear(s) and consumed by
+/// QuantizeLinear.
+struct ConvToQLinearConvPattern : public OpRewritePattern<ONNXConvOp> {
+  using OpRewritePattern<ONNXConvOp>::OpRewritePattern;
+
+  LogicalResult matchAndRewrite(
+      ONNXConvOp convOp, PatternRewriter &rewriter) const override {
+    Location loc = convOp.getLoc();
+
+    // Conv input X must come from DequantizeLinear ----
+    auto dqInputOp =
+        dyn_cast_or_null<ONNXDequantizeLinearOp>(convOp.getX().getDefiningOp());
+    if (!dqInputOp) {
+      return failure();
+    }
+
+    Value qInput = dqInputOp.getX();
+    Value xScale = dqInputOp.getXScale();
+    Value xZp = dqInputOp.getXZeroPoint();
+
+    // ---- Check input type ----
+    if (!isTensorI8OrU8(qInput))
+      return failure();
+
+    // Conv weight W must come from DequantizeLinear ----
+    auto dqWeightOp =
+        dyn_cast_or_null<ONNXDequantizeLinearOp>(convOp.getW().getDefiningOp());
+    if (!dqWeightOp) {
+      return failure();
+    }
+
+    Value qWeight = dqWeightOp.getX();
+    Value wScale = dqWeightOp.getXScale();
+    Value wZp = dqWeightOp.getXZeroPoint();
+
+    if (!isTensorI8OrU8(qWeight))
+      return failure();
+
+    // Conv output consumed by QuantizeLinear (qOutOp) ----
+    if (convOp->getUsers().empty() && convOp->getNumResults() != 1)
+      return failure();
+
+    Operation *firstUser = *convOp->getUsers().begin();
+    auto qOutOp = dyn_cast<ONNXQuantizeLinearOp>(firstUser);
+    if (!qOutOp)
+      return failure();
+    Value yScale = qOutOp.getYScale();
+    Value yZp = qOutOp.getYZeroPoint();
+
+    if (!isScalarF32(xScale) || !isScalarF32(wScale) || !isScalarF32(yScale)) {
+      return failure();
+    }
+
+    if (!isScalarI8OrU8(xZp) || !isScalarI8OrU8(wZp) || !isScalarI8OrU8(yZp)) {
+      return failure();
+    }
+
+    Value biasVal = convOp.getB();
+
+    Value biasInt32Val;
+    if (!biasVal || isa<ONNXNoneOp>(biasVal.getDefiningOp())) {
+      // Case 0: No bias at all
+      biasInt32Val = Value();
+    } else {
+
+      // Conv has bias B and its defining op is DequantizeLinear
+      auto dqBiasOp = dyn_cast<ONNXDequantizeLinearOp>(biasVal.getDefiningOp());
+      if (!dqBiasOp) {
+        return failure();
+      }
+
+      Value biasQ = dqBiasOp.getX();
+      auto biasQType = biasQ.getType().dyn_cast<mlir::RankedTensorType>();
+      if (!biasQType)
+        return failure();
+
+      // Case 1: Bias is already int32 -----------------------
+      if (biasQType.getElementType().isInteger(32)) {
+        biasInt32Val = biasQ;
+      } else {
+        // Case 2: Bias is int8. float32 → quantize -----------------
+        auto qBiasOp =
+            dyn_cast<ONNXQuantizeLinearOp>(dqBiasOp.getX().getDefiningOp());
+        if (!qBiasOp) {
+          return failure();
+        }
+        // ---- Extract float bias values from qBiasOp.getX() (which points to
+        // the float constant) ----
+        Value biasFloatValue = qBiasOp.getX();
+        auto biasFloatDefOp = biasFloatValue.getDefiningOp();
+        if (!biasFloatDefOp)
+          return failure();
+
+        auto constBiasOp = dyn_cast<ONNXConstantOp>(biasFloatDefOp);
+        if (!constBiasOp)
+          return failure();
+
+        // Try to get the ElementsAttr
+        auto denseBiasF =
+            extractDenseFloatFromConst(constBiasOp, biasFloatValue);
+
+        if (!denseBiasF)
+          return failure();
+        float xScaleS = 0.0f;
+        if (!extractScalarFloatFromConst(xScale, xScaleS))
+          return failure();
+
+        float wScaleS = 0.0f;
+        if (!extractScalarFloatFromConst(wScale, wScaleS))
+          return failure();
+
+        auto biasI32Attrs =
+            createBiasI32Attrs(denseBiasF, xScaleS, wScaleS, rewriter);
+        if (biasI32Attrs.empty()) {
+          return failure();
+        }
+
+        // ---- Build tensor type for i32 bias with same shape as denseBiasF
+        // ----
+        auto biasTensorTy = denseBiasF.getType().cast<mlir::RankedTensorType>();
+        auto biasTypeI32 = mlir::RankedTensorType::get(
+            biasTensorTy.getShape(), rewriter.getIntegerType(32));
+
+        // Build DenseElementsAttr<i32> from integer attrs
+        auto denseAttrI32 =
+            mlir::DenseElementsAttr::get(biasTypeI32, biasI32Attrs);
+
+        // ---- Create ONNXConstantOp for i32 bias (pass the full argument list
+        // as required) ----
+        auto biasConstI32 = rewriter.create<ONNXConstantOp>(loc, biasTypeI32,
+            mlir::Attribute(), denseAttrI32, mlir::FloatAttr(),
+            mlir::ArrayAttr(), mlir::IntegerAttr(), mlir::ArrayAttr(),
+            mlir::StringAttr(), mlir::ArrayAttr());
+
+        biasInt32Val = biasConstI32.getResult();
+      }
+    }
+
+    // ---- Create QLinearConv: operand order:
+    SmallVector<Value, 9> qconvOperands{
+        qInput, xScale, xZp, qWeight, wScale, wZp, yScale, yZp, biasInt32Val};
+
+    Type qOutType = qOutOp.getResult().getType();
+
+    // Create QLinearConv
+    auto qconv =
+        rewriter.create<ONNXQLinearConvOp>(loc, qOutType, qconvOperands);
+
+    // Replace the QuantizeLinear (qOutOp) result with qconv result
+    rewriter.replaceOp(qOutOp, qconv.getResult());
+
+    return success();
+  }
+};
+
+/// The pass wrapper
+struct ConvToQLinearConvPass
+    : public PassWrapper<ConvToQLinearConvPass, OperationPass<func::FuncOp>> {
+
+  MLIR_DEFINE_EXPLICIT_INTERNAL_INLINE_TYPE_ID(ConvToQLinearConvPass)
+  StringRef getArgument() const override {
+    return "conv-to-qlinearconv-onnx-to-onnx";
+  }
+  StringRef getDescription() const override {
+    return "Replace Conv operation with a QlinearConv op";
+  }
+  void runOnOperation() override {
+    MLIRContext &ctx = getContext();
+    RewritePatternSet patterns(&ctx);
+    patterns.add<ConvToQLinearConvPattern>(&ctx);
+
+    if (failed(applyPatternsGreedily(getOperation(), std::move(patterns)))) {
+      signalPassFailure();
+    }
+  }
+};
+
+} // end anonymous namespace
+namespace onnx_mlir {
+// Factory to create the pass (useful for registration)
+std::unique_ptr<Pass> createConvToQLinearConvPass() {
+  return std::make_unique<ConvToQLinearConvPass>();
+}
+} // namespace onnx_mlir
diff --git a/src/Pass/Passes.hpp b/src/Pass/Passes.hpp
@@ -58,6 +58,7 @@ std::unique_ptr<mlir::Pass> createQDQAroundOpOptONNXToONNXPass();
 
 std::unique_ptr<mlir::Pass> createQDQOptONNXToONNXPass();
 std::unique_ptr<mlir::Pass> createFoldDQBinaryQPass();
+std::unique_ptr<mlir::Pass> createConvToQLinearConvPass();
 
 /// Pass for instrument the ops in specific stage.
 std::unique_ptr<mlir::Pass> createInstrumentPass();

diff --git a/src/Tools/onnx-mlir-opt/RegisterPasses.cpp b/src/Tools/onnx-mlir-opt/RegisterPasses.cpp
@@ -83,6 +83,10 @@ void registerOMPasses(int optLevel) {
     return createFoldDQBinaryQPass();
   });
 
+  mlir::registerPass([]() -> std::unique_ptr<mlir::Pass> {
+    return createConvToQLinearConvPass();
+  });
+
   mlir::registerPass(
       []() -> std::unique_ptr<mlir::Pass> { return createInstrumentPass(); });