【TVM模型编译】1. onnx2relay.md
阅读原文时间:2023年07月31日阅读:2

上一篇介绍了onnx模型在tvm中优化的总体流程。

在这一篇中,介绍onnx模型到relay模型的转换流程,主要涉及了以下几个方面:

  • onnx算子到relay算子转换
  • relay算子实现

这一篇介绍onnx算子到relay算子转换过程

# onnx -> relay
mod, params = relay.frontend.from_onnx(onnx_model, shape_dict)

这部分实现是在python/tvm/relay/frontend/onnx.py中。实现转换过程的核心在于GraphProto这个类。这个类中实现了读取onnx模型各个节点、输入输出,映射onnx算子到relay IR的过程。对外接口为from_onnx这个函数。其伪代码可以大致表示为

def from_onnx(self, graph, opset, get_output_expr=False):
    inputs, params = read_model_inputs(graph) # 模型参数
    nodes = read_model_node(graph) # 模型节点、算子信息
    convert_map = _get_convert_map(opset) # 模型转换map
    check_op_support(nodes, convert_map)
    for node in nodes:
        op = self._convert_operator(op_name, inputs, attr, opset)
    return

从这里可以知道ONNX前端的每个算子转化与_get_convert_map有关。

_convert_operator完成了算子转换过程。具体的convert_map包含了所有支持算子的转换函数。

def _convert_operator(self, op_name, inputs, attrs, opset):
    convert_map = _get_convert_map(opset)
    if op_name in _identity_list: # 对onnx这里是空的
        sym = get_relay_op(op_name)(*inputs, **attrs)
    elif op_name in convert_map:
        sym = convert_map[op_name](inputs, attrs, self._params)
    else:
        raise NotImplementedError("Operator {} not implemented.".format(op_name))
    return sym

以卷积算子为例,介绍具体的转换过程:

"Conv": Conv.get_converter(opset)

Conv算子的实际转换操作来自于

class Conv(OnnxOpConverter):
    """Operator converter for Conv."""
    @classmethod
    def _impl_v1(cls, inputs, attr, params):
        # Use shape of input to determine convolution type.
        data = inputs[0]
        input_shape = infer_shape(data)
        ndim = len(input_shape)
        # auto_pad ...

        # construct op from attrs
        out = AttrCvt(
            op_name=dimension_picker("conv"),
            transforms={
                "kernel_shape": "kernel_size",
                "dilations": ("dilation", 1),
                "pads": ("padding", 0),
                "group": ("groups", 1),
            },
            custom_check=dimension_constraint(),
        )([data, inputs[1]], attr, params)

        use_bias = len(inputs) == 3
        if use_bias:
            out = _op.nn.bias_add(out, inputs[2])
        return out

这里通过AttrCvt类中构建相应的relay算子,python/tvm/relay/frontend/common.py

AttrCvt类包括两部分,__init____call__,前者根据收集初始化参数,后者完成Relay IR算子构建。

__call__中的实现主要完成了算子属性读取、转换。根据转换后输入构建Relay IR

return get_relay_op(op_name)(*inputs, **new_attrs)

手机扫一扫

移动阅读更方便

阿里云服务器
腾讯云服务器
七牛云服务器