Filtering Approaches for Real-Time Anti-Aliasing（2011 SIGGRAPH）

在2011的SIGGRAPH上，NVIDA提出了FXAA3.1，本文主要介绍FXAA实现思路，提供部分简单实现的代码。

Fast approXimate Anti-Aliasing
- Two algorithms
  - FXAA 3.11 Console (360 and PS3)
  - FXAA 3.11 Quality (PC)
Fixed set of constraints
- One shader pass, only color input, only color output
- Run on all APIs (GL, DX9, through DX11, etc)
- Certainly better can be done under other constraints!

FXAA全称“Fast Approximate Anti-Aliasing”,翻译成中文就是“快速近似抗锯齿”。

FXAA3.11在之前FXAA1，2的基础上做了一些改进。

FXAA1：最早最基础的版本，也是在PC游戏中使用最广泛的，已用于《孤岛危机2》、《无主之地》。
FXAA2：针对Xbox 360游戏机专门设计。
FXAA3：Quality质量版本面向PC，Console主机版本则面向Xbox 360、PS3。

FXAA是一种单程像素着色器，和MLAA一样运行于目标游戏渲染管线的后期处理阶段，但不像后者那样使用DirectCompute，而只是单纯的后期处理着色器，不依赖于任何GPU计算API。正因为如此，FXAA技术对显卡没有特殊要求，完全兼容NVIDIA、AMD的不同显卡(MLAA仅支持A卡)和DX9、DX10、DX11。

Early exit for pixels

取4个方向以及中间像素，对5个位置的值做滤波操作，对于范围之外进行分段线性变换。对于差异较大的像素，进行AA。

maxLuma = max(nw,ne,sw,se)
contrast = max(nw,ne,sw,se,m) - min(nw,ne,sw,se,m)
if(contrast  >= max(minThreshold, maxLuma * threshold))

extra taps

dir.x = -((NW+NE)-(SW+SE))
dir.y = ((NW+SW)-(NE+SE))
dir.xy = normalize(dir.xy) * scale

使用2x2的区域，计算像素边界，做向量运算。得到dir之后归一化长度。

Optional extra 2 taps

缩放dir.xy,扩展到8个像素

minDir = min(|dir.x|, |dir.y|) * sharpness

Compare 4-tap filter luma to neighborhood luma

比较4个方向的luma和相邻luma的值，

// Use the min and max luma range of the original 4 samples
- {NW, NE, SW, SE}
  // If 4-tap filter luma exceeds this range,
- Assume invalid and use just the first 2 taps

效果展示

我自己再Direct11的环境下，参考FXAA思路，实现了简单版本的FXAA，相比自带d3d实现的4xMSAA，效果较为不明显，仅供交流学习。

//--------------------------------------------------------------------------------------
// File: FXAA.fx
//--------------------------------------------------------------------------------------

SamplerState samLinear : register(s0);
Texture2D txFxaa : register(t0);

struct PS_INPUT
{
    float4 Pos          : SV_POSITION;
    float4 PosProj      : POSITION;
    float3 Norm         : NORMAL;

    float4 Diffuse      : COLOR0;
    float2 Tex          : TEXCOORD;
    float3 Tangent      : TANGENT;
};

float4 FxaaPS(PS_INPUT input) : SV_Target
{
    float4 texColor = txFxaa.Sample(samLinear, input.Tex);

    // FXAA 3x3取9个像素
    float3 luma = float3(0.299, 0.587, 0.114);
    //luma = float3(0.33, 0.33, 0.33);
    float lumaTL = dot(luma, txFxaa.Sample(samLinear, input.Tex.xy + float2(-1.0, -1.0)).xyz);
    float lumaTR = dot(luma, txFxaa.Sample(samLinear, input.Tex.xy + float2(1.0, -1.0)).xyz);
    float lumaBL = dot(luma, txFxaa.Sample(samLinear, input.Tex.xy + float2(-1.0, 1.0)).xyz);
    float lumaBR = dot(luma, txFxaa.Sample(samLinear, input.Tex.xy + float2(1.0, 1.0)).xyz);
    float lumaM = dot(luma, txFxaa.Sample(samLinear, input.Tex.xy).xyz);

    float2 dir;
    dir.x = -((lumaTL + lumaTR) - (lumaBL + lumaBR));
    dir.y = (lumaTL + lumaBL) - (lumaTR + lumaBR);

    float FXAA_SPAN_MAX = 8.0;

    float direReduce = 1.0 / 128.0;
    float inverseDir = 1.0 / (min(abs(dir.x), abs(dir.y)) + direReduce);

    dir = min(float2(FXAA_SPAN_MAX, FXAA_SPAN_MAX),
        max(float2(-FXAA_SPAN_MAX, -FXAA_SPAN_MAX), dir*inverseDir));

    float3 res1 = (1.0 / 2.0) * (
        txFxaa.Sample(samLinear, input.Tex.xy + (dir * float2(1.0 / 3.0 - 0.5, 1.0 / 3.0 - 0.5))).xyz +
        txFxaa.Sample(samLinear, input.Tex.xy + (dir * float2(2.0 / 3.0 - 0.5, 2.0 / 3.0 - 0.5))).xyz);

    float3 res2 = res1 * (1.0 / 2.0) + (1.0 / 4.0) * (
        txFxaa.Sample(samLinear, input.Tex.xy + (dir * float2(0.0 / 3.0 - 0.5, 0.0 / 3.0 - 0.5))).xyz +
        txFxaa.Sample(samLinear, input.Tex.xy + (dir * float2(3.0 / 3.0 - 0.5, 3.0 / 3.0 - 0.5))).xyz);

    float lumaRes = dot(luma, res2);

    float lumaMin = min(lumaM, min(min(lumaTL, lumaTR), min(lumaBL, lumaBR)));
    float lumaMax = max(lumaM, max(max(lumaTL, lumaTR), max(lumaBL, lumaBR)));

    if (lumaRes <lumaMin || lumaRes > lumaMax)
        texColor = float4(res2, 1.0);
    else
        texColor = float4(res1, 1.0);

    return texColor;
}

效果对比（左为无FXAA）

手机扫一扫

移动阅读更方便

你可能感兴趣的文章