stable-diffusion-webui/modules/sd_hijack_unet.py

import torch
from packaging import version

from modules import devices
from modules.sd_hijack_utils import CondFunc


class TorchHijackForUnet:
    """
    This is torch, but with cat that resizes tensors to appropriate dimensions if they do not match;
    this makes it possible to create pictures with dimensions that are multiples of 8 rather than 64
    """

    def __getattr__(self, item):
        if item == 'cat':
            return self.cat

        if hasattr(torch, item):
            return getattr(torch, item)

        raise AttributeError("'{}' object has no attribute '{}'".format(type(self).__name__, item))

    def cat(self, tensors, *args, **kwargs):
        if len(tensors) == 2:
            a, b = tensors
            if a.shape[-2:] != b.shape[-2:]:
                a = torch.nn.functional.interpolate(a, b.shape[-2:], mode="nearest")

            tensors = (a, b)

        return torch.cat(tensors, *args, **kwargs)


th = TorchHijackForUnet()


# Below are monkey patches to enable upcasting a float16 UNet for float32 sampling
def apply_model(orig_func, self, x_noisy, t, cond, **kwargs):
    for y in cond.keys():
        cond[y] = [x.to(devices.dtype_unet) if isinstance(x, torch.Tensor) else x for x in cond[y]]
    with devices.autocast():
        return orig_func(self, x_noisy.to(devices.dtype_unet), t.to(devices.dtype_unet), cond, **kwargs).float()

class GELUHijack(torch.nn.GELU, torch.nn.Module):
    def __init__(self, *args, **kwargs):
        torch.nn.GELU.__init__(self, *args, **kwargs)
    def forward(self, x):
        if devices.unet_needs_upcast:
            return torch.nn.GELU.forward(self.float(), x.float()).to(devices.dtype_unet)
        else:
            return torch.nn.GELU.forward(self, x)

unet_needs_upcast = lambda *args, **kwargs: devices.unet_needs_upcast
CondFunc('ldm.models.diffusion.ddpm.LatentDiffusion.apply_model', apply_model, unet_needs_upcast)
CondFunc('ldm.modules.diffusionmodules.openaimodel.timestep_embedding', lambda orig_func, *args, **kwargs: orig_func(*args, **kwargs).to(devices.dtype_unet), unet_needs_upcast)
if version.parse(torch.__version__) <= version.parse("1.13.1"):
    CondFunc('ldm.modules.diffusionmodules.util.GroupNorm32.forward', lambda orig_func, self, *args, **kwargs: orig_func(self.float(), *args, **kwargs), unet_needs_upcast)
    CondFunc('ldm.modules.attention.GEGLU.forward', lambda orig_func, self, x: orig_func(self.float(), x.float()).to(devices.dtype_unet), unet_needs_upcast)
    CondFunc('open_clip.transformer.ResidualAttentionBlock.__init__', lambda orig_func, *args, **kwargs: kwargs.update({'act_layer': GELUHijack}) and False or orig_func(*args, **kwargs), lambda _, *args, **kwargs: kwargs.get('act_layer') is None or kwargs['act_layer'] == torch.nn.GELU)
do not replace entire unet for the resolution hack 2022-12-10 06:14:30 +00:00			`import torch`
Add option for float32 sampling with float16 UNet This also handles type casting so that ROCm and MPS torch devices work correctly without --no-half. One cast is required for deepbooru in deepbooru_model.py, some explicit casting is required for img2img and inpainting. depth_model can't be converted to float16 or it won't work correctly on some systems (it's known to have issues on MPS) so in sd_models.py model.depth_model is removed for model.half(). 2023-01-25 04:51:45 +00:00			`from packaging import version`

			`from modules import devices`
			`from modules.sd_hijack_utils import CondFunc`
do not replace entire unet for the resolution hack 2022-12-10 06:14:30 +00:00

			`class TorchHijackForUnet:`
			`"""`
			`This is torch, but with cat that resizes tensors to appropriate dimensions if they do not match;`
Fix various typos 2022-12-15 02:01:32 +00:00			`this makes it possible to create pictures with dimensions that are multiples of 8 rather than 64`
do not replace entire unet for the resolution hack 2022-12-10 06:14:30 +00:00			`"""`

			`def __getattr__(self, item):`
			`if item == 'cat':`
			`return self.cat`

			`if hasattr(torch, item):`
			`return getattr(torch, item)`

			`raise AttributeError("'{}' object has no attribute '{}'".format(type(self).__name__, item))`

			`def cat(self, tensors, args, *kwargs):`
			`if len(tensors) == 2:`
			`a, b = tensors`
			`if a.shape[-2:] != b.shape[-2:]:`
			`a = torch.nn.functional.interpolate(a, b.shape[-2:], mode="nearest")`

			`tensors = (a, b)`

			`return torch.cat(tensors, args, *kwargs)`


			`th = TorchHijackForUnet()`
Add option for float32 sampling with float16 UNet This also handles type casting so that ROCm and MPS torch devices work correctly without --no-half. One cast is required for deepbooru in deepbooru_model.py, some explicit casting is required for img2img and inpainting. depth_model can't be converted to float16 or it won't work correctly on some systems (it's known to have issues on MPS) so in sd_models.py model.depth_model is removed for model.half(). 2023-01-25 04:51:45 +00:00

			`# Below are monkey patches to enable upcasting a float16 UNet for float32 sampling`
			`def apply_model(orig_func, self, x_noisy, t, cond, **kwargs):`
			`for y in cond.keys():`
			`cond[y] = [x.to(devices.dtype_unet) if isinstance(x, torch.Tensor) else x for x in cond[y]]`
			`with devices.autocast():`
			`return orig_func(self, x_noisy.to(devices.dtype_unet), t.to(devices.dtype_unet), cond, **kwargs).float()`

			`class GELUHijack(torch.nn.GELU, torch.nn.Module):`
			`def __init__(self, args, *kwargs):`
			`torch.nn.GELU.__init__(self, args, *kwargs)`
			`def forward(self, x):`
			`if devices.unet_needs_upcast:`
			`return torch.nn.GELU.forward(self.float(), x.float()).to(devices.dtype_unet)`
			`else:`
			`return torch.nn.GELU.forward(self, x)`

			`unet_needs_upcast = lambda args, *kwargs: devices.unet_needs_upcast`
			`CondFunc('ldm.models.diffusion.ddpm.LatentDiffusion.apply_model', apply_model, unet_needs_upcast)`
			`CondFunc('ldm.modules.diffusionmodules.openaimodel.timestep_embedding', lambda orig_func, args, kwargs: orig_func(args, **kwargs).to(devices.dtype_unet), unet_needs_upcast)`
			`if version.parse(torch.__version__) <= version.parse("1.13.1"):`
			`CondFunc('ldm.modules.diffusionmodules.util.GroupNorm32.forward', lambda orig_func, self, args, kwargs: orig_func(self.float(), args, **kwargs), unet_needs_upcast)`
			`CondFunc('ldm.modules.attention.GEGLU.forward', lambda orig_func, self, x: orig_func(self.float(), x.float()).to(devices.dtype_unet), unet_needs_upcast)`
			`CondFunc('open_clip.transformer.ResidualAttentionBlock.__init__', lambda orig_func, args, kwargs: kwargs.update({'act_layer': GELUHijack}) and False or orig_func(args, *kwargs), lambda _, args, **kwargs: kwargs.get('act_layer') is None or kwargs['act_layer'] == torch.nn.GELU)`