Gitlab 现已全面支持 git over ssh 与 git over https。通过 HTTPS 访问请配置带有 read_repository / write_repository 权限的 Personal access token。通过 SSH 端口访问请使用 22 端口或 13389 端口。如果使用CAS注册了账户但不知道密码，可以自行至设置中更改；如有其他问题，请发邮件至 service@cra.moe 寻求协助。

Unverified Commit 03c8eefb authored Mar 25, 2023 by AUTOMATIC1111 Committed by GitHub Mar 25, 2023

Merge pull request #8782 from FNSpd/master

--upcast-sampling support for CUDA

parents b0b777e6 a9eab236

extensions-builtin/Lora/lora.py

+1 −0

Original line number	Diff line number	Diff line
		@@ -178,6 +178,7 @@ def load_loras(names, multipliers=None):


		def lora_forward(module, input, res):
		input = devices.cond_cast_unet(input)
		if len(loaded_loras) == 0:
		return res

modules/sd_hijack_optimizations.py

+2 −2

Original line number	Diff line number	Diff line
		@@ -337,7 +337,7 @@ def xformers_attention_forward(self, x, context=None, mask=None):

		dtype = q.dtype
		if shared.opts.upcast_attn:
		q, k = q.float(), k.float()
		q, k, v = q.float(), k.float(), v.float()

		out = xformers.ops.memory_efficient_attention(q, k, v, attn_bias=None, op=get_xformers_flash_attention_op(q, k, v))

		@@ -372,7 +372,7 @@ def scaled_dot_product_attention_forward(self, x, context=None, mask=None):

		dtype = q.dtype
		if shared.opts.upcast_attn:
		q, k = q.float(), k.float()
		q, k, v = q.float(), k.float(), v.float()

		# the output of sdp = (batch, num_heads, seq_len, head_dim)
		hidden_states = torch.nn.functional.scaled_dot_product_attention(

modules/sd_hijack_unet.py

+1 −1

Original line number	Diff line number	Diff line
		@@ -67,7 +67,7 @@ def hijack_ddpm_edit():
		unet_needs_upcast = lambda args, *kwargs: devices.unet_needs_upcast
		CondFunc('ldm.models.diffusion.ddpm.LatentDiffusion.apply_model', apply_model, unet_needs_upcast)
		CondFunc('ldm.modules.diffusionmodules.openaimodel.timestep_embedding', lambda orig_func, timesteps, args, kwargs: orig_func(timesteps, args, **kwargs).to(torch.float32 if timesteps.dtype == torch.int64 else devices.dtype_unet), unet_needs_upcast)
		if version.parse(torch.__version__) <= version.parse("1.13.1"):
		if version.parse(torch.__version__) <= version.parse("1.13.2") or torch.cuda.is_available():
		CondFunc('ldm.modules.diffusionmodules.util.GroupNorm32.forward', lambda orig_func, self, args, kwargs: orig_func(self.float(), args, **kwargs), unet_needs_upcast)
		CondFunc('ldm.modules.attention.GEGLU.forward', lambda orig_func, self, x: orig_func(self.float(), x.float()).to(devices.dtype_unet), unet_needs_upcast)
		CondFunc('open_clip.transformer.ResidualAttentionBlock.__init__', lambda orig_func, args, kwargs: kwargs.update({'act_layer': GELUHijack}) and False or orig_func(args, *kwargs), lambda _, args, **kwargs: kwargs.get('act_layer') is None or kwargs['act_layer'] == torch.nn.GELU)

CRA Git | Maintained and supported by SUSTech CRA and CCSE