Ist es in Bayern normal, dass zwei Frauen an der Schulter zusammen gewachsen sind, sechs Finger an einer Hand haben und trotzdem ein Bierglas nicht so festhalten können, dass es eigentlich runterfallen müsste?

  • barsoap@lemm.ee
    link
    fedilink
    arrow-up
    3
    ·
    edit-2
    9 months ago

    https://stablediffusionxl.com/sdxl-resolutions-and-aspect-ratios/

    LoRAs sind kein Problem, die werden in’s Modell reingerechnet bevor die Inferenz startet. ControlNet kommt drauf an das kann schon kritisch werden, wirst aber t2i-Adapter finden. Die werden auch vorher reingerechnet und sind daher auch schneller – auch nicht so genau aber wer benutzt schon Controlnet mit hohem Gewicht.

    Wenn VRAM gerade fragmentiert ist kann es sein dass du zwingend die tiled VAE decode node nutzen musst, mit sehr niedriger Auflösung.

    Was bei mir mit SDXL im Moment nicht geht sind sehr hohe Auflösungen dazu fehlt noch ControlNet tile.

    Ich schließe daher daraus: wenn man sowas ernsthaft einsetzen möchte, wird man unter 12+ Gigs nicht weit kommen.

    Da ist schon was dran denn mit 4G kann man definitiv nicht trainieren.