- Halfvet
- Posts
- Halfvet #97 – How to... Text2img
Halfvet #97 – How to... Text2img
KICKOFF
Glove made of liquid mercury, floating in a beautiful forest, digital art, golden hour, octane render, hyperrealistic, enhanced quality, immense detail (Midjourney)
Als er één nieuwe techniek is waar ik dit jaar niet op uitgekeken raakte, dan is het text-to-image. Elke keer word je weer verrast en er is nog zoveel te ontdekken. Het voelt magisch om een algoritme dat uit een paar GB aan code bestaat zo creatief te zien.
En de ontwikkelingen lijken exponentieel te gaan. Een paar dagen geleden kwam versie 4 van Midjourney uit, dat weer een grote stap in kwaliteit vooruit is. Het is nu wachten op de public release van Google Imagen; dat zal de vierde grote speler worden.
Om m'n enthousiasme te kanaliseren, heb ik een kleine, praktische guide gemaakt voor iedereen die ook aan de slag wil met text2img. Want uiteindelijk moet je gewoon zelf ontdekken wat het bijzonder maakt. Here we go!
De drie modellen
Op dit moment zijn er drie veelgebruikte text2img modellen. Ik gebruik ze alle drie veel want ze hebben ieder hun eigen karakter en voor- en nadelen:
DALL-E
Platform: Open AI Lab (web)
Sterke kanten: realistisch (resultaten lijken door mens gemaakt) en intelligent ('snapt' wat je met een prompt bedoelt)
Extra features: inpainting en outpainting (delen in of 'aan' een beeld laten genereren)
Kosten: Je krijgt 50 beelden gratis en daarna maandelijks 15 gratis. Als je meer wil kost het 0,13 euro per gegenereerd beeld.
Documentatie: beta.openai.com/docs
Midjourney
Platform: Discord server
Sterke kanten: esthetisch (mooie resultaten) en creatief (verrassende resultaten)
Extra features: eigen afmetingen en upscaling
Kosten: De eerste 25 beelden zijn gratis. Daarna maandelijks 10 euro (200 beelden) of 30 euro (onbeperkt).
Documentatie: midjourney.gitbook.io/docs
Stable Diffusion
Platform: DreamStudio (web) of DiffusionBee (Mac app)
Sterke kanten: brede kennis over objecten, mensen, plaatsen en stijlen
Extra features: eigen afmetingen, intuïtieve parameters, onbeperkte prompts (bekende mensen, politiek en naakt zijn toegestaan), en inpainting en outpainting
Kosten: De eerste 200 beelden zijn gratis. Daarna kost het 0,01 euro per gegenereerd beeld. Als je SD op je eigen computer draait, is alles gratis.
Documentatie: beta.dreamstudio.ai/faq
Glove made of liquid mercury, floating in a beautiful forest, digital art, golden hour, octane render, hyperrealistic, enhanced quality, immense detail (DALL-E)
De juiste prompts
Alles valt of staat bij het invoeren van de juiste prompts. Daarbij geldt: hoe specifieker hoe beter. Een prompt kun je het beste opbouwen uit drie delen: de scène-omschrijving, de stijl en de technische randvoorwaarden. Hergebruik delen van prompts van anderen of gebruik generators om de juiste prompts te fabriceren. Het is meestal een kwestie van trial and error; je prompt blijven schaven tot je de visual hebt die je wil.
Uitleg
Prompt generator
Img2prompt
Prompt inspiratie
Glove made of liquid mercury, floating in a beautiful forest, digital art, golden hour, octane render, hyperrealistic, enhanced quality, immense detail (Stable Diffusion)
Ik hoop dat ik je heb geïnspireerd om ook lekker te gaan klooien. Laat me weten als je hulp nodig hebt of als je tips hebt die hierboven nog niet zijn genoemd! De lijnen staan open op [email protected] 🙏
READING LIST
Vanaf 1 juli 2023 stapt Google over op Google Analytics versie 4. Die is fundamenteel anders dan de huidige versie. Welke gevolgen heeft dat voor de inrichting van je analytics?
TikTokkers gebruiken de app steeds vaker als zoekmachine. En dat valt Google ook op. "In our studies, something like almost 40 percent of young people, when they’re looking for a place for lunch, they don’t go to Google Maps or Search. They go to TikTok or Instagram."
Stel, je bent een succesvolle illustratrice en je werk voor Disney is zo uniek dat het als style opduikt in een populair text2img model. De style heeft zelfs jouw naam. Iedereen kan vanaf nu illustraties maken in exact jouw stijl. Juichen of janken?
Van mij mag die Y2K vibe nog heel lang blijven hangen ❤️
Adformatie vroeg zeven creatieven naar hoe text2img hen helpt in hun werk. Nadia Piet (Dept): "Waar je in Photoshop je visie laag voor laag tot leven brengt, moet je hier het eindresultaat zo duidelijk mogelijk in je mind’s eye visualiseren en dan in woorden vatten. Het is een soort reverse engineering van output naar input met daarin ook minder controle en een uitnodiging tot het omarmen van happy accidents." (Om de betaalmuur te omzeilen, gebruik ik 12ft.io)
IN JE FACE
Dit is niet gefilmd met een drone, maar met een iPhone die op de grond bleef. Hoe? Door een techniek die Neural Radiance Fields (NeRF) heet. Check de making of.
Iemand heeft een hele serie holografische effecten in CSS gemaakt en ze losgelaten op Pokémon kaarten. Super nice! Kan altijd wel een keer van pas komen.
MUST: INGMAR COENEN
Ingmar is Halfvetter en freelance digital designer uit Utrecht
Podcast die ik net heb ontdekt:
Eén van de betere kijkje-in-de-keuken-podcasts vind ik The Follow Up, een podcast die je krijgt wanneer je je inschrijft bij Brand New van Under Consideration. Op dat platform worden (re)branding projecten geplaatst, gecureerd en besproken door een actieve design community. In de podcast leer je over de keuzes achter de meest succesvolle cases. Vaak zitten zowel klant als maker in één gesprek en zijn ze eerlijk over het proces.
Handige tool die iedereen zou moeten kennen:
Geen tool, maar een hele uitgebreide en prettig geschreven gids van Julian Shapiro om beter non-fictie artikelen te leren schrijven.
Design-boek dat ik iedereen kan aanraden:
The Win Without Pitching Manifesto van Blair Enns is een boek met als algemene boodschap dat het afgelopen moet zijn met de gratis pitch-cultuur. Wat me vooral is bijgebleven is dat het ook boordevol andere tips bevat voor kleine studio's en zelfstandigen. Ook zijn laatste boek Pricing Creativity is erg interessant. Overigens een goed moment om de mooiere Goodreads-tegenhanger Oku in de spotlight te zetten; perfect om je collectie in bij te houden en nieuwe boeken te ontdekken.
TOOLS
CopyBook is een verzameling korte zinnetjes die veel voorkomen in UI, gesorteerd op categorie. Handig om te copy-pasten in je designs.
Gifski converteert movies naar gifjes.
Homerun ID helpt je bij het vinden van een nieuwe baan.
UXArchive is een enorme verzameling mobile user flows.
iA Presenter heeft presentaties maken opnieuw uitgevonden. Je schrijft eerst je verhaal in tekst en maakt er daarna slides van. Interessante benadering.
Illustration.lol showcase't de beste editorial illustrations.
Dark Mode Design cureert de mooiste websites in dark mode.
Image Tracer is een Figma plugin die beelden omzet in vectoren.
Design Vault verzamelt UI patterns.
LeiaPix Converter maakt 2D-beelden 3D.
All caught up.
Laatste tippie: mijn collega Rinse ontwerpt rugnummers voor de grootste Nederlandse voetbalclubs. Ik schreef samen met hem over hoe typografie het handschrift van je merk kan zijn.
Tot over twee weken!
Jeroen.
Reply