GitHub – Borisdayma/Dalle -Mini: Dall · e Mini – Generer billeder fra en tekstprompt, hvordan fungerer Dalle -mini?
Hvordan fungerer dalle-mini
Hvis der ikke sker noget, skal du downloade Github Desktop og prøve igen.
Gemte søgninger
Brug gemte søgninger til at filtrere dine resultater hurtigere
Annuller Opret gemt søgning
Du loggede ind med en anden fane eller vindue. Genindlæs for at opdatere din session. . Genindlæs for at opdatere din session. Du skiftede konti på en anden fane eller vindue. Genindlæs for at opdatere din session.
Dall · e mini – Generer billeder fra en tekstprompt
Licens
Borisdayma/Dalle-mini
Denne forpligtelse hører ikke til nogen filial på dette depot og kan høre til en gaffel uden for depotet.
Der findes allerede et tag med det medfølgende filialnavn. Mange Git -kommandoer accepterer både tag- og grennavne, så at skabe denne gren kan forårsage uventet opførsel. ?
- Lokal
- Codespaces
Brug git eller kassen med SVN ved hjælp af web -URL’en.
Arbejd hurtigt med vores officielle CLI. .
Log på påkrævet
Log ind for at bruge kodespacer.
Lancering af Github Desktop
Hvis der ikke sker noget, skal du downloade Github Desktop og prøve igen.
Lancering af Github Desktop
Hvis der ikke sker noget, skal du downloade Github Desktop og prøve igen.
Lancering af Xcode
Hvis der ikke sker noget, skal du downloade Xcode og prøve igen.
Lancering af Visual Studio Code
Dit kodespace åbnes, når det er klar.
Der var et problem med at forberede dit kodespace, prøv igen.
Seneste forpligtelse
Git statistik
Filer
Kunne ikke indlæse de nyeste forpligtelsesoplysninger.
Seneste engagementsmeddelelse
30. november 2021 04:47
23. oktober 2022 17:35
30. november 2021 04:14
.MD
Dall · e mini
Brugsvejledning?
Du kan bruge modellen på craiyon
Hvordan virker det?
- Dall · e mini – Generer billeder fra enhver tekstprompt
- Dall · e mini – forklaret
Afhængigheder installation
.
Til udvikling skal du klone repoen og bruge pip install -e “.[dev] ” . .
Du kan eksperimentere med rørledningen trin for trin gennem vores inferenspipeline notebook
Uddannelse af dall · e mini
Du kan også justere fejekonfigurationsfilen, hvis du har brug for at udføre en hyperparameter -søgning.
FAQ
?
Trænede modeller er på Model Hub:
- VQGAN-F16-16384 til kodning/afkodning af billeder
- Dall · e mini eller dall · e mega til generering af billeder fra en tekstprompt
Hvor kommer logoet fra?
“Lænestolen i form af en avocado” blev brugt af Openai, når man frigav Dall · e til at illustrere modellens kapaciteter. Efter at have succesrige forudsigelser om denne prompt repræsenterer en stor milepæl for os.
Bidrager
Deltag i samfundet på Laion Discord. Ethvert bidrag er velkommen, fra rapporteringsproblemer til at foreslå rettelser/forbedringer eller testning af modellen med seje prompter!
Du kan også bruge disse gode projekter fra samfundet:
- Kør på replikat, i browseren eller via API
Anerkendelser
- Hugging Face til organisering af hør/Jax Community Week
- Google TPU Research Cloud (TRC) -program til levering af computerressourcer
- Vægte og partier til levering af infrastrukturen til eksperimentsporing og modelstyring
Forfattere og bidragydere
Dall · e mini blev oprindeligt udviklet af:
Mange tak til de mennesker, der hjalp med at gøre det bedre:
- Dalle-Pytorch og Eleutherai samfund til test og udveksling af seje ideer
- Rohan Anil til tilføjelse af distribueret shampoo -optimizer og giver altid gode forslag
- Phil Wang har leveret en masse seje implementeringer af transformervarianter og giver interessante indsigter med X-Transformers
- Katherine Crowson til superkonditionering
- Gradio -teamet lavede en fantastisk brugergrænseflade til vores app
Citerer dall · e mini
Hvis du finder dall · e mini nyttigt i din forskning eller ønsker at henvise, skal du bruge følgende Bibtex -post.
@misc, doi =, måned =, title =, url =, år =>
Referencer
- “Glu -varianter forbedrer transformeren”
- “DeepNet: skaleringstransformatorer til 1.000 lag”
- “Normformer: Forbedret transformer -forudgående med ekstra normalisering”
- “Swin Transformer: Hierarkisk Vision Transformer ved hjælp af skiftede vinduer”
- “Cogview: Mastering af tekst-til-billedgenerering via Transformers”
- “Root Mean Square Layer Normalization”
- “Sinkformers: Transformers med dobbelt stokastisk opmærksomhed”
- “Foundation Transformers
Citater
@misc< title=, author=, year=, eprint=, archivePrefix=, primaryClass= >
@misc< title=, author=, year=, eprint=, archivePrefix=, primaryClass= >
@misc< title=, author=, year=, eprint=, archivePrefix=, primaryClass= >
@misc< title=, author=, year=, eprint=, archivePrefix=, primaryClass= >
@misc< title=, author=, year=, eprint=, archivePrefix=, primaryClass= >
@misc< title=, author=, year=, url= >
@misc< title=, author=, year=, eprint= archivePrefix=, primaryClass= >
@misc< title=, author=, year=, eprint=, archivePrefix=, primaryClass= >
@Inproceedings< title=, author=, booktitle=, year= >
@misc< title = , author = , year = , eprint = , archivePrefix = , primaryClass = >
< title = , author = , year = , eprint = , archivePrefix = , primaryClass = >
@misc< title = , url = , author = , publisher = , year = , >
@misc< title = , url = , author = , publisher = , year = , >
@misc< title = , url = , author = , publisher = , year = , >
Om
Hvordan fungerer dalle-mini?
Dalle Mini er en gratis, open source AI, der producerer fantastiske billeder fra tekstindgange. Sådan fungerer det.
Louis Bouchard
15. juni 2022 • 4 min læst
Jeg er sikker på, at du har set billeder som dem i dit Twitter -feed i de sidste par dage. Hvis du spekulerede på, hvad de var, er de billeder genereret af en ai kaldet dall · e mini. Hvis du aldrig har set dem, skal du læse denne artikel, fordi du går glip af. Hvis du spekulerer på, hvordan dette er muligt, ja, er du på den perfekte artikel og kender svaret på mindre end fem minutter.
Dette navn, Dall · E, skal allerede ringe til en klokke, da jeg dækkede to versioner af denne model lavet af Open AI i det forløbne år med utrolige resultater. . Dall · e Mini er et open source community-oprettet projekt inspireret af den første version af Dall · e og har fortsat udviklet sig siden da, med nu utrolige resultater takket være Boris Dayma og alle bidragydere.
.
Linket er i referencerne nedenfor, men giv denne artikel et par sekunder, før du spiller med den. Det vil være det værd, og du ved meget mere om denne AI end alle, du kender omkring dig.
. Det har to hovedkomponenter, som du har mistanke om, et sprog og et billedmodul.
Først skal det forstå tekstprompt og derefter generere billeder efter den, to meget forskellige ting, der kræver to meget forskellige modeller. De største forskelle med dall · e ligger i modellens arkitekturer og træningsdata, men ende-til-ende-processen er stort set den samme. . Bart er en model, der er trænet til at omdanne tekstindgang til et sprog, der er forståeligt til den næste model. . Bart tager teksttekst og omdanner den til diskrete tokens, og vi justerer den baseret på forskellen mellem det genererede billede og det billede, der sendes som input.
? Vi kalder dette en dekoder. . I dette tilfælde er billeddekoderen Vqgan, en model, jeg allerede har dækket på kanalen, så jeg inviterer dig bestemt til at se den, hvis du er interesseret.
Kort sagt, Vqgan er en stor arkitektur at gøre det modsatte. Det lærer at gå fra en sådan kodningskortlægning og generere et billede ud af det. Som du har mistanke om, gør GPT-3 og andre sproggenerative modeller en meget lignende ting, kodning af tekst og afkodning af den nyligt genererede kortlægning til en ny tekst, den sender dig tilbage. . Det lærer gennem millioner af kodningsbillede-par fra internettet, så dybest set dine offentliggjorte billeder med billedtekster og ender med at være temmelig nøjagtige med at rekonstruere det oprindelige billede.
Derefter kan du fodre det nye kodninger, der ligner dem i træning, men er lidt forskellige, og det vil generere et helt nyt, men lignende billede. .
Og voilà! Sådan lærer du at generere billeder fra dine teksttekster.
Se flere resultater i videoen:
Som jeg nævnte, er det open source, og du kan endda lege med det med det samme takket være Huggingface. Selvfølgelig var dette bare et simpelt overblik, og jeg udeladte nogle vigtige trin for klarhed. Hvis du gerne vil have flere detaljer om modellen, linkede jeg store ressourcer i referencerne nedenfor. Jeg har også for nylig offentliggjort to korte videoer på YouTube, der viser nogle sjove resultater såvel som sammenligningsresultater med Dall · E 2 for de samme tekstoptagelser.
!
Jeg håber, du nød denne artikel og videoen, og i bekræftende fald skal du tage et par sekunder at fortælle mig det i kommentarerne og forlade en lignende.
Jeg ser dig, ikke næste uge, men om to uger med et andet fantastisk papir!
Referencer
Deltag i vores Discord Channel, lær AI sammen:
.GG/Learnaitogether
Tilmeld dig mere som dette.
!
Boost AI Performance med finjustering
Louis Bouchard 19. september 2023 • 6 min. Læsning
MVDream: En ny tekst-til-3D-tilgang (forklaret)!
Louis Bouchard 10. september 2023 • 6 min. Læsning
AI Deep Learning forklarede
Dall-e Mini
Dall-e 2 er banebrydende forskning fra Openai, der forfølger det iboende løfte om teknologi: gør det muligt for normale mennesker at erhverve supermagterne fra de talentfulde og rige. De fleste enkeltpersoner mangler færdigheder eller talent til at tegne. De, der ikke kan have penge, kan ansætte fagfolk. .
Hotpot..
Dalle-mini
.
Reimagine dig selv med AI. Opret AI -selfies, AI -hovedbilleder, firmaets fotos og glamourbilleder af dig selv i forskellige stilarter og scener. Perfekt til sociale medieprofiler, dating -apps, LinkedIn -profiler eller blot at se dig selv på en ny måde.
AI Art
Fremskridt inden for kunstig intelligens giver enhver mulighed for at skabe kunst med enkle instruktioner, ligesom at instruere en menneskelig kunstner. .
Baseret på banebrydende forskning fra NVIDIA, Google, stabilitet.AI og Openai, disse AI -billedmodeller kan forstå enkle instruktioner og producere billeder – svarende til hvordan menneskelige kunstnere modtager instruktioner fra lånere. Men er denne kunst eller endda intelligens?
. Det, der betyder noget, er, hvis de hjælper folk. Kan AI hjælpe med at omdanne din fantasi til virkelighed og bringe et smil til dit ansigt eller måske blive grundlaget for merchandise til at sælge på Shopify, eller hjælpe dig med at skabe cover art til dit næste album?
Læs flere tanker om AI -kunst.