Hvordan fungerer dalle-mini

Hvis der ikke sker noget, skal du downloade Github Desktop og prøve igen.

Gemte søgninger

Brug gemte søgninger til at filtrere dine resultater hurtigere

Annuller Opret gemt søgning

Du loggede ind med en anden fane eller vindue. Genindlæs for at opdatere din session. . Genindlæs for at opdatere din session. Du skiftede konti på en anden fane eller vindue. Genindlæs for at opdatere din session.

Dall · e mini – Generer billeder fra en tekstprompt

Licens

Borisdayma/Dalle-mini

Denne forpligtelse hører ikke til nogen filial på dette depot og kan høre til en gaffel uden for depotet.

Der findes allerede et tag med det medfølgende filialnavn. Mange Git -kommandoer accepterer både tag- og grennavne, så at skabe denne gren kan forårsage uventet opførsel. ?

  • Lokal
  • Codespaces

Brug git eller kassen med SVN ved hjælp af web -URL’en.
Arbejd hurtigt med vores officielle CLI. .

Log på påkrævet

Log ind for at bruge kodespacer.

Lancering af Github Desktop

Hvis der ikke sker noget, skal du downloade Github Desktop og prøve igen.

Lancering af Github Desktop

Hvis der ikke sker noget, skal du downloade Github Desktop og prøve igen.

Lancering af Xcode

Hvis der ikke sker noget, skal du downloade Xcode og prøve igen.

Lancering af Visual Studio Code

Dit kodespace åbnes, når det er klar.

Der var et problem med at forberede dit kodespace, prøv igen.

Seneste forpligtelse

Git statistik

Filer

Kunne ikke indlæse de nyeste forpligtelsesoplysninger.

Seneste engagementsmeddelelse
30. november 2021 04:47
23. oktober 2022 17:35

30. november 2021 04:14

.MD

Dall · e mini

Brugsvejledning?

Du kan bruge modellen på �� craiyon

Hvordan virker det?

  • Dall · e mini – Generer billeder fra enhver tekstprompt
  • Dall · e mini – forklaret

Afhængigheder installation

.

Til udvikling skal du klone repoen og bruge pip install -e “.[dev] ” . .

Du kan eksperimentere med rørledningen trin for trin gennem vores inferenspipeline notebook

Uddannelse af dall · e mini

Du kan også justere fejekonfigurationsfilen, hvis du har brug for at udføre en hyperparameter -søgning.

FAQ

?

Trænede modeller er på �� Model Hub:

  • VQGAN-F16-16384 til kodning/afkodning af billeder
  • Dall · e mini eller dall · e mega til generering af billeder fra en tekstprompt

Hvor kommer logoet fra?

“Lænestolen i form af en avocado” blev brugt af Openai, når man frigav Dall · e til at illustrere modellens kapaciteter. Efter at have succesrige forudsigelser om denne prompt repræsenterer en stor milepæl for os.

Bidrager

Deltag i samfundet på Laion Discord. Ethvert bidrag er velkommen, fra rapporteringsproblemer til at foreslå rettelser/forbedringer eller testning af modellen med seje prompter!

Du kan også bruge disse gode projekter fra samfundet:

  • Kør på replikat, i browseren eller via API

Anerkendelser

  • �� Hugging Face til organisering af hør/Jax Community Week
  • Google TPU Research Cloud (TRC) -program til levering af computerressourcer
  • Vægte og partier til levering af infrastrukturen til eksperimentsporing og modelstyring

Forfattere og bidragydere

Dall · e mini blev oprindeligt udviklet af:

Mange tak til de mennesker, der hjalp med at gøre det bedre:

  • Dalle-Pytorch og Eleutherai samfund til test og udveksling af seje ideer
  • Rohan Anil til tilføjelse af distribueret shampoo -optimizer og giver altid gode forslag
  • Phil Wang har leveret en masse seje implementeringer af transformervarianter og giver interessante indsigter med X-Transformers
  • Katherine Crowson til superkonditionering
  • Gradio -teamet lavede en fantastisk brugergrænseflade til vores app

Citerer dall · e mini

Hvis du finder dall · e mini nyttigt i din forskning eller ønsker at henvise, skal du bruge følgende Bibtex -post.

@misc, doi =, måned =, title =, url =, år => 

Referencer

  • “Glu -varianter forbedrer transformeren”
  • “DeepNet: skaleringstransformatorer til 1.000 lag”
  • “Normformer: Forbedret transformer -forudgående med ekstra normalisering”
  • “Swin Transformer: Hierarkisk Vision Transformer ved hjælp af skiftede vinduer”
  • “Cogview: Mastering af tekst-til-billedgenerering via Transformers”
  • “Root Mean Square Layer Normalization”
  • “Sinkformers: Transformers med dobbelt stokastisk opmærksomhed”
  • “Foundation Transformers

Citater

@misc< title=, author=, year=, eprint=, archivePrefix=, primaryClass= > 
@misc< title=, author=, year=, eprint=, archivePrefix=, primaryClass= > 
@misc< title=, author=, year=, eprint=, archivePrefix=, primaryClass= > 
@misc< title=, author=, year=, eprint=, archivePrefix=, primaryClass= > 
@misc< title=, author=, year=, eprint=, archivePrefix=, primaryClass= > 
@misc< title=, author=, year=, url= > 
 @misc< title=, author=, year=, eprint= archivePrefix=, primaryClass= > 
@misc< title=, author=, year=, eprint=, archivePrefix=, primaryClass= > 
@Inproceedings< title=, author=, booktitle=, year= > 
@misc< title = , author = , year = , eprint = , archivePrefix = , primaryClass = > 
< title = , author = , year = , eprint = , archivePrefix = , primaryClass = > 
@misc< title = , url = , author = , publisher = , year = , > 
@misc< title = , url = , author = , publisher = , year = , > 
@misc< title = , url = , author = , publisher = , year = , > 

Om

Hvordan fungerer dalle-mini?

Dalle Mini er en gratis, open source AI, der producerer fantastiske billeder fra tekstindgange. Sådan fungerer det.

Louis Bouchard

15. juni 2022 • 4 min læst

Hvordan fungerer Dalle-mini?

Jeg er sikker på, at du har set billeder som dem i dit Twitter -feed i de sidste par dage. Hvis du spekulerede på, hvad de var, er de billeder genereret af en ai kaldet dall · e mini. Hvis du aldrig har set dem, skal du læse denne artikel, fordi du går glip af. Hvis du spekulerer på, hvordan dette er muligt, ja, er du på den perfekte artikel og kender svaret på mindre end fem minutter.

Dette navn, Dall · E, skal allerede ringe til en klokke, da jeg dækkede to versioner af denne model lavet af Open AI i det forløbne år med utrolige resultater. . Dall · e Mini er et open source community-oprettet projekt inspireret af den første version af Dall · e og har fortsat udviklet sig siden da, med nu utrolige resultater takket være Boris Dayma og alle bidragydere.

.
Linket er i referencerne nedenfor, men giv denne artikel et par sekunder, før du spiller med den. Det vil være det værd, og du ved meget mere om denne AI end alle, du kender omkring dig.

. Det har to hovedkomponenter, som du har mistanke om, et sprog og et billedmodul.

Først skal det forstå tekstprompt og derefter generere billeder efter den, to meget forskellige ting, der kræver to meget forskellige modeller. De største forskelle med dall · e ligger i modellens arkitekturer og træningsdata, men ende-til-ende-processen er stort set den samme. . Bart er en model, der er trænet til at omdanne tekstindgang til et sprog, der er forståeligt til den næste model. . Bart tager teksttekst og omdanner den til diskrete tokens, og vi justerer den baseret på forskellen mellem det genererede billede og det billede, der sendes som input.

? Vi kalder dette en dekoder. . I dette tilfælde er billeddekoderen Vqgan, en model, jeg allerede har dækket på kanalen, så jeg inviterer dig bestemt til at se den, hvis du er interesseret.

Kort sagt, Vqgan er en stor arkitektur at gøre det modsatte. Det lærer at gå fra en sådan kodningskortlægning og generere et billede ud af det. Som du har mistanke om, gør GPT-3 og andre sproggenerative modeller en meget lignende ting, kodning af tekst og afkodning af den nyligt genererede kortlægning til en ny tekst, den sender dig tilbage. . Det lærer gennem millioner af kodningsbillede-par fra internettet, så dybest set dine offentliggjorte billeder med billedtekster og ender med at være temmelig nøjagtige med at rekonstruere det oprindelige billede.

Derefter kan du fodre det nye kodninger, der ligner dem i træning, men er lidt forskellige, og det vil generere et helt nyt, men lignende billede. .

Og voilà! Sådan lærer du at generere billeder fra dine teksttekster.

Se flere resultater i videoen:

Som jeg nævnte, er det open source, og du kan endda lege med det med det samme takket være Huggingface. Selvfølgelig var dette bare et simpelt overblik, og jeg udeladte nogle vigtige trin for klarhed. Hvis du gerne vil have flere detaljer om modellen, linkede jeg store ressourcer i referencerne nedenfor. Jeg har også for nylig offentliggjort to korte videoer på YouTube, der viser nogle sjove resultater såvel som sammenligningsresultater med Dall · E 2 for de samme tekstoptagelser.

!

Jeg håber, du nød denne artikel og videoen, og i bekræftende fald skal du tage et par sekunder at fortælle mig det i kommentarerne og forlade en lignende.

Jeg ser dig, ikke næste uge, men om to uger med et andet fantastisk papir!

Referencer

Deltag i vores Discord Channel, lær AI sammen:
.GG/Learnaitogether

Tilmeld dig mere som dette.

!

Boost AI Performance med finjustering

Louis Bouchard 19. september 2023 • 6 min. Læsning

MVDream: Oprettelse af naturtro 3D -modeller fra ord

MVDream: En ny tekst-til-3D-tilgang (forklaret)!

Louis Bouchard 10. september 2023 • 6 min. Læsning

AI Deep Learning forklarede

AI Deep Learning forklarede

Dall-e Mini

Dall-e 2 er banebrydende forskning fra Openai, der forfølger det iboende løfte om teknologi: gør det muligt for normale mennesker at erhverve supermagterne fra de talentfulde og rige. De fleste enkeltpersoner mangler færdigheder eller talent til at tegne. De, der ikke kan have penge, kan ansætte fagfolk. .

Hotpot..

Dalle-mini

.

Reimagine dig selv med AI. Opret AI -selfies, AI -hovedbilleder, firmaets fotos og glamourbilleder af dig selv i forskellige stilarter og scener. Perfekt til sociale medieprofiler, dating -apps, LinkedIn -profiler eller blot at se dig selv på en ny måde.

AI Art

Fremskridt inden for kunstig intelligens giver enhver mulighed for at skabe kunst med enkle instruktioner, ligesom at instruere en menneskelig kunstner. .

Baseret på banebrydende forskning fra NVIDIA, Google, stabilitet.AI og Openai, disse AI -billedmodeller kan forstå enkle instruktioner og producere billeder – svarende til hvordan menneskelige kunstnere modtager instruktioner fra lånere. Men er denne kunst eller endda intelligens?

. Det, der betyder noget, er, hvis de hjælper folk. Kan AI hjælpe med at omdanne din fantasi til virkelighed og bringe et smil til dit ansigt eller måske blive grundlaget for merchandise til at sælge på Shopify, eller hjælpe dig med at skabe cover art til dit næste album?

Læs flere tanker om AI -kunst.