Η Midjourney, μία από τις πρώτες υπηρεσίες δημιουργίας εικόνας μέσω Τεχνητής Νοημοσύνης στον ιστό, κυκλοφόρησε το πρώτο νέο της μοντέλο AI μετά από σχεδόν ένα χρόνο, σύμφωνα με την TechChrunch.
Το μοντέλο, που ονομάζεται V7, ξεκίνησε να διατίθεται σε alpha έκδοση γύρω στη μέση της νύχτας την Πέμπτη, μία εβδομάδα μετά την κυκλοφορία του νέου γεννήτριας εικόνας από την OpenAI στο ChatGPT, η οποία έγινε αμέσως viral για την ικανότητά της να δημιουργεί φωτογραφίες στο στυλ των Ghibli.
Ωστόσο, το μοντέλο της Midjourney δεν είναι βελτιστοποιημένο για το στυλ των Ghibli — τουλάχιστον όχι επίσημα — αλλά παρόλα αυτά μπορεί να δημιουργεί αισθητικά ευχάριστα έργα, τουλάχιστον κατά την κρίση του δημοσιογράφου.
We're now beginning the alpha-test phase of our new V7 image Model. It's our smartest, most beautiful, most coherent model yet. Give it a shot and expect updates every week or two for the next two months. pic.twitter.com/Ogqt0fgiY7
— Midjourney (@midjourney) April 4, 2025
Για να το χρησιμοποιήσεις, θα πρέπει πρώτα να αξιολογήσεις περίπου 200 εικόνες για να δημιουργήσεις το προφίλ «εξατομίκευσης» της Midjourney, αν δεν το έχεις κάνει ήδη. Αυτό το προφίλ προσαρμόζει το μοντέλο στις ατομικές σου οπτικές προτιμήσεις· το V7 είναι το πρώτο μοντέλο της Midjourney που έχει την εξατομίκευση ενεργοποιημένη από προεπιλογή.
Μόλις το ολοκληρώσεις, θα μπορείς να ενεργοποιήσεις ή να απενεργοποιήσεις το V7 στην ιστοσελίδα της Midjourney και, αν είσαι μέλος του Discord της Midjourney, στο chatbot της Discord. Στην εφαρμογή ιστού, μπορείς να επιλέξεις γρήγορα το μοντέλο από το αναδυόμενο μενού δίπλα στην ετικέτα «εκδοχή».
Ο Διευθύνων Σύμβουλος της Midjourney, David Holz, περιέγραψε το V7 ως «εντελώς διαφορετική αρχιτεκτονική» σε ανάρτησή του στο X.
«Το V7 είναι […] πολύ πιο έξυπνο με τα κείμενα προτροπής», συνέχισε ο Holz σε ανακοίνωση στο Discord. «Οι προτροπές εικόνας φαίνονται καταπληκτικές, η ποιότητα των εικόνων είναι αισθητά υψηλότερη με όμορφες υφές, και τα σώματα, τα χέρια και τα αντικείμενα όλων των τύπων έχουν σημαντικά καλύτερη συνοχή σε όλες τις λεπτομέρειες».
Το V7 διατίθεται σε δύο εκδοχές, Turbo (πιο ακριβό στη λειτουργία) και Relax, και ενεργοποιεί ένα νέο εργαλείο που ονομάζεται Draft Mode, το οποίο παράγει εικόνες 10 φορές πιο γρήγορα και με το μισό κόστος από την κανονική λειτουργία. Οι εικόνες Draft είναι χαμηλότερης ποιότητας από αυτές της κανονικής λειτουργίας, αλλά μπορούν να ενισχυθούν και να αναπαραχθούν με ένα κλικ.
Ορισμένα από τα χαρακτηριστικά της Midjourney δεν είναι ακόμη διαθέσιμα για το V7, σύμφωνα με τον Holz, όπως η αναβάθμιση εικόνας και η αλλαγή υφής. Αυτά αναμένονται στο άμεσο μέλλον, είπε, πιθανότατα εντός δύο μηνών.
«Πρόκειται για ένα εντελώς νέο μοντέλο με μοναδικά πλεονεκτήματα και πιθανώς μερικές αδυναμίες», έγραψε ο Holz στο Discord. «Θέλουμε να μάθουμε από εσάς τι κάνει καλά και τι όχι, αλλά σίγουρα να έχετε κατά νου ότι μπορεί να απαιτεί διαφορετικά στυλ προτροπής. Οπότε παίξτε λίγο».
Στις σύντομες δοκιμές μου, το V7 αντέδρασε αρκετά καλά στις προτροπές μου, αν και δεν είχα χρόνο να το δοκιμάσω πραγματικά σε βάθος.
Η Midjourney είναι μια ασυνήθιστη επιχείρηση. Ιδρύθηκε το 2022 από τον Holz, ο οποίος είχε συνιδρύσει την εταιρεία περιφερειακών υπολογιστών Leap Motion, και δεν έχει συγκεντρώσει ούτε ένα δολάριο εξωτερικής χρηματοδότησης.
Στα τέλη του 2023, η Midjourney αναμενόταν να φέρει περίπου 180,82 εκατομμύρια ευρώ σε έσοδα. Πρόσφατα, η εταιρεία με έδρα το Σαν Φρανσίσκο δήλωσε ότι δημιουργεί μια ομάδα hardware για να δουλέψει σε κάποια έργα που δεν έχει ανακοινώσει, ενώ συνεχίζει να εκπαιδεύει τα μοντέλα που είχαν ανακοινωθεί για τη δημιουργία βίντεο και 3D αντικειμένων.
Η εταιρεία αντιμετωπίζει αρκετές αγωγές που την κατηγορούν για παραβίαση των δικαιωμάτων εκατομμυρίων καλλιτεχνών, εκπαιδεύοντας εργαλεία Τεχνητής Νοημοσύνης με εικόνες που αποσπάστηκαν από τον ιστό χωρίς τη συναίνεση των δημιουργών των εικόνων.