פוסטים לפי תאריך – קהילת AI ברזלי
10.12
חברות וחברים, אחרי ההתלהבות הראשונית, בדקנו את המודל החדש של גוגל (מבוסס ג'מיני 3) כדי להבין האם מדובר בגימיק או בכלי עבודה. המסקנה? ארגז הכלים החדש פותר את רוב הבעיות שממש תסכלו אותנו עד היום בשימוש בAI. נתחיל ב Style Reference, הפיצ'ר שחיכינו לו. יש לכם תמונה עם תאורה מושלמת או סגנון איור ייחודי של המותג? אתם יכולים להעלות אותה כ"רפרנס". המודל לא יעתיק את התוכן, אלא "ילמד" את הסגנון (צבעוניות, אווירה, טקסטורה) ויחיל אותו על כל רעיון חדש שלכם. זה גיים-צ'יינג'ר לשמירה על שפה עיצובית אחידה.
עריכה כירורגית (Inpainting) יצרתם תמונה מדהימה אבל יש עציץ מיותר ברקע? היד יצאה מוזרה? לא צריך לייצר מחדש ולקוות לטוב. אפשר לסמן אזור ספציפי ולבקש מהמודל לתקן רק אותו. להחליף חליפה לטי-שירט או להוריד אובייקט – הכל קורה בשניות בלי לפגוע בקומפוזיציה.
נגמרו הימים שהמודל "הולך לאיבוד" עם פרומפטים מסובכים. ה"ננו בננה" מפגין הבנה מרחבית מרשימה: תבקשו "שלושה אנשים במעגל, הימני מחזיק אייפד והשמאלית מצביעה לשמיים" – והוא ימקם אותם בדיוק שם. פחות ניסוי וטעייה, יותר תוצאות.
עקביות דמויות (Consistency) הבשורה הגדולה: היכולת לייצר דמות (פרזנטור) ולרוץ איתה לאורך סדרת תמונות שלמה בסיטואציות שונות, בזכות היכולת לזכור עד 14 תמונות רפרנס.
עברית ללא ג'יבריש – המודל יודע לשלב טקסט בתוך התמונה, בפונטים שונים, ובעברית מלאה ותקנית. שלטים, הזמנות ובאנרים.
