10 בספט׳זמן קריאה 17 דקות

קרב ה- AI על עליונות מוצרית בסמארטפון

או: בזמן ש- Apple מכריזה על החזון שלה ב- iPhone, משיקה Google בפועל סדרת פיצ׳רי בינה מלאכותית על ה- Pixel. מה עומד מאחורי המירוץ שישנה דרמטית את חווית המשתמש והקשר שלנו עם המכשיר הנייד

בימים הרחוקים של מלחמת העולם הראשונה, עת חיילי מדינות ההסכמה, בראשם האנגלים והצרפתים, התחפרו במלחמת שוחות סטאטית בחזית המערבית מול חיילי גרמניה, היה שדרן הרדיו הגרמני מסיים את הדיווח היומי שלו במשפט המפורסם: "במערב אין כל חדש". הדיווח המקביל של השדרן האנגלי היה: "All is quiet on the western front". האמת היתה קרובה יותר לנוסח של "אין כל חדש", כי בסופו של דבר, רובה של המלחמה עבר ללא שנוי משמעותי בשטח – קטל בלתי פוסק עם הישגים קטנים לצד אחד, ולאחר זמן מה הישג מינורי לצד השני.

סיומה של המלחמה, שנחשבה אז לגדולה ביותר שחווה העולם, הגיעה בזכות כניסתם של כוחות אמריקאים רעננים לזירה, והשקתו של כלי נשק חדש ומשנה מציאות. הטנק. "האביר המשוריין המודרני" פרץ את גדרות התיל ושדות מוקשי ה"נגד אדם" האינסופיים שחצצו בין חפירות שני הצדדים, וגרם לשינוי דרמטי בשדה הקרב אחרי שנים של קיפאון. בשטח, אגב, לא נדרש כיבוש משמעותי כדי להביא לכניעתם הסופית של הגרמנים: הדיווחים מהקרבות, שהבהירו שהטנק הוא Game changer אמיתי, הביאו את מנהיגי המעצמה התשושה להבנה שהסיפור נגמר. בסוף 1918, בתאריך הסמלי: 11/11, בשעה 11:00, נכנעה גרמניה, כשכוחותיה עדיין על אדמת צרפת. העולם מצדו, קיבל מנוחה קצרצרה ושביב של תקווה, שלא נמשכה זמן רב, בדרך הבטוחה למלחמה הבאה, שהפכה היא לגדולה ביותר אי פעם.

אז למה הבאתי את כל ההקדמה ההיסטורית הזו? ראשית, כי אני אוהב היסטוריה ומנסה לכתוב בלוג לא שיגרתי, אז אם אני מצליח למצוא אירוע היסטורי שיעזור לי לחזק פואנטה, כך ייטב. לגופו של עניין, הקיפאון בשדה קרב מקביל באופנים רבים לקיבעון עסקי באופן כללי, וביתר שאת לקיפאון בעולם המוצרי. ואם נחדד עוד יותר – בשדה החדשנות. יש דוגמאות אינספור למצב בו קצב ההתפתחות של חוויית המשתמש נחלש, וככל שעובר הזמן החידושים להם הורגל הלקוח פוחתים, עד שכל המוצרים באותה נישה כמעט זהים. זה יכול לבוא הן ברמת ציוד הקצה, הן ברמה האפליקטיבית, והן בשילוב בין השתיים.

בזמנים כאלה של חוסר בבשורות גדולות, ניתן לראות כיצד שיווקית מיוצרים מעין "מיני-באזזים" סביב פיצ'רים, או יכולות, שמציגים ללקוח חשיבות גבוהה בהרבה ממה שהיא בפועל. ניקח לדוגמא את עולם הטלוויזיות החכמות. הפיצוץ הגדול בתחום הזה היה... כשהטלוויזיות הפכו לחכמות. החיבור לאינטרנט היה הקרקע עליה התאפשרה זריחתן של פלטפורמות ה- Streaming למשל. עולם שלם שהיה מחובר דרך מערכת כבלים עצמאית, או שירותי לוויין מוגבלים, התחבר באחת לפוטנציאל עצום של מוצרים וחוויות חדשות. כך הגיעו פורטלי האפליקציות, זינוק אדיר באיכות השידור, תכני 4K הפכו לסטנדרט, צריכת התוכן שלנו הפכה מידית, חוויית הצפייה בסרטים עברה מהקולנוע לבית וכמובן: האינטשים... מי היה מאמין עד כמה זמינות ברמת המחיר יהיו טלוויזיות 65'', ובאיזו איכות צפייה.

אבל באיזשהו שלב, התמתנה היכולת לספק כל הזמן חידושים. המאבק מתרכז היום בעיקר בניסיון לשפר את ממשק המשתמש בשינויים קלים, לשדרג את איכות הצפייה והתמיכה בפורמטים מתקדמים ושבירה שוב ושוב של שיא הטלוויזיה הגדולה ביותר (מה שמשליך על ירידת המחיר של מה שאתמול נחשב לגודל לעשירים בלבד). אבל תכלס, היענות הלקוחות לרכוש את הדגמים הללו מונעת בעיקר מהספין הוותיק שנמכר להם שלאחר שדגם חדש יוצא, הישן כבר "לא שווה". כמה תכנים באמת זמינים היום ב- 8K? בטח לא מספיק ברמה הפרקטית כדי לשלם אלפי שקלים יותר עבור טלוויזיה שתומכת בצפייה בהם. ועם כל הכבוד לגודל מסך, הסלון הממוצע בדירה לא גדל באותה פרופורציה כמו שהמסכים גדלו, רק התחושה שלנו שזה כבר "לא מסך מספיק גדול".

רוצים סיפור על באזז כזה שנפל? לפני כמה שנים, כנראה בעקבות הצלחתו הפנומנלית של הסרט אווטאר, הפך עניין התלת-ממד לדיבור הגדול ביותר בשוק. הקולנוע השתנה לתמיד אמרו רבים, הקיצוניים שבהם טענו כי תוך כמה שנים ייעלמו הסרטים ה"רגילים" וכולנו נצפה בקולנוע רק דרך משקפי 3D. ביקרתי אז בתערוכת ה- CES בווגאס. כל החברות הגדולות הציגו מסכי טלוויזיה תומכי תלת-מימד, בכל ביתן וביתן יכולת לקבל משקפיים ולראות כיצד "הקולנוע החדש" יגיע במהירות גם למסך הביתי.

ההיסטוריה כמובן, הוכיחה אחרת. הקולנוע נותר בעינו, למעט גל קצר של סרטים בשלושה מימדים (רובם כלל לא צולמו בפורמט זה אלא עברו מניפולציה בחדרי העריכה הממוחשבים), תכנים בטכנולוגיה המסעירה שהביא עמו אוואטר כמעט ולא נוצרו. יש שיאמרו בשל העלות הגבוה, אבל בסופו של דבר החוויה "השואבת" של התלת מימד פשוט לא התאימה למרבית הסרטים. והיא גובה מחיר "מוחי" (בעיקר בכאב ראש ועיניים) למרבית הצופים. ומה עם הטלוויזיות? כמה מהלקוחות מתעניינים בכלל היום אם מקבלים גם משקפי תלת מידי עם הטלוויזיה? בודדים אם בכלל. הניסיון לשכנע את הצרכנים שהם "חייבים" יכולת כזו כשל, בעיקר בגלל שבאופן יוצא דופן – באמת אין בו כל צורך.

ועכשיו לעניינינו, עולם המובייל. בראשו (ובראש הכותרות בגזרתו) עומדת התחרות העזה בזירת הסמארטפונים, אליה מיד נצלול. אך כאמירה מקדימה, חשוב לזכור, גם בקריאת פוסט זה, שהשלכות הקרבות הללו נוגעות ישירות בזירות הטאבלטים ולעיתים גם אלו של המחשבים שבידינו, במעין Ecosystem שלא ניתן לבודד את חלקיו. הזירה המוצרית של הסמארטפון טומנת בחובה אדפטציה מורכבת לעיתים בין המכשירים והנישות השונות, כך שגם אם שם מתרחשת ההתכתשות האמיתית (והמתוקשרת יותר) בין ענקיות הטכנולוגיה, האדוות שנוצרות בעולם המובייל מנענעות את כלל סירות מוצרי הקצה בתחום ברמה דרמטית, ממש כמו טלטול שנגרם מהגלים שיוצרת סירת מרוץ מתפרעת. ועכשיו באמת לעניין.

זה לא חדש שרמת החדשנות וההתרגשות סביב השקת סמארטפונים חדשים פחתה בשנים האחרונות, וניתן לראות זאת אפילו בדרמה (הקלושה והלעיתים מאולצת) סביב ההכרזות עליהם. אם נסתכל על השקת ה- iPhone הראשון כסוג של נקודת התחלה, רובנו זוכרים אלו קפיצות מדרגה היו בשנים הראשונות, פיצ'רים בלתי נתפסים לאותו זמן שהיום הם כבר חלק מובן מאליו בחיינו. נשים בצד את עצם השקת ה- App store שהביאה לגל אדיר של אפליקציות שאיש לא חלם עליהן, נשים בצד גם את ההשקה עם מסך מגע אמיתי על בסיס נגיעה ולא לחיצה (כמו שהיה ב- N85 של נוקיה שנחשב אז לטוב בעולם), גם לא נרחיב גם על גדילת המסכים, הדקות של המכשירים (שאחד מ"קורבנותיה" היה חיבור האוזניות החוטיות), ההטענה המהירה, התמיכה ב- 4G ואחר כך ב- 5G, כניסת מנגנוני הגנה של טביעת אצבע וזיהוי פנים, הטמעה של Personal Assistant כמו Siri בבסיס חוויית המשתמש ועוד כהנה וכהנה מהפכות.

במקום זאת, מספיק שנשים פוקוס קצרצר על האבולוציה של המצלמה. זו אולי התכונה "הברורה" ביותר מאליה במכשירים ניידים (מעבר ליכולות התקשורת כמובן) והיתה קיימת עוד הרבה טרום ימי הסמארטפון. אבל המכשירים החכמים הפכו אותה למחליפתה של המצלמה הדיגיטלית ובקפיצות מדרגה מהפכניות בשנים הראשונות הביאו את יכולות הצילום לאלו של סרט הוליוודי. כך למשל כניסת ה- Multi lens, שהחלו מקרב על כמות הפיקסלים במצלמה (זוכרים את ההתלהבות ממצלמת ה- 12 מגה פיקסל ב- iPhone 7?) והגיעו היום לסטנדרט מקובל של שילוב בין עדשה רגילה, יחד ultra-wide ו- telephoto שעובדות במשולב עם אלגוריתמים מורכבים. היתה גם את בשורת ה- Portrait Mode, תכונה שיוצרת באופן מלאכותי עומק דומה למה שמתקבל מצילום בעדשה גדולה. Google היו ראשונים להציג אותה עם מה שנקרא ה- "Lens Blur", אבל Apple קיבלו את הקרדיט עם שימוש בשתי עדשות שחיקו את אחת היכולות החזקות ביותר של מצלמות ה- DSLR, והפכה ללהיט בתזמון מושלם עם התפתחות רשתות חברתיות מכוונות תמונות כמו Instagram.

עוד דוגמא (אחרונה, מבטיח) לפיצ'ר דרמטי היה ה- Night Mode שהושק לראשונה ע"י Huawei ב- Mate 20 Pro, ואז ע"י Google ב- Pixel 3 תחת השם Night Sight. כך, בעזרת גישה של שכלול תוכנה ולאו דווקא שיפור חומרה, הושקה יכולת אטרקטיבית למשתמש, כזו שמצליחה (בעזרת יד יציבה, קצת מיומנות וכמובן סבלנות) להתגבר על הבעיה המוכרת של סביבה דלת התאורה: סמארטפונים החלו לאפשר לצלם תמונות חדות וללא רעשים גם בתנאי חושך, שנראו כאילו צולמו עם ציוד תאורה מקצועי. היום קשה לדמיין כיצד צילמנו תמונות בסיטואציה כזו ואיך היו יוצאות כציור מופשט בגוונים כהים...

ובשנים האחרונות, כמה בשורות כאלה באמת הגיעו? כמה שכלולים חדשים היו Game Changer לחוויית המשתמש ב- Mobile? כזו שמטה את הכף לצד אחד של כדאיות רכישה? בלי לזלזל, בשורות מתוקשרות ומלוות בסרטונים "apple"-יים כאלה, דוגמת הטענה אלחוטית, חיזוקים (נוספים) ליכולות הצילום הקיימות (שכבר מזמן חצו את מה שנדרש ללקוח ממוצע), מסכים עם בהירות וחדות ב"מספרים" שלא הכרנו, שיפורים מרשימים ויזואלית אך פחות משמעותיים ביום יום בממשק המשתמש (ואפילו הסיפור הזה של המסכים המתקפלים), הם בסוף היום חלק מסטגנציה אמיתית בחדשנות המסעירה שהיתה בעבר חלק בלתי נפרד מהעולם הזה. באופן מסוים, יש בזה מן הדמיון לאבולוציה המוצרית שבסופה פעמים רבות אפליקציות יריבות הופכות לזהות, כשהן מעתיקות זו מזו פיצ'רים חדשניים (תוכלו לקרוא על כך בפוסט "בהשראת פיצ'ר אמיתי"), רק שבמקרה עולם ה- Mobile, מדובר במצב בו פיצ'רים חדשניים כאלו הפסיקו מלהופיע.

ובכל התקופה הזו, סערת התפרצות ה- AI שוטפת את העולם. מהיום בו השיקה OpenAI את Chat GPT זרמו מים רבים בנהר הגועש של הבינה המלאכותית, וקצרה היריעה מלפרט אותם בפוסט הזה, אבל לעניינינו חשוב לציין בעיקר את ההיבט המוצרי: אם בתחילת הסערה הדיבור היה סביב החלפתו של האדם ע"י AI, היום המונח הוא Productivity. תחומים רבים ביצעו זינוק מרשים ביכולת היצירה והסיוע של ה- AI, או למעשה ה- GenAI, לביצוע משימות, וכדי לחדד ראו כמה דוגמאות בקליפת האגוז: אינספור צ'טבוטים, שהחלו כבר בתהליך של התמקצעות לתחומי ידע ספציפיים; מודלי LLM שמשתכללים מיום ליום עד שעתה מדובר על שילוב של כמה מהם לטיוב התוצאות; אינספור מחוללי תמונות דוגמת Midjourney, DALL-E ובהמשך גם של חברות גדולות כמו Adobe ו- Canva; סנסציית ה- Text-to-Video שהחלה עם השקת Sora, מחולל הווידיאו של OpenAI, שהביאה אף היא לגל של שירותים דומים, וכל זאת בלי להיכנס להיבטים של חדירת הבינה המלאכותית לעולמות טכנולוגיים של כתיבת קוד, טיוב שידורים, אנליזה, וכד'.

ככל שחדירתו של ה- AI לעולמות חדשים התחזקה, כך התגברה התמיהה על היעדרו של הצעד המתבקש מכולם – כניסה אמיתית ומפוקסת לסמארטפונים שלנו. מה יותר הגיוני מלשים את היוצרים "המסייעים" הללו, שאמורים להגביר את "הפרודוקטיביות" שלנו, על המכשיר שצמוד אלינו כל היום. במחשבה ראשונה עולה עניין כוח המחשוב - ברור שהיכולות הנדרשות להפעלת מודלי AI היא עצומה, וסמארטפון הוא לא מחשב. אבל היא הרי מתנהלת (בגדול) בכלל בענן. עניין האבטחה גם הוא בעייתי, משום שכאן יש שילוב של מידע אישי מאוד שנמצא על הנייד ולכאורה חשוף לפעילות השירותים, אבל גם זה לא מסביר לחלוטין את ההתמהמהות המאוד בולטת בהטמעת הבינה המלאכותית ב- Mobile.

הסיבה המרכזית קשורה כנראה למשהו הרבה יותר בסיסי ומורכב בו זמנית, והיא שלא היה ברור מה האסטרטגיה הנכונה לכניסה שכזו. נתחיל מזה שזו שאלה גדולה בכלל בתחום ה- AI, שנראה אז יותר ויותר כמו יכולות ספורדיות במספר תחומים ללא חוט מקשר ביניהם. כל עניין ההגדרה כ- Productivity הגיע לאור העובדה שבפועל יכולותיו והתוצאות שהוא מחולל מביאות הרבה יעילות, אך רחוקות מאותו חזון של החלפת האדם (אפילו ברמת הצורך בפיקוח על תוצריו, בכל התחומים, החל מטקסטים שהוא מחולל, עד קודים, אמנות וכו'). מיתוג שירותי הבינה המלאכותית תחת מעטפת אחת (שאינם תמיד בהלימה זהה לגבי משמעותם ללקוח), כמו ה- CoPilot של Microsoft, הוא עדות לחשיבה אסטרטגית מפוקחת, בה ארסנל היכולות שהחברה מציעה מתמקד בהיותו "טייס משנה", מה שיוצר תיאום ציפיות אמיתי עם המשתמש ומכוון נכונה את אופן העבודה.

הדוגמא הבולטת ביותר לאותה התלבטות אסטרטגית ב- Mobile הגיע מכיוונה של Apple, שבניגוד לענקיות טכנולוגיה אחרות שהתקדמו בתחום, חלקם אף החלו לבנות מודלי LLM משלהן, לא הציגה תקופה ארוכה עמדה ברורה לאיזה כיוון היא מעוניינת לצעוד - דבר חריג ובעייתי שכן היא במקרים רבים עמוד האש המוביל את המחנה. שמועות רבות נפוצו הן על פיתוח פנימי, הן על שת"פים עם חברות אחרות והן על הפתעות צפויות בהכרזות שלה, אבל בשורה התחתונה לא הגיע בשורה, וכלל לא נראה כיוון שיוביל לאג'נדה ברורה. כאן חשוב להדגיש שלא מדובר במצב של מדבר מוחלט, אלא יותר עניין של צפיה לצונאמי שבושש מלהגיע. ה- AI חווה כמובן ניצנים של כניסה ל- Smartphone, ולא רק בשל השקתן של אפליקציות של שירותים פופולאריים, דוגמת ChatGPT. גם ענקיות דוגמת Google, החלו בשילוב פיצ'רים מסוימים, אבל שוב, כנגיעות בודדות.

אולם בחודשים האחרונים אירעו מספר הכרזות והשקות משמעותיות, שהכניסו את השוק למעין מרוץ אחר עליונות מוצרית בתחום ה- AIע"ג הסמארטפון. כניסה מוצהרת ומפוקסת של כמה מענקיות ה- Mobile והטכנולוגיה, שהיא גם ביטוי מעשי לאופן בו אותה סטגנציה שדיברנו עליה קודם, הפכה את הבינה המלאכותית למוצא היחיד מהפלונטר - כזו שמעבירה את הדגש מחדשנות בחומרה לחדשנות בתוכנה. מכשירי הקצה, במגמה שהחלה Google לפני שנים בודדות, הפכו לפלטפורמה (פיזית ומטפורית) של SaaS, במסגרתה רוכש הלקוח Ecosystem ממנו יהיה לו קשה להתנתק, כזה שמתעדכן כל הזמן בפיצ'רי AI שיהפכו ליותר ויותר נדרשים. במגרש הזה מתרחש הקרב על העליונות, ומוצרי הבינה המלאכותית הם הנשק.

כאן נתחיל, בראשית השנה, עם ההכרזה של סמסונג על מכשיר הדגל שלה – ה- S24 – ששווקה ותוקשרה לעולם כהשקת ה- Samsung AI. ממש כך, השקת מכשיר כשהפוקוס הוא על התוכנה ולא על המכשיר עצמו. אז לא נתעכב בשיפורים בחומרה, אלא ניגש ישר לפיצ'רי ה- AI שהוצגו:

אחד מהמדוברים שבהם היה יכולת לקיים שיחות בשפות שונות ע"י תרגום לשפת המשתמש בצד השני בזמן אמת. התמיכה בעת ההשקה היתה ב- 13 שפות, אבל כחלק מחיזוק ה- Stickiness של הלקוח, הובטחו בעתיד עדכוני תוכנה שיוסיפו שפות נוספות.

כמו כן הוטמע ה- Circle to Search, אותו פיתוח של Google המאפשר סימון בעיגול של טקסט, תמונות, אייקונים וכד', ואז ביצוע חיפוש של מה שסומן. גם יכולות פופולאריות של תמצות כתבות מהרשת (וביצוע עוד אחד על בסיסו) ובתמונת ראי גם לקבל הרחבה של טקסט מסוים נחשפו, וכנגזרת מוכרת בעולם הטקסטואלי גם מובאות אפשרויות לשכתוב, כמו שינוי טון הכתיבה.

תחום הצילום אף הוא קיבל את חלקו, ובדומה ל- Google, יאפשר ה- AI עריכת תמונות, כמו הזזת אובייקטים בתמונה. מעניין לציין כאן ש- Samsung, בניגוד ל- Google, מוסיפה סימון על גבי התמונה שיבהיר שמדובר בתמונה מעובדת.

תגידו, אוקיי, מעניין, אבל זה גם סוג של נגיעות פה ושם, לא? זה נכון תכלס, אבל מעבר להצהרה של "אנחנו הולכים על AI ובגדול", היו כאן עוד כמה אלמנטים מעניינים. ראשית, הצעה ל- 7 שנות עדכוני תוכנה, שמעידה על הפיכת ה- Software והפיצ'רים שאיתה לכוכבת האמיתית. לכך יש להוסיף ש"באותיות הקטנות" צוין שפיצ'רי ה- Galaxy AI יהיו זמינים בחינם עד סוף 2025, עדות לבנייתו של התחום הזה כמנוע צמיחה משמעותי בעתיד. ובנוסף, Samsung הצהירה שהפיצ'רים יגיעו גם "למכשירים נבחרים" נוספים, ולא יהיו מוגבלים דווקא לדגם האחרון והיקר. כך שבסיכומו של דבר לעניינינו, השקת ה- S 24 היא נקודת ציון משמעותית באופן בו נתפס ציוד הקצה מול החומרה שיושבת עליו: מעתה, ה- AI הופך ל- Game Changer.

ואז לפני כחודשיים, הגיע הרגע לו חיכו רבים, רגע שאפילו המפתחים שמאחוריו הודו "שלקח הרבה מאוד זמן..." אחרי שנתיים של המתנה, חשפה Apple בכנס המפתחים השנתי שלה (ה-WWDC 2024) את Apple Intelligence: פלטפורמת ה- AI שפיתחה "בחשאי". בהתאם למסורת של החברה, גם כאן מדובר ביצירה מרשימה של מיתוג ושיווק. הנוסח המדויק: "AI for the rest of us". וכן, ראשי תיבות של השם הם: AI... למעשה מדובר במינוף של יכולות ה- Gen AI שכבר קיימות לרמה אחת גבוהה יותר, חבילת פיצ'רים מהודקת היטב (לא יכולת אחת שפועלת כ- Stand-alone) ושמגיעה עם גישה מאוד Apple-ית. כפי שהחברה הציגה זאת, כלי ה- AIהקיימים לא באמת מכירים את המשתמש, ואילו Apple Intelligence מוטמעת עמוק בתוך מערכת ההפעלה של ה- iPhone, כך שיכולתה לגשת למידע ולאפליקציית של המשתמש גבוהה יותר, ובהתאם גם יכולתה לבצע פעולות ולתת תשובות באופן הרבה יותר מותאם, רלוונטי ופרסונלי.

גזרת הטקסט הוצגה תחת השם Writing Tools, והיא תהיה זמינה בכל אפליקציות Apple שעל המכשיר, כולל דוא"ל, הודעות, עמודים מכל הסוגים והתראות. הכלי מאפשר קבלת סיכומים של טקסט, ביצוע הגהה, כתיבת הודעות, והכל ע"י שימוש בפרומטים (הנחיות) כמובן. שכתוב יוכל להיעשות לפי טון מבוקש (כמו חידוד טקסט לסגנון מקצועי יותר) והמשתמש יוכל גם לקבל כמה הצעות תשובה למייל שקיבל, מבוססות על התכתבויות עבר (כולל כאמור קבלת סיכום של ההתכתבות, שבו גם תמצות של Action itemsלדוגמא).

בגזרת ה- Image Generation, נתחיל מפיצ'ר כל כך Apple-י (...) שמאפשר יצירת אימוג'ים בסגנון המוכר מה- iPhone (הם קוראים לזה Genmojis). הפיצ'ר המרכזי בגזרה הוא ה- Image Playground: אפליקציית מחולל התמונות (ה- Midjourney של Appleלצורך העניין) שמאפשרת יצירת תמונות גם על בסיס תבניות אופציונליות, שמוצגות בהתאם להתכתבות או בחיבור למה שהמשתמש עוסק בו באותו זמן (במקום שימוש בפרומטים ארוכים ומייגעים). ניתן יהיה להשתמש בתמונות במגוון הקשרים, החל מהודעות, מצגות ועד שיתוף כמובן ברשתות החברתיות.

ה- Image Wand לעומת זאת מאפשר לחולל תמונה לפי ציור של המשתמש או פריט כלשהו על המסך, ובגזרת החיפוש ניתן יהיה לאתר סרטונים ותמונות ספציפיים בשימוש בשפה "טבעית". אם חשקה נפשכם ביצירת סרטון, כמו סיכום יומהולדת משפחתי, תיאור טקסטואלי מחודד יביא לכם כזה, כשעלילת הסרטון" תהיה בהתאם לנרטיב שבחרתם (כמו קבלת פנים, נאום מרכזי, רחבת הריקודים וכו').

וכמובן, יש גם שדרוג משמעותי ביכולותיה של העוזרת האישית הוותיקה Siri, שמלווה את משתמשי Apple כבר 13 שנים ברמה זו או אחרת של הצלחה, ולא זכתה למתיחת פנים ראויה. גם כאן Siri מוטמעת עמוק יותר בתוך מערכת ההפעלה, כפי שניתן לראות למשל בהחלפת האייקון המוכר באור זוהר בקצה המסך. מה שחשוב יותר הוא ש- Siri תעבוד בתוך האפליקציות – למשל עריכת תמונה והעברתה ישירות להודעה. כך, הסרבול שאפיין בעבר את חוויית השימוש בעוזרת האישית אמור כמעט להיעלם, כשבנוסף יהיה חיבור ל- "Onscreen Awareness": הוא שימוש בהקשר לתוכן בו עוסק המשתמש כדי לתת לו מענה מדויק יותר.

התגובות להכרזה של Apple היו אמביוולנטיות: מצד אחד, בשעה טובה, הצטרפה גם Apple לקרב עליונות ה- AI, לאחר שזרם בלתי פוסק של חידושים מצד מתחרותיה בתחום הגיע לשוק (והעלה לרבים את השאלה: האם ענקית הטכנולוגיה עלולה להחמיץ את הרכבת?). הקונספט המהודק של Apple Intelligence אכן מביא עמו סדרת מכובדת של יכולות, שיחד עם הטמעה עמוקה במערכת ההפעלה אמורות לתת חוויה פרסונלית, חוצת מכשיר ומדויקת יותר. ה- Ecosystem העצום ש- Apple מחוברת אליו (או במילים אחרות המידע האישי של משתמשיה), נותן לה פוטנציאל למענה פרסונלי יותר, שמתחרותיה לא יוכלו להעניק. מנגד, כבר בהכרזה ניתן היה לזהות תחומים מסוימים בהן היא נופלת מהמתחרות, כמו יכולות מוגבלות יחסית בתחום ה- Image Generation, שלא מאפשרות יצירת תמונות ריאליסטיות ברמה גבוהה כמו בשירותים מתחרים. Apple מודעת לכך, ולכן כבר החלה בשת"פ עם Open AI, כמו במקרה בו Siri תוכל להתחבר ל- Open AI כשתזדקק לדעתה לעזרה במתן תשובה מדויקת יותר.

אבל היתה גם אכזבה בולטת מההכרזה המפוארת והיא הגיע מקום אחר, פרקטי: בפועל, Apple Intelligence עדיין לא זמינה למשתמשים... ראינו הדגמות מרשימות, סרטונים מעוצבים, נאומים חוצבי לבבות – אבל הפיצ'רים הוגדרו כבטא, ויהיו זמינים רק מאוחר יותר השנה, ורק במכשירים החדשים והחזקים ביותר: iPhone 15 Pro ומעלה, אייפדים ומקים בעלי מעבדי M. ההכרזה על ה- iPhone 16, כפי שקבעה Apple, תהיה רק בספטמבר, והגרסה שאמורה לכלול את Apple Intelligence חודש אחרי. זה לא שיש בעיה עם הכרזה מוקדמת כמובן, בוודאי כשמדובר במהלך אסטרטגי כזה, אבל עבור משתמשים רבים, חוסר הזמינות בפועל של היכולות ומכאן חוסר היכולת לחוות באמת את ההבטחה של AI ברמה גבוהה יותר הוריד את ההתלהבות, ושם את כל הסיפור ברמת "הבטחה".

דוגמא מחודדת לבעיה הזו היא אופן הצגת פיצ'ר הקלטת השיחות ב- iPhone, שזכה לאזכור קצרצר של שניות בודדות באירוע. מדובר בבשורה גדולה למשתמשים, אחרי שנים בהן לא היתה אפשרות כזו (דבר שעורר תרעומת גדולה), כשבנוסף הכריזה Apple על הוספת תכונות AI תומכות: תמלול מלא של השיחה באפליקציית Notes (בתצוגה של דו-שיח) וקבלת סיכום של השיחה. התמלול יהיה זמין בשמונה שפות (אנגלית, ספרדית, צרפתית, גרמנית, יפנית, קנטונזית ופורטוגזית) ובנוסף הצהירה החברה שכל הצדדים בשיחה יהיו מודעים לכך שהם מוקלטים.

רק שבכך למעשה הסתיימה האינפורמציה על הפיצ'ר הזה, והיעדרה של אפשרות לבחון אותו בפועל (אפילו ברמת הנראות - כל שהוצג היה צילום מסך) יצרה גל של ספקולציות, ממקום של חוסר ודאות מה תהיה החוויה האמיתית. קחו את עניין יידוע המשוחחים על הקלטתם: האם מדובר בצליל המתריע על תחילת ההקלטה? אולי משפט דידקטי/משפטי? מה אם משהו מצטרף לשיחה באמצע ולא שמע את הודעה? ובכלל, איך מרגיש להפעיל את ההקלטה ברמת השימוש? מה רמת הסיכומים של התמלול? וכולי וכולי שאלות שעולות באופן טבעי כשאין אפשרות לבחון את המוצר, פשוט כי הוא לא הושק לקהל הרחב.

והפער הזה בין "הכרזה" להשקה" היה הסוד מאחורי ההצלחה הגדולה של המהלך של Google – השקת סדרת ה- Pixel 9 באמצע אוגוסט. אירוע ההשקה היווה את החשיפה הרשמית של הסדרה, כולל דגמי ה- Pro וה- Fold המסקרן, אבל היו אלה שלל תכונות הבינה המלאכותית החדשות שגנבו את ההצגה. כדי להבין מדוע מדובר בסוג של רעידת אדמה בקרב ה- AI, צריך להבהיר תחילה את הסיפור הגדול: Google הציגה ארסנל פיצ'רים חדשים שעובד וזמין למשתמשים. שימו לב מה הוא כולל:

ראשית, הוצג שדרוג משמעותי ביכולות Gemini, בין השאר בעוזרת האישית של Google, שהוטמעה באופן עמוק בתוך ה- Android, מה שאמור לאפשר אינטראקציה חלקה בשימוש בה יחד עם אפליקציות ומשימות מגוונות. הסיפור כאן, שהוא האתגר הראשוני בכל חוויית השימוש בעוזרת אישית, הוא ביצוע הדיאלוג בין המשתמש וה- AI באופן טבעי ואינטואיטיבי, קרוב ככל הניתן לשיחה עם אדם, וההטמעה העמוקה שבוצעה כאן מביאה את החוויה הזו לשיא חדש.

בשורה חשובה נוספת, שהעובדה שהיא עוסקת בפיצ'ר שעצם היותו זמין למשתמש היא הבשורה הגדולה באמת, היא ה- Pixel Studio, מחולל תמונות שפועל על גבי ה- Smartphone עצמו. כך, ממש עתה, מצוי כלי AI יצירתי וחזק מאוד בכיסו של המשתמש, והוא יכול ליצור ולערוך תמונות באמצעות בינה מלאכותית שפועלת ישירות על המכשיר (חלק מהאג'נדה שלGoogle לפיתוח יכולות עיבוד מתקדמות עוד יותר על גבי ה- Smartphone).

ב- Google התפקסו על שינוי תפיסתי של מהו ה- Smartphone עבורנו, כשבחרו את סט הפיצ'רים שמושקים בפועל. ניתן לראות זאת במיוחד בגזרת המצלמה, למשל פיצ'ר ה- Add Me, שמשתמש ברצפי תמונות יחד עם AI לשילובו של הצלם בתמונה קבוצתית (שמן הסתם הוא נעדר ממנה, כי הוא... הצלם). זה לא תהליך "קליל", ואפשר להתווכח על האופן בו יאומץ ע"י המשתמשים, אך הכוונה ברורה – להביא משהו חדש לעולם הנייד. באותו גזרה הוצגו גם שיפורים ליכולת הצילום מרחוק באמצעות ה- Super Rez Zoom, שאמור להפיק תמונות באיכות גבוה אפילו בהגדלה של פי 20, והוצגה השוואה "בשטח" של צילום פנורמה ע"ב הבינה המלאכותית שלה Google, מול darker image שבוצע ב- iPhone 15 Pro Max.

פיצ'רים נוספים שכדאי להתעכב עליהם, מגיעים מאזורים קלאסיים אליהם חדר ה- AI, אלא שכאן השילוב עם השימוש היומיומי שלנו בנייד משדרג באופן אמיתי את החוויה.

הראשון הוא היכולת ליצירת רשימה חכמה ב- Google Keep (למשל כזו של פריטים שנצפו בסרטון כלשהן), והשני הוא Pixel Screenshots, אפליקציה שמארגנת ושומרת מידע שנשמר על גבי צילומי המסך שהמשתמש מבצע. אני מניח שלכולנו יצא לעשות צילום מסך לשמירת רשימה או כתזכורת (סיסמא, בגד שמתחשק לקנות וכד') ואז לשכוח מהצילום הזה (שנקבר איפשהו במאגר התמונות שלנו). הפיצ'ר הזה הוא יישום מצוין של פעולה נפוצה שיחד עם יכולות ה-AI מקבלת ערך גדול בהרבה, והופכת את הנייד לסוג של ארכיון פונקציונלי עם יכולות חיפוש.

ושימו לב מה נותן לנו ה- Call Notes: הוא לוקח את השימוש הנפוץ ב... לעשות שיחות בנייד, ומחולל באמצעות AI סיכומים שלהן, שמאפשרים למשתמש קריאה ובחינה חוזרת של המידע, וחוסכות ממנו את השיטה הישנה של כתיבת הערות תוך כדי שיחה. קשה לדמיין חיבור שימושי וטבעי יותר בין הפיצ'רים הללו ליתרונות הנייד, אלא שזה מגביר באותו הזמן את החשש לפגיעה בפרטיות – אחרי הכל, יש כאן מעורבות של בינה מלאכותית במידע האישי ביותר של המשתמש. Google, כפי שציינתי קודם, שמה בפרונט את יכולות העיבוד בתוך המכשיר, ומבטיחה שבמקרים הללו התהליך כולו הוא on-device, מה שלא בטוח שאכן אפשרי לגבי יכולות אחרות שכלולות במנוע ה- Gemini שלה.

ההשקה של סדרת הפיצ'רים הזו הביאה לתגובות נלהבות, הן מהטעם שהציגה יכולות חדשות שטרם נראו אצל המתחרות, והן (וזו היתה התגובה החזקה ביותר): בעוד Apple עושה הכרזות, Google משיקה פיצ'רים. בפועל. וזו מהווה עליית מדרגה בקרב על העליונות המוצרית: Google הציבה רף גבוה ל- Apple לקראת השקות ה- iPhone16 וגרסת ה- iOS18 (שאמורה היתה להיות ההשקה בפועל של Apple Intelligence). מכירות ה- iPhone ירדו באופן מבוהק בשנה האחרונה (למעשה מהוות עתה את האחוז הנמוך ביותר שלהן מכלל מכירות החברה בארבע השנים האחרונות) ובהנחה שה- iPhone החדש לא יהיה שונה ברמת החומרה באופן דרמטי מקודמיו, על Apple Intelligence נופלת האחריות של הדלקת התלהבות הצרכנים מחדש.

כך שהתעשייה כולה המתינה לתשובת Apple, כדי להבין היכן היא במרוץ: האם תוכל לעקוף את Google בפרט ואת מתחרותיה בכלל, לאור העיכוב אותו ציינו בכניסה מלאה לתחום ה- AI, או אולי יש פער בין ההבטחות לבין חוויית המשתמש בפועל. השבוע התקיים האירוע השנתי הגדול של Apple, שנקרא הפעם "Glowtime" (סוג של קריצה לאפקט שאמור להופיע מעתה עם הפעלת Siri). במסגרת הכנס הושקה כאמור סדרת ה- iPhone 16 החדשה (לצד Apple Watch ואוזניות Airpods חדשות), שהציגה, כצפוי, חידושים מינוריים יחסית בגזרת החומרה. הבולט שבהם הוא כנראה כפתור חדש – Camera control, שנמצא בצדו הימני של המכשיר. הכפתור מאפשר בעזרת סט של חיישנים ללחוץ/להחליק לשליטה בזום, פוקוס (חצי לחיצה כמו במצלמות DSLR) וכד', חלק מהשדרוג המסורתי של יכולות הצילום. נקודה חשובה היתה הכנסת שבב ה- A18 Bionic החדש, שאמור לפי Apple להתחרות אפילו בשבבי המחשבים המתקדמים, והטמעתו ב- iPhone 16 היוותה סוג של קפיצה, שכן אמור היה לקבל את השבב הקודם, ה- A17.

אבל בגזרתנו, תחת השאלה: "אפשר כבר להתנסות ביכולות ה- Apple Intelligence?" לא הגיע בשורה של ממש. מבחינת הפיצ'רים, הוצגו אלו שכבר נחשפנו אליהם ב- WWDC 2024, כמו יכולות ה- Writing tools, Image Playground ו"העידן החדש של Siri" כמו שהם קוראים לזה, כולל ה- On-screen Awareness של פעולות שעושה המשתמש באותו זמן על המכשיר. פיצ'ר אחד שזכה להצגה מעניינת יותר הוא ה- Visual Search, שבעזרת יכולות ה- AI של Apple משלב פונקציות של חיפוש תמונות עם זיהוי טקסט כדי לבצע שורה של פעולות: החל מהוספת פרטים של אירוע (שהמשתמש רואה כמודעת חוצות) ללוח השנה ועד שליפת מידע על מסעדה שמצלמים ברחוב. הדגש הגדול גם הפעם היה על יכולות האבטחה, עננים בעלי עוצמה חזקה, שמירה על הפרטיות וההטמעה העמוקה בתוך מערכת ההפעלה, אולם הכל בטרמינולוגיה של "בעתיד"...

וכאן מגיעה (שוב) האכזבה: Apple Intelligence לא זמינה (גם הפעם) על המכשירים החדשים. בשלב זה... ליין הפיצ'רים שהוצג יהיה זמין רק בבטא החל מהחודש הבא, ורק באנגלית, בעוד העדכון הרשמי של iOS18 שיושק להתקנה באמצע ספטמבר, לא יתעכב בשל העדרם. בסופו של יום, גם במסגרת החגיגה הגדולה של דור מכשירי הקצה החדש של החברה, חווית השימוש ב- Apple Intelligenceנותרה לצפייה בלבד בסרטוני וידיאו מהוקצעים ומוקלטים מראש, ומשתמשי ה- iPhone ייאלצו לחכות עוד חודשים כדי לחוש האם באמת הצליחה Apple להביא את קפיצת הענק שהיא מתיימרת לה, ביכולות השימוש בבינה מלאכותית במכשיר הקרוב ביותר אלינו.

תהיה התשובה אשר תהיה, הן מצד Apple והן מצד Google ושאר ענקיות התעשייה (והרבה סטרטאפים יצירתיים ונועזים), שלא מורידות את הרגל מהדוושה בשכלול המודלים והחיפוש אחר מוצרים בעלי משמעות, מה שבטוח הוא שהחודשים האחרונים מהווים את חציית הרוביקון של הקשר הנוכחי בינינו המשתמשים והסמארטפונים שלנו. ככל שתתפתח ותתעצב חווית המשתמש, שהיא בסופו של דבר סינרגיה מוצרית חכמה של שלל יכולות ה- AI, כך תעוצב גם האינטראקציה שלנו עם המכשיר והמקום אותו הוא תופס בחיי היומיום.

בניה נכונה של ארסנל מוצרים קוהרנטי, מחובר בצורה יעילה ולא מאולצת עם המידע והרגלי השימוש שלנו, יכולה להביא לקפיצת מדרגה בהיבטים החיוביים שמעניק לנו הסמארטפון. אולם כאן יעלו גם שאלות אתיות רבות, סוגיות כבדות משקל של פרטיות המשתמש, כמו גם שאלת החלפת יצירתיות האדם בבינה המלאכותית – שאלות שהן במהות עולם ה- AI, אך מתחזקות עוד יותר כשהוא בשימוש ע"ג הנייד. יש כאן עליית מדרגה באותה שכבה היקפית של ניהול מוצר, זו שסובבת את הפרקטיקה של תהליך בריאתו, ותהווה גם נקודת מוצא לכל תהליך החשיבה מראשית האפיון ועד ההשקה.

נדמה לי שפה, יותר מבתחומים אחרים, הסנכרון בין ארסנל המוצרים יהיה בליבת עבודתו של מנהל המוצר: היכולת לפעול ליצירת סינרגיה אמיתית של יכולתAIאחודה. אותה חברה שלא תצליח לייצר את ה"שלם הגדול מסכום חלקיו", תישאר מאחור עם חבילת פיצ'רים ספורדיים ורחוקים ממימוש פוטנציאל השימוש, ולפי המגמה המתחזקת של חשיבות התוכנה (והמוצרים הקשורים אליה) על פני החומרה, כאן ,בזירה המוצרית הזו, יתנהל הקרב האמיתי על המובילות בעולם ה-Mobil

קרב ה- AI על עליונות מוצרית בסמארטפון

פוסטים אחרונים

Bình luận

יש לכם תגובה? הערה? זרקו לי מילה, מבטיח לקרוא