این شرکت حدود یک هفته قبل جمینی ۱.۰ اولترا قدرتمندترین مدل هوش مصنوعی خود را راه‌اندازی و اکنون جانشین آن یعنی جمینی ۱.۵ را معرفی کرده است. این نسل از مدل‌های هوش مصنوعی سریع‌تر، هوشمندتر و ماهرتر از نمونه‌های قبلی است. جمینی ۱.۵ حاصل نوآوری‌های خستگی‌ناپذیر گوگل در حوزه پردازش زبان طبیعی (NLP) است. NLP شاخه‌ای هوش مصنوعی مرتبط با درک و تولید زبان انسان است. گوگل مدعی است جمینی ۱.۵ می‌تواند تا یک میلیون توکن ورودی معادل ۴ میلیون کاراکتر یا ۸۰۰ هزار واژه را کنترل کند. این رقم ۷۰۰ بار بیشتر از رکورد جی‌پی‌تی-۴ (رکورددار قبلی این حوزه) است که قادر به پردازش ۱۲۸ هزار توکن است. چنین آمار و ارقامی بدان معنا است که جمینی ۱.۵ می‌تواند متون طولانی‌تر و پیچیده‌تر مانند رمان، مقالات یا سخنرانی‌ها را درک و تولید و همزمان هماهنگی و کیفیت را حفظ کند.

از سوی دیگر جمینی ۱.۵ می‌تواند داده‌های ورودی چندوجهی مانند متن، عکس، صوت و ویدئو را مدیریت و بازده‌هایی در هریک از این فرمت‌ها تولید کند. به عنوان مثال جمینی ۱.۵ می‌تواند با توجه به یک ویدئوکلیپ به سوالات پاسخ دهد یا براساس متن، شعری بسازد. علاوه بر آنچه گفته شد، جمینی ۱.۵ یک مدل نیست، بلکه خانواده‌ای از مدل‌های هوش مصنوعی است که نیازهای مختلفی دارند و برای مقاصد متفاوتی به کار می‌روند. جمینی ۱.۵ پرو یک مدل چند منظوره‌تر وسیع به حساب می‌آید که از نظر عملکرد با جمینی ۱.۰ اولترا قابل‌مقایسه است. اما قدرت رایانشی کمتری را به کار می‌گیرد. این آن را برای موارد استفاده در دنیای واقعی کارآمدتر و مقیاس‌پذیرتر می‌کند. جمینی ۱.۵ پرو همچنین نخستین مدلی است که از تکنیک جدیدی به نامMixture-of-Experts )MoE) (ترکیب کارشناسان) استفاده می‌کند. این امر به آن اجازه می‌دهد تا به‌ جای آنکه در هر بار جست‌وجو کل مدل به کار گرفته شود، بخش‌های مرتبط انتخاب شوند.