Actualizat la: decembrie 8, 2023
Ce este Google Gemini?
Gemini este noua inteligență artificială generativă dezvoltată de Google, care va putea conversa într-un limbaj natural, înțelege și interpreta imagini, analiza materiale video, text și chiar audio. Practic, este primul competitor serios al Chat-GPT (dezvoltat de OpenAI) și al Microsoft Pilot.
Modelul inițial este disponibil începând din 7 decembrie 2023, ca partea integrantă a chat-ului Bard din Google.
În prezent, Gemini este disponibil doar în limba engleză și doar în cadrul Bard, însă va continua să fie extins la marea majoritate platformelor Google în lunile următoare.
Cu ce este diferit Gemini de alte modele de inteligență artificială?
Gemeni nu este un model singular de inteligență artificială ci este un produs combinat al mai multor modele de inteligență artificială (de aceea este denumit inteligență artificială multimodală). Pe scurt, a fost dezvoltat prin combinarea diferitelor modele de AI. Modelele de învățare automată și de inteligență artificială, cum ar fi procesarea grafică & audio, modelele lingvistice, programarea și modelele 3D trebuie integrate pentru a obține acea sinergie perfectă atunci când se dezvoltă o inteligența artificială multimodală. Aceasta este o sarcină dificilă pe care Google dorește să o ducă la un alt nivel din punct de vedere conceptual.
Care sunt principalele caracteristici ale Google Gemini?
Principalul motiv pentru care Google consideră Gemini ca fiind cel mai performant model al său este capacitatea multimodală a algoritmului. Cu alte cuvinte, noua tehnologie poate manipula și interpreta diverse tipologii de date. Principalele tipuri de date cu care Gemini poate interacționa sunt:
- Text
- Cod
- Audio
- Imagini
- Video
Gemini se bucură de o flexibilitate ridicată. Tehnologia care debutează astăzi se numește Gemini 1.0 și vine în trei „pachete” diferite.
- Gemini Ultra – cel performant model, folosit pentru sarcini complexe;
- Gemini Pro – varianta optimizată pentru o gamă extinsă de task-uri (Bard are integrată această versiune);
- Gemini Nano – model construit pentru eficiență, pentru task-uri pe diverse echipamente;
Pe scurt, Google își dorește ca Gemini să acopere o gamă vastă de utilizări, de la fermele de servere până la micile task-uri de care un utilizator poate avea nevoie atunci când își folosește telefonul sau tableta (sugestii de răspunsuri la mesaje, prelucrarea unor texte și așa mai departe). Așadar, propunerea unor versiuni cu capabilități diferite, lansate simultan, este una logică, deoarece fiecare versiune are adresabilități diferite.
Cine e mai puternic – Bard sau ChatGPT 3.5?
Conform datelor de mai jos, Bard este mai performant în toate departamentele comparativ cu ChatGPT5, mai puțin în ceea ce privește operațiile matematice.
Rezultatele sunt:
- Gemini Pro a obținut un scor de 79,13%, comparativ cu 70% obținut de GPT-3.5 la testul Multi-Task Language Understanding (MMLU).
- La testul care evaluează raționamentul matematic (GSM8K), Gemini Pro a avut un scor de 86,5% iar GPT-3.5 un scor de 57,1%.
- La testul de referință care evaluează generarea de cod (programare), Gemini Pro a obținut 67,7% iar GPT-3.5, doar 48,1%.
- La testul MATH, GPT-3.5 s-a descurcat mai bine, cu un scor de 34,1%, comparativ cu 32,6% pentru Gemini Pro.
Sursa datelor aici.
Cine e mai puternic – Gemini Ultra sau ChatGPT-4?
Conform datelor de mai jos, cele două modele, Gemini Ultra și ChatGPT-4, au performat similar în majoritatea testelor.
- Gemini Ultra a avut un scor de 90% la testul Massive Multitask Language Understanding (MMLU), demonstrând capacitatea sa de a înțelege aproape 60 de subiecte. Chat GPT-4V, a avut un scor de 86,4%.
- La capitolul raționament, Gemini Ultra a obținut un scor de 83,6% în cadrul benchmark-ului Big-Bench Hard, comparativ cu 83,1% pentru GPT-4V.
- La testul MATH, Gemini Ultra a obținut un scor de 94,4% la operații aritmetice de bază, în timp ce GPT-4V a obținut un scor de 92,0%
Sursa datelor aici.
Care sunt aplicațiile Google în care este integrat Gemini?
Așa cum am spus mai sus, Bard în limba engleză este disponibil acum pentru mai mult de 170 de țări. De asemenea, o versiune a Gemini este disponibilă pe sistemul de operare Pixel 8. Spre finalul lunii, Gemini va deveni disponibil pentru dezvoltatori: API-ul Google Cloud va include Gemini începând cu data de 13 decembrie 2023.
În ceea ce privește integrările suplimentare Gemini, Google a anunțat că pe parcursul anului viitor produsul va deveni disponibil în: Search, Google Ads și Chrome.
Când va fi lansat Gemini Ultra?
Gemini Ultra va fi lansat în decursul anului 2024. Ce va avea în plus față de modelele actuale? O funcționalitate mai rafinată, îmbunătățită, datorită reinforcement learning from human feedback, prescurtat RLHF. Pe scurt, algoritmul va putea învăța continuu pe baza feedback-ului primit de la utilizatori. Desigur, anumiți dezvoltatori vor avea acces la versiunea beta în avans, pentru a oferi feedback constructiv. Tot în 2024 va fi lansat și Bard Advanced, o interfață Bard care va include cele mai recente modele, inclusiv Ultra (odată ce acesta va fi disponibil, desigur).
Cât va costa Google Gemini?
În prezent, puteți utiliza Gemini complet gratuit – desigur, pentru anumite funcții de bază. Cea mai ușoară metodă să vă familiarizați cu platforma este Bard. Desigur, acest produs va începe să fie monetizat începând cu anul viitor.
Similar, ChatGPT 3.5 este disponibil gratuit pentru orice persoană care îș face un cont. Versiunea ChatGPT Plus costă 20 de dolari pe lună și vă oferă un model mai avansat, plus posibilitatea de a integra plugin-uri ChatGPT.
În prezent, Google utilizează versiuni ale AI în platforme care sunt folosite de miliarde de oameni în fiecare zi: Search, YouTube, Gmail, Google Maps, Google Ads, Google Play și Android. În viitorul nu foarte îndepărtat, Google probabil că va integra Gemini în toate aceste servicii.
Concluzii
Google Gemini reprezintă un pas semnificativ în evoluția inteligenței artificiale, marcând o tranziție importantă către modele AI multimodale și mai complexe. Prin abilitatea de a procesa și interpreta diverse tipuri de date – text, cod, audio, imagini și video – Gemini stabilește un nou standard în domeniul AI.
Comparativ cu Chat-GPT și alte modele existente, Gemini demonstrează o capacitate superioară în înțelegerea limbajului și procesarea datelor, oferind astfel răspunsuri și soluții mai precise și relevante. Diversitatea versiunilor – Ultra, Pro și Nano – reflectă dorința Google de a oferi soluții adaptate pentru o gamă largă de aplicații, de la procese complexe la task-uri uzuale, care pot fi adresate de pe dispozitive mobile.
Odată cu lansarea viitoare a Gemini Ultra în 2024 și integrarea sa în servicii precum Search, Google Ads și Chrome, ne putem aștepta la o îmbunătățire semnificativă a experienței utilizatorilor pe platformele Google. Acest lucru sugerează o era nouă în care inteligența artificială va juca un rol tot mai central în zona digitală și nu numai.
Ovidiu Selejan
Postări similare
Lasă un răspuns Anulează răspunsul
Acest site folosește Akismet pentru a reduce spamul. Află cum sunt procesate datele comentariilor tale.
Caută
Ultimele postări
Categorii
- Automation8 (8)
- E-commerce34 (34)
- Facebook Ads47 (47)
- Google Ads52 (52)
- Instagram8 (8)
- Recenzii cărţi4 (4)
- SEO61 (61)
- Strategie On-line164 (164)
- Tools2 (2)
- Website16 (16)
Stay connected