Înapoi
Noua „Viziune Agentică” a Gemini 3 Flash îmbunătățește răspunsurile la imagini
Tech

Noua „Viziune Agentică” a Gemini 3 Flash îmbunătățește răspunsurile la imagini

Postat 2 ore în urmă

Update 47 minute în urmă

Timp de citire: 1 minut

Articol scris de: Elena Dumitrescu

👉 Capacitatea Agentic Vision îmbunătățește precizia în sarcinile vizuale

Agentic Vision este o nouă capacitate a modelului Gemini 3 Flash, care face sarcinile legate de imagini mai precise prin „anclanșarea răspunsurilor în dovezi vizuale.” Potrivit 9to5google.com, modelele de inteligență artificială de frontieră, precum Gemini, procesează de obicei lumea într-o singură privire statică.

Dacă ele ratează un detaliu fin — cum ar fi un număr de serie pe un cip sau un semn de circulație îndepărtat — sunt nevoite să ghicească. Această nouă abordare „consideră viziunea ca o investigație activă” prin combinarea raționării vizuale cu execuția de cod și alte instrumente în viitor.

👉 Gemini 3 Flash utilizează un ciclu de procesare pentru analiza pas cu pas a imaginilor

Pentru a răspunde la solicitările de imagini, Gemini 3 Flash va formula „planuri pentru a face zoom, a inspecta și a manipula imaginile pas cu pas.” În mod specific, Agentic Vision folosește un „ciclul Gândire, Acțiune, Observare.”

Distribuie aceasta stire pe social media sau mail
Alte postari din Tech
Tech

În viziunea Google de a transforma Gmail într-un centru de comandă personal pentru agenți AI

Un articol scris de David Gewirtz, editor senior la ZDNET, discută despre evoluția Gmail, care ar putea deveni un asistent personal AI. Conform zdnet.com, Google își propune să redefinească modul în care utilizatorii gestionează informațiile în aplicația de email, făcând-o mai interactivă și mai personalizată pentru peste trei miliarde de utilizatori din întreaga lume.

Acasa Recente Radio Județe