👉 Capacitatea Agentic Vision îmbunătățește precizia în sarcinile vizuale
Agentic Vision este o nouă capacitate a modelului Gemini 3 Flash, care face sarcinile legate de imagini mai precise prin „anclanșarea răspunsurilor în dovezi vizuale.” Potrivit 9to5google.com, modelele de inteligență artificială de frontieră, precum Gemini, procesează de obicei lumea într-o singură privire statică.
Dacă ele ratează un detaliu fin — cum ar fi un număr de serie pe un cip sau un semn de circulație îndepărtat — sunt nevoite să ghicească. Această nouă abordare „consideră viziunea ca o investigație activă” prin combinarea raționării vizuale cu execuția de cod și alte instrumente în viitor.
👉 Gemini 3 Flash utilizează un ciclu de procesare pentru analiza pas cu pas a imaginilor
Pentru a răspunde la solicitările de imagini, Gemini 3 Flash va formula „planuri pentru a face zoom, a inspecta și a manipula imaginile pas cu pas.” În mod specific, Agentic Vision folosește un „ciclul Gândire, Acțiune, Observare.”