Il panorama dell’intelligenza artificiale sta vivendo una trasformazione febbrile e inesorabile. Se fino a poco tempo fa il dibattito era dominato da modelli linguistici sempre più grandi e capaci di conversare, oggi l’epicentro dell’innovazione si è spostato con decisione verso gli agenti AI. Aziende di ogni dimensione, dalle startup più agili ai colossi tecnologici, stanno riversando risorse incalcolabili nella creazione di agenti completamente autonomi, capaci di comprendere un obiettivo, pianificare ed interagire con l’ambiente digitale per raggiungerlo. La posta in gioco, sussurrata in ogni white paper e ad ogni conferenza, è l’inseguimento del Graal tecnologico: una possibile Intelligenza Artificiale Generale (AGI), un’intelligenza sintetica con capacità di ragionamento ed apprendimento paragonabili a quelle umane.

In questa corsa sfrenata verso il futuro, Runner H emerge come l’ultimo esempio di questa tendenza. Sviluppato dalla startup francese H Company, questo agente AI è specializzato nell’automazione web, un’entità digitale che vive all’interno del browser con lo scopo di eseguire compiti complessi interagendo con le applicazioni web esattamente come fareste voi. Non si limita a generare risposte o codice, prende il controllo del cursore, clicca pulsanti e digita testo, navigando la complessità delle interfacce utente grafiche con una fluidità impressionante, più o meno come la maggior parte di questi software che abbiamo visto in altri articoli di questo blog.

Runner H: l’agente AI che esegue comandi in modo autonomo

Per afferrare la vera essenza di Runner H, dobbiamo abbandonare l’idea tradizionale di software a cui siamo stati abituati per decenni. Non è un’applicazione con pulsanti e menu predefiniti ma un programma all’interno del browser, osservando, comprendendo ed agendo sull’interfaccia grafica delle pagine web.

Il suo scopo non è quello di sostituire gli strumenti che già utilizziamo, ma di diventarne il miglior utente possibile. Che si tratti di smistare la posta in arrivo, aggiornare un database o compilare un report, Runner H si propone come l’esecutore definitivo, un ponte tra le nostre intenzioni, espresse in linguaggio naturale, e le azioni concrete necessarie per realizzarle nel mondo digitale.

Svolge attività su Gmail, Notion, Docs e Sheets

La vera magia di Runner H si manifesta nella sua capacità di operare trasversalmente su alcune delle applicazioni più diffuse nel mondo del lavoro. Non è un automa limitato ad un singolo sito, ma un agente versatile in grado di navigare con tra diverse piattaforme, orchestrando compiti che le coinvolgono tutte.

Pensiamo ad un flusso di lavoro tipico: un cliente invia un’email su Gmail con allegato un PDF contenente dei dati di vendita. Con un approccio tradizionale, dovremmo aprire l’email, scaricare l’allegato, aprirlo, copiare i dati, incollarli in un foglio Google Sheets, magari riorganizzarli, creare un grafico e infine aggiornare lo stato del progetto su Notion. Un processo che, seppur semplice, richiede numerosi passaggi e un continuo cambio di contesto.

Con Runner H, questo intero processo può essere condensato in un’unica istruzione: “Leggi l’ultima email dal cliente X, estrai i dati dal PDF allegato, aggiorna il foglio di calcolo ‘Vendite Q3’ su Google Sheets e segna il task ‘Aggiornamento Dati Cliente X’ come completato su Notion.” L’agente eseguirà autonomamente ogni singolo passaggio, navigando tra le schede del browser, cliccando sui pulsanti giusti e trasferendo le informazioni da un’applicazione all’altra. Allo stesso modo, può essere incaricato di leggere un documento su Google Docs, riassumerne i punti chiave e creare una nuova pagina su Notion con il riassunto, dimostrando una fluidità operativa che finora era impensabile.

Porta a termine i task senza supervisione

La caratteristica che distingue un vero agente da un semplice script di automazione è l’autonomia. Runner H è progettato per operare senza una supervisione umana costante. Una volta che l’obiettivo è stato assegnato, l’agente non si limita ad eseguire ciecamente una sequenza di comandi pre-registrati. Al contrario, pianifica una serie di azioni, le esegue e, cosa ancora più importante, è in grado di gestire le piccole variazioni e gli imprevisti che possono verificarsi.

Se un’interfaccia web cambia leggermente o se un pulsante si sposta, un’automazione tradizionale fallirebbe miseramente. Runner H, grazie alla sua comprensione visiva dell’interfaccia, è in grado di adattarsi. Comprende che “il pulsante blu con la scritta Invia” è sempre lo stesso, anche se la sua posizione è leggermente diversa. Questa capacità di operare in modo robusto e persistente è ciò che gli consente di portare a termine compiti complessi che possono richiedere diversi minuti, o anche ore, per essere completati. L’utente può avviare un task e dedicarsi ad altro, con la fiducia che l’agente continuerà a lavorare in background, superando gli ostacoli minori fino al raggiungimento del risultato finale.

Agisce sulle interfacce grafiche come un utente reale

Il segreto dell’efficacia di Runner H risiede nel suo imitare il comportamento di un utente umano. Invece di fare affidamento su API complesse e specifiche per ogni applicazione, che spesso non sono disponibili o sono limitate, Runner H interagisce direttamente con l’interfaccia utente grafica (GUI) che vediamo nel nostro dispositivo.

Quando gli chiediamo di inviare un’email, non si collega al server di posta tramite un protocollo oscuro. Muove il cursore virtuale sul pulsante “Scrivi”, clicca, digita il testo nel campo del destinatario e del corpo del messaggio, e infine preme “Invia”. Questo approccio ha due vantaggi enormi. Primo, è universalmente applicabile: funziona su quasi qualsiasi sito web o applicazione web, senza la necessità di integrazioni su misura. Secondo, è intrinsecamente più robusto ai cambiamenti. Finché l’interfaccia rimane comprensibile per un essere umano, lo sarà anche per Runner H. Questa interazione a livello di GUI è resa possibile da una tecnologia sofisticata che gli permette di “vedere” e “comprendere” lo schermo, trasformando pixel e codice HTML in elementi funzionali come pulsanti, campi di testo e link.

Automatizza i flussi di lavoro quotidiani

L’obiettivo finale di uno strumento come Runner H non è stupire con prodezze tecnologiche, ma risolvere un problema molto concreto: la tirannia del “lavoro di routine”. Ogni professionista, a prescindere dal settore, dedica una parte significativa del proprio tempo ad attività ripetitive e a basso valore aggiunto. È proprio in questo ambito che l’automazione intelligente può avere l’impatto più grande, liberando risorse mentali e tempo prezioso per concentrarsi su compiti che richiedono creatività, pensiero critico e strategia.

Runner H si propone come il catalizzatore di questa trasformazione, offrendo un modo intuitivo per automatizzare i flussi di lavoro che definiscono le nostre giornate, senza la necessità di diventare programmatori o esperti di automazione.

Gestisce documenti, email ed attività ricorrenti

La gestione delle informazioni è il cuore pulsante di qualsiasi lavoro d’ufficio. Che si tratti di rispondere ad email, organizzare documenti o tenere traccia delle scadenze, queste attività, pur essendo essenziali, sono spesso fonte di stress ed inefficienza. Runner H può intervenire come un assistente personale iper-efficiente.

Immaginiamo un responsabile delle risorse umane che deve gestire le candidature in arrivo. Potrebbe istruire Runner H: “Ogni mattina, controlla la casella di posta ‘candidature@azienda.it’. Per ogni nuova email, scarica il CV allegato, rinominalo con ‘NomeCognome_CV’, caricalo nella cartella ‘Nuove Candidature’ su Google Drive e aggiungi una nuova riga nel foglio di calcolo ‘Tracciamento Candidati’ con il nome, la data e il link al file.” Questo è un flusso di lavoro che, eseguito manualmente, richiede attenzione e tempo. Automatizzato da Runner H, diventa un processo invisibile che avviene in background.

Lo stesso principio si applica ad innumerevoli altri scenari: un venditore può automatizzare la registrazione dei nuovi contatti nel CRM, un analista può programmare l’estrazione periodica di dati da una dashboard online, ed un manager può automatizzare l’invio di report settimanali.

Si integra con le principali app da ufficio

Come abbiamo visto, la forza di Runner H risiede nella sua capacità di operare in modo agnostico su diverse piattaforme. Non si tratta di un’integrazione basata su API, ma di un’interazione diretta con l’interfaccia utente. Questo gli conferisce una flessibilità senza precedenti.

Le applicazioni menzionate come Gmail, Notion, Google Docs e Sheets sono solo la punta dell’iceberg. Potenzialmente, qualsiasi applicazione accessibile tramite un browser può essere automatizzata. Questo include piattaforme di project management come Trello o Asana, sistemi CRM come Salesforce o HubSpot, strumenti di comunicazione come Slack (nella sua versione web) e persino applicazioni aziendali personalizzate.

Questa universalità è un punto di svolta. Invece di dover attendere che i produttori di software sviluppino integrazioni specifiche (un processo spesso lento e costoso), le aziende possono utilizzare Runner H per creare i propri ponti tra le applicazioni, costruendo flussi di lavoro personalizzati che rispondono esattamente alle loro esigenze operative. La capacità di far dialogare strumenti che altrimenti rimarrebbero silos isolati è uno dei vantaggi strategici più potenti dell’automazione guidata da agenti.

Riduce il lavoro manuale e aumenta la produttività

L’equazione è semplice: meno tempo speso in attività manuali e ripetitive equivale a più tempo disponibile per il lavoro che conta davvero. L’impatto sulla produttività non è solo quantitativo (fare più cose in meno tempo), ma anche qualitativo.

Quando siamo costantemente interrotti da piccoli compiti amministrativi, la nostra capacità di concentrazione profonda (“deep work“) ne risente. Automatizzando questi “rumori di fondo” operativi, Runner H ci aiuta a proteggere i nostri momenti di massima concentrazione. Possiamo dedicare blocchi di tempo ininterrotti alla risoluzione di un problema complesso, alla scrittura di un documento strategico o a una sessione di brainstorming creativa, sapendo che le routine quotidiane vengono gestite in modo autonomo.

Inoltre, l’automazione riduce drasticamente il rischio di errori umani. Il copia-incolla manuale di dati, la trascrizione di informazioni o il semplice smistamento di file sono tutte attività soggette a sviste. Un agente AI esegue questi compiti con una precisione costante, migliorando l’affidabilità e la qualità dei dati e dei processi aziendali. L’aumento di produttività, quindi, non deriva solo dalla velocità, ma anche da una maggiore accuratezza e da una riduzione del tempo speso a correggere errori.

Come Runner H organizza e gestisce le informazioni in autonomia

Un agente veramente efficace non può essere solo un esecutore di comandi. Deve possedere una comprensione più profonda del contesto e delle informazioni che manipola. Runner H integra capacità avanzate che gli permettono di non limitarsi a cliccare e digitare, ma di leggere, comprendere e ricordare, agendo come un vero e proprio assistente di progetto che gestisce le informazioni in modo intelligente.

Questa abilità di andare oltre la semplice interazione con l’interfaccia è ciò che lo eleva da un semplice bot a un partner cognitivo, capace di affrontare compiti che richiedono un certo grado di ragionamento e di gestione della conoscenza.

Legge e comprende PDF e file complessi

Una delle sfide più comuni nell’automazione dei flussi di lavoro è l’estrazione di informazioni da documenti non strutturati. Spesso, i dati cruciali sono intrappolati all’interno di file PDF, come fatture, report, contratti o curriculum. Estrarre queste informazioni manualmente è un processo tedioso e incline all’errore.

Runner H è dotato di capacità di comprensione documentale che gli consentono di “leggere” il contenuto di questi file. Non si tratta di una semplice conversione da PDF a testo. L’agente è in grado di comprendere la struttura del documento, identificando elementi come tabelle, intestazioni e paragrafi. Questo gli permette di eseguire compiti come: “Apri la fattura PDF allegata all’ultima email e dimmi qual è l’importo totale e la data di scadenza” o “Analizza questo CV in formato PDF ed estrai l’esperienza lavorativa e le competenze tecniche del candidato.”

Questa capacità di trasformare documenti statici in fonti di dati strutturati è un’enorme leva di efficienza. Permette di automatizzare processi che altrimenti richiederebbero un intervento umano per l’interpretazione e l’inserimento manuale dei dati, aprendo le porte all’automazione di flussi di lavoro documentali complessi in settori come la contabilità, il legale e le risorse umane.

Usa la memoria per risposte più precise

Per eseguire compiti multi-step in modo coerente, un agente ha bisogno di una memoria. Runner H è progettato per mantenere il contesto durante un’interazione. Ricorda le azioni che ha già compiuto, le informazioni che ha raccolto e le istruzioni che gli sono state date in precedenza.

Questa memoria persistente è fondamentale per la sua efficacia. Se gli viene chiesto di cercare informazioni su un determinato argomento e poi, in un secondo momento, di riassumere quelle informazioni in una presentazione, l’agente sa a quali dati fare riferimento. Non ha bisogno che gli venga ripetuto il contesto ad ogni passaggio.

Questo meccanismo di memoria gli consente di fornire risposte più precise e di eseguire azioni molto più precise e contestualizzate. Può imparare dalle interazioni precedenti, affinando la sua comprensione delle preferenze dell’utente e delle specificità di un determinato flusso di lavoro. Ad esempio, se gli viene corretto un comportamento, può ricordare quella correzione per le esecuzioni future. Questa capacità di apprendimento e adattamento, seppur semplice, è un passo importante verso agenti che non solo eseguono, ma migliorano nel tempo.

Coordina azioni come un assistente di progetto

Combinando la sua capacità di operare su più applicazioni, di comprendere i documenti e di utilizzare la memoria, Runner H può agire come un vero e proprio coordinatore di progetto. È in grado di orchestrare una sequenza complessa di azioni che coinvolgono diversi strumenti e fonti di informazione.

Consideriamo lo scenario dell’organizzazione di un evento aziendale. Un project manager potrebbe affidare a Runner H un obiettivo di alto livello: “Crea una cartella su Google Drive per l’evento ‘Summit Annuale 2025’. Cerca online tre possibili location a Milano e crea un documento di confronto con prezzi e capienza. Invia un’email al team di marketing per chiedere un feedback sulle location e crea un evento preliminare sul calendario di Google per la data proposta.”

Runner H scomporrebbe questo obiettivo in una serie di sotto-compiti: creare la cartella, eseguire ricerche web, sintetizzare i dati in un documento, redigere e inviare un’email, interagire con l’applicazione del calendario. Coordina queste azioni in modo logico e sequenziale, gestendo il flusso di informazioni da un passaggio all’altro. Questa capacità di orchestrazione lo trasforma da uno strumento per singoli task ad una piattaforma per la gestione di interi progetti, agendo come un assistente instancabile che si occupa della logistica operativa e della coordinazione.

Le tecnologie AI che lo rendono possibile

La performance apparentemente magica di Runner H non è frutto di un incantesimo, ma il risultato di anni di ricerca e sviluppo nel campo dell’intelligenza artificiale, culminati nella creazione di modelli specificamente progettati per l’interazione uomo-computer. La startup H Company ha sviluppato un’architettura AI su misura, un “action-centric model“, che si discosta dai tradizionali LLM per concentrarsi sulla comprensione e l’esecuzione di azioni nel mondo digitale.

Questa architettura si basa su una combinazione sinergica di componenti specializzati, ognuno dei quali svolge un ruolo cruciale nel permettere all’agente di vedere, ragionare ed agire con una precisione senza precedenti.

Holo1 per capire le interfacce visive

Il cuore della capacità di Runner H di interagire con qualsiasi applicazione web è il suo Vision-Language Model, denominato Holo1. Questo componente è, in sostanza, l’occhio dell’agente. È responsabile della “lettura” dell’interfaccia grafica.

Quando Runner H “guarda” una pagina web, Holo1 non vede solo un ammasso di pixel colorati. Analizza il layout visivo e il codice HTML sottostante per identificare e classificare gli elementi interattivi. Riconosce un campo di testo e capisce che è un’area in cui si può digitare; individua un pulsante e comprende che è un oggetto cliccabile; identifica un menu a tendina e sa che può essere aperto per rivelare delle opzioni.

Questa comprensione profonda dell’interfaccia visiva è ciò che gli permette di essere così versatile e robusto. Non ha bisogno di sapere in anticipo come è fatto il sito di Notion o di Gmail. Applica la sua conoscenza generale su come funzionano le interfacce web per interpretare qualsiasi nuova pagina incontri. È questa capacità di generalizzazione che lo rende un vero agente autonomo, in grado di navigare il vasto ed imprevedibile mondo del web.

Surfer H per interpretare i comandi testuali

Se Holo1 è l’occhio, Surfer H è il cervello che interpreta il linguaggio e formula i piani. Questo modello linguistico è stato specificamente ottimizzato per comprendere le istruzioni e gli obiettivi espressi in linguaggio naturale dall’utente e per tradurli in una sequenza di azioni eseguibili.

Quando un utente fornisce un comando come “invia un’email di follow-up a Mario Rossi riguardo al progetto Alpha”, Surfer H scompone la richiesta. Capisce l’azione principale (“inviare un’email”), il destinatario (“Mario Rossi”), l’argomento (“progetto Alpha”) e l’intento (“follow-up”). A questo punto, crea un piano d’azione che verrà poi eseguito da altri componenti del sistema, interagendo con l’interfaccia visiva tramite Holo1.

Surfer H è anche responsabile del ragionamento e della risoluzione dei problemi. Se un’azione fallisce, è Surfer H che analizza il messaggio di errore o la situazione imprevista per decidere il passo successivo. Questa stretta collaborazione tra la comprensione visiva di Holo1 e la capacità di ragionamento linguistico di Surfer H è la vera chiave di volta dell’architettura di Runner H.

Addestrato su dati realistici e ambienti simulati

Un modello AI è efficace solo quanto i dati su cui è stato addestrato. Per insegnare a Runner H a navigare il web come un umano, H Company ha utilizzato un approccio di addestramento sofisticato e su larga scala.

L’agente è stato addestrato su milioni di esempi di interazioni web reali. Questo include registrazioni di sessioni di navigazione umane, che permettono al modello di imparare quali sono le sequenze di azioni più comuni e logiche per compiere determinati compiti. Oltre ai dati reali, sono stati utilizzati anche ambienti simulati, delle sorte di “palestre digitali” dove l’agente può sperimentare e imparare per tentativi ed errori in un ambiente controllato e sicuro.

Questo massiccio corpus di dati di addestramento, che copre un’enorme varietà di siti web, applicazioni e flussi di lavoro, è ciò che ha permesso a Runner H di sviluppare una comprensione così generalizzata e robusta del mondo digitale. È come se avesse osservato milioni di ore di lavoro al computer, distillando questa esperienza in un set di competenze operative che ora può applicare a qualsiasi nuovo compito gli venga assegnato. Questa solida base di addestramento è fondamentale per la sua affidabilità e la sua capacità di affrontare scenari imprevisti.

I vantaggi pratici di Runner H

Al di là della tecnologia affascinante e delle promesse futuristiche, il successo di uno strumento come Runner H si misura sulla sua capacità di offrire vantaggi concreti e immediati agli utenti. La sua progettazione è stata guidata da un obiettivo chiaro: rendere l’automazione web non solo più potente, ma anche radicalmente più accessibile e facile da usare.

Questi vantaggi pratici sono ciò che lo rende uno strumento potenzialmente trasformativo non solo per le grandi aziende con interi dipartimenti IT, ma anche per i singoli professionisti, i piccoli team e chiunque voglia ottimizzare il proprio lavoro quotidiano.

Automazione semplice, senza scrivere codice

Forse il vantaggio più significativo di Runner H è l’abbattimento della barriera tecnica all’automazione. Tradizionalmente, automatizzare i flussi di lavoro web richiedeva l’uso di linguaggi di scripting come Python con librerie come Selenium o Playwright, oppure l’apprendimento di piattaforme di Robotic Process Automation (RPA) complesse e costose. Questi approcci, sebbene potenti, sono fuori dalla portata della maggior parte degli utenti business.

Runner H democratizza questo processo. Tutta l’interazione avviene tramite linguaggio naturale. Non c’è bisogno di scrivere codice, di comprendere selettori CSS o di registrare macro. L’utente deve essere in grado di descrivere chiaramente l’obiettivo che vuole raggiungere. Questa semplicità d’uso è rivoluzionaria. Mette il potere dell’automazione nelle mani di chi conosce veramente i processi: i venditori, i responsabili marketing, gli assistenti amministrativi, i project manager. Sono loro che ora possono diventare gli architetti delle proprie soluzioni di efficienza, senza dipendere da un team di sviluppo.

Funziona via browser, senza installazione

Un altro vantaggio chiave è la sua accessibilità dato che Runner H opera come un’estensione del browser o un’applicazione web e non richiede l’installazione di software pesanti o complesse configurazioni a livello di sistema operativo. Questo approccio “browser-based” rende l’adozione dello strumento estremamente rapida e indolore.

Gli utenti possono iniziare a utilizzarlo in pochi minuti, su qualsiasi computer (Windows, Mac o Linux) che supporti un browser moderno. Questa facilità di deployment elimina un altro ostacolo comune all’adozione di nuovi strumenti software in contesti aziendali, dove le politiche di sicurezza possono rendere difficile l’installazione di nuove applicazioni. Operando all’interno del browser, Runner H si integra in modo trasparente nell’ambiente di lavoro che gli utenti già conoscono e utilizzano, rendendo la curva di apprendimento ancora più dolce. È uno strumento che si adatta al flusso di lavoro dell’utente, non viceversa.

Utile sia per uso personale sia professionale

La versatilità di Runner H lo rende uno strumento prezioso in un’ampia gamma di contesti. Per uso personale, può semplificare la gestione della vita digitale. Si può automatizzare il pagamento di bollette online, la ricerca di voli e alloggi per le vacanze, l’organizzazione di documenti personali o persino la gestione delle proprie finanze personali aggregando dati da diversi conti.

Tuttavia, è in ambito professionale che il suo potenziale esplode. Per i freelance e le piccole imprese, Runner H può agire come un vero e proprio “team virtuale”, gestendo compiti amministrativi, di marketing e di customer service che altrimenti richiederebbero l’assunzione di personale. Per le grandi aziende, può essere implementato a livello di team per standardizzare i processi, migliorare l’efficienza e favorire la collaborazione, come abbiamo visto con la possibilità di automatizzare l’integrazione tra CRM, piattaforme di project management e strumenti di comunicazione.

L’arrivo di agenti AI come Runner H e di alternative open-source come DeepSeek, Suna AI o Agent Zero segna un momento di svolta. Stiamo entrando in un’era in cui la nostra produttività non sarà più limitata dalla nostra capacità di eseguire manualmente i compiti, ma dalla nostra abilità di delegarli efficacemente a collaboratori digitali intelligenti. Padroneggiare l’interazione con questi sistemi non è più una competenza futuribile, ma una necessità presente. Il futuro del lavoro sarà definito da chi saprà orchestrare questi agenti, trasformando le proprie intenzioni in azioni concrete e automatizzate.

Per chi desidera non solo utilizzare questi strumenti, ma capire come funzionano e come costruirne di simili, un corso di formazione su agentic applications rappresenta il passo logico successivo. Investire nella propria formazione sull’intelligenza artificiale oggi è l’unico modo per essere pronti a guidare la trasformazione di domani, passando da semplici utenti a veri e propri architetti del futuro digitale.

NEWSLETTER

Ricevi direttamente sulla tua mail gli ultimi articoli pubblicati nella nostra sezione AI NEWS per rimanere sempre aggiornato e non perderti nessun contenuto.

Vincenzo Maritati

AUTORE:Vincenzo Maritati Apri profilo LinkedIn

Vincenzo è Co-founder di Data Masters, AI Academy per la formazione in Intelligenza Artificiale, Machine Learning e Data Science. È un ricercatore informatico che lavora attivamente nel campo dell’Intelligenza Artificiale, coordinando progetti di ricerca e sviluppo che spaziano in diversi ambiti, come la mobilità intelligente, sistemi di telemedicina, la manutenzione predittiva, il controllo della produzione industriale e la formazione.