#The Sunday Prompt #48 – 15/12/2024
Neanche due settimane e ci ritroviamo a dover fare un sommario di tutte le novità che ci sono state nel settore dell’AI generativa, che corre sempre più veloce.
Gli attori di questo mondo, infatti, sembrano sfidarsi in un continuo rilascio di aggiornamenti, nuove features, modelli e funzionalità, per conquistare il podio nella corsa dell’AI generativa.
Vediamo insieme cosa è successo.
OpenAI e il calendario dell’avvento.
Con un’iniziativa originale OpenAI ha presentato il suo calendario dell’avvento (completo degli immancabili maglioncini natalizi) https://openai.com/12-days/
Per 12 giorni fino a Natale saranno annunciate e rilasciate varie novità che coinvolgono i prodotti di OpenAI.
Vediamo quelle più significative fino ad oggi:
- 01 e ChatGPT Pro: un nuovo tipo di abbonamento, al costo di 200 dollari al mese, per risolvere task più complessi, soprattutto in ambito matematico, data science, coding, e analisi di casi grazie ad un aumento della capacità computazionale dedicata a questi modelli.
- Sora: OpenAI ha ufficialmente lanciato Sora, un sistema di intelligenza artificiale generativa capace di creare video a partire da descrizioni testuali. Sora è attualmente disponibile solo negli Stati Uniti e in alcuni altri paesi, ma non nel Regno Unito e in Europa a causa, dicono loro, delle restrizioni normative. Ovviamente collegandosi con una VPN è possibile provarlo a questo link https://sora.com/. Molto interessanti le funzionalità già incorporate (come la possibilità di creare loop, lo storyboard, etc.). E’ possibile condividere il video con un link, esportarlo in formato video o gif. Qui sotto un primo risultato (non poteva essere altro che un gattino cibernetico):
- Projects: tramite i Projects, adesso è possibile organizzare le chat per argomento. Questa funzionalità consente di raggruppare chat, file e istruzioni personalizzate, facilitando il recupero delle informazioni. Attualmente è disponibile per gli utenti ChatGPT Plus, Pro e Team, con un rollout per gli utenti gratuiti previsto in futuro;
- Funzionalità video: è stata introdotta la possibilità di utilizzare video e condivisione dello schermo nella modalità vocale avanzata di ChatGPT. Questa innovazione consente agli utenti di interagire con l’assistente AI in tempo reale mostrando oggetti e situazioni attraverso la fotocamera del proprio smartphone.
Google e NotebookLLM
Anche Google ha recentemente aggiornato Gemini, ma soprattutto sono state introdotte novità in NotebookLLM (di cui avevamo parlato qualche mese fa).
Oltre ad aver integrato Gemini 2.0 flash e modificato l’interfaccia con tre aree (Fonti, Chat e Studio) adesso NotebookLLM può analizzare come fonti anche presentazioni Google, PDF, Google Docs e altre tipologie di documenti.
Il servizio sarà disponibile sia gratuitamente sia con abbonamento Plus.
La novità più interessante più interessante è la possibilità di interagire vocalmente con gli host AI generati dal tool, attraverso un miglioramento della funzionalità Audio Overview (vi ricordate la generazione del “simil podcast”?). Se volete provarlo potete farlo da qua
Grok libera tutti
Con una mossa a sopresa X rende disponibile gratuitamente a tutti gli utenti la possibilità di creare immagini con Grok, il modello di generazione delle immagini che è integrato nella piattaforma.
Vi ricordo che, a differenza di quasi tutti gli altri modelli Grok si caratterizza per “non avere censure”. Così mentre Midjourney e le app simili di GenAI spesso impediscono l’utilizzo di immagini di personaggi pubblici, con Grok è possibile chiedere di realizzare qualsiasi immagine, come quella di un Trump-Fader qui sotto.
Claude Haiku 3.5
Anthropic da parte sua non sta con le mani in mano, ed ha appena rilasciato il nuovo modello Claude Haiku 3.5 che offre prestazioni simili a Opus ma con prestazioni migliori.
Claude, inutile negarlo, è forse ad oggi il miglior modello per scrivere testi, soprattutto per l’ampiezza della finestra di contesto che consente di analizzare e scrivere.
Haiku, rispetto ai suoi predecessori, eccelle soprattutto nei compiti di coding, ma è ottimo per analizzare grandi volumi di informazione non strutturate, come tipicamente i testi.
Claude sarà utilizzato da Amazon per migliorare le interazioni con gli oggetti smart.Anthropic ha presentato anche una nuova piattaforma di nome Clio che analizza per cosa vengono utilizzati i modelli Ai con un occhio di riguardo alla privacy.
LLama 3.3 70B
Il modello open di Meta è stato aggiornato e dai benchmark sembra migliore di Gemini 1.5 Pro, GPT-4o e Nova Pro di Amazon.E’ possibile utilizzarlo da Huggin Face a questo link
Conclusioni
Queste le principali novità delle ultime due settimane, ma sicuramente ce ne aspettano molte altre.
Il tema degli Agenti AI sta sempre più diventando centrale ed anche i Big si muovono per riuscire a realizzare piattaforme o sistemi di AI incentrati sulla costruzione di agenti che risolvono task differenti.
Per un’analisi da qualcuno che ha un punto di vista privilegiato potete vedere questo video su Youtube.
Mercoledì 18 dicembre presentazione di “Intelligenza artificiale, blockchain e criptovalute”
Questo mercoledì alla Sala Stampa della Camera dei deputati ci sarà la presentazione del libro scritto con @fulvio Sarzana ed appena uscito per IPSOA Wolters Kluwer, in cui abbiamo aggiornato l’edizione del 2018 con le novità normative che si sono avvicendate in questi anni ed un focus particolare sull’AI Act.
Per partecipare all’evento è possibile iscriversi da qua:
Attenzione perchè la sola iscrizione non da diritto a partecipare, ma è necessario attendere una conferma via email (quindi vi consiglio di inserire quella corretta).
Il contenuto di questa newsletter potete trovarlo anche su Linkedin
Gli iscritti alla newsletter via email ricevono invece un diverso contenuto con strumenti e tool – massimo 4 a settimana – che possono essere utilizzati e che usano l’AI per ottimizzare il lavoro.
Per ricevere la newsletter via email iscrivetevi su https://the-sunday-prompt.ck.page/f260e8dd80
Happy Prompting!