#The Sunday Prompt #43 – 06/10/2024
Negli ultimi giorni in molti hanno cominciato ad utilizzare e apprezzare il rilascio da parte di Google del suo nuovo NotebookLM, in fase sperimentale e gratuito da utilizzare.
In realtà non si tratta di un prodotto nuovo lanciato da BigG, ma dell’evoluzione del Tailwind che era prima presente nei Google Labs.
A cosa serve NotebookLM?
NotebookLM è principalmente uno strumento per “prendere appunti”., come dice il nome, ed ha quale principale obiettivo quello di aiutare gli utenti ad organizzare le informazioni presenti in varie fonti, anche in un grande volume di contenuti, organizzandoli, riassumendoli e fornendo approfondimenti di vario genere.
Come si può vedere dallo screenshot è possibile inserire come fonte un file (pdf, txt, Markdown o audio) oppure collegare direttamente una cartella di Drive, presentazioni Google, link a siti web o a video Youtube, ed ovviamente anche incollare del testo copiato.
Il tutto con un limite di 50 fonti diverse.
Una volta avvenuto l’inserimento e linkato le fonti è possibile sia fare domande dirette al LLM sia utilizzare alcune funzioni preimpostate.
Oltre a fornire un breve sommario del contenuto caricato, infatti, è possibile chiedere la creazione di domande basate sullo stesso (per eventualmente creare dei quiz o delle verifiche di studio), la timeline, utile qualora ci sia una cronologia nella documentazione, una guida ragionata, un sommario o un “documento di briefing” che riassumerà in maniera più estesa tutto il contenuto.
Su che tecnologia si basa NotebookLM
NotebookLM si basa su Gemini 1.5 Pro, il modello di Google con la finestra di contesto più alta (arriva fino ad 1 milione di token) il quale utilizza un’architettura Mixture-of-Experts (la stessa di Mistral). Questo permette a NotebookLM di elaborare fino a 1.500 pagine di informazioni contemporaneamente, essendo utile quindi a chi deve esaminare testi lunghi e complessi (quindi una manna per gli avvocati). Oltretutto, nonostante la grande quantità di informazioni che è possibile inserire non sembra che il prodotto perda di efficienza.
Oltre a questo ovviamente per poter fornire le risposte basandosi sui vari documenti NotebookLM utilizza un sistema di Retrieval-Augmented Generation (RAG) che gli consente di elaborare i contenuti dalle varie fonti.
Deep dives: la funzione che lascia a bocca aperta
Ma se le funzioni che abbiamo appena elencato non sembrano rappresentare una grande novità (RAG, riassunti, etc.) c’è una caratteristica che lascia davvero a bocca aperta: le “deep dive conversation”. Attivando questa funzione viene generato un audio (che è possibile scaricare) di una conversazione (quasi un podcast) tra due host AI che discutono sul materiale che è stato caricato. Non si limitano a discutere, ma ne parlano scherzando, approfondendo alcune parti, fornendo esempi (anche non contenuti nel materiale), dialogando con pause, toni ed intercalari che li fanno sembrare umani.
L’audio, quindi, non è una mera voce che legge i testi, ma crea una “puntata di un podcast” che consente di fruire in maniera piacevole, ed in alcuni punti anche divertente, dei contenuti caricati (attenzione a fare sempre il fact checking delle informazioni).
Questo grazie ad una serie di accorgimenti che sono stati utilizzati come il Text-to-Speech (TTS) che genera le voci dei conduttori di podcast AI, creando un’esperienza di conversazione convincente, SoundStorm per generare conversazioni audio realistiche convertendo il testo in dialoghi naturali con un audio coinvolgente e di alta qualità, la Disfluency Injection per aggiungere pause simili a quelle umane, parole di riempimento e modelli di discorso naturali, rendendo il dialogo più realistico e il Prompt Engineering per strutturare le interazioni dell’IA e garantire che gli host mantengano un tono naturale e colloquiale.
Provatelo e ne rimarrete sbalorditi!
I consigli di Google per usare NotebookLM
Nel Notebook di istruzioni Google fornisce alcuni suggerimenti per usare al meglio il tool.
Concentrarsi sul focus. L’interfaccia di NotebookLM è stata progettata in modo da rendere facile focalizzare l’attenzione dell’IA su diversi elementi, a seconda delle esigenze. Selezionate una fonte e le risposte che otterrete saranno basate solo sulle informazioni contenute in quella fonte. Selezionate le note e le azioni suggerite, come “Crea schema”, si baseranno esclusivamente sul contenuto di quelle note.
Curate e create. NotebookLM è stato progettato per semplificare l’esplorazione di domande, documenti o idee in collaborazione con l’intelligenza artificiale, salvando man mano i risultati più interessanti. Basta appuntare sulla lavagna degli appunti tutto ciò che cattura la vostra attenzione; una volta che avete raccolto una collezione utile di appunti, selezionateli tutti e utilizzate le azioni suggerite per trasformarli in un formato strutturato, come una scaletta o una guida allo studio.
Anche le citazioni sono risposte. Ogni volta che NotebookLM risponde a una domanda basata sulle fonti, mostra i passaggi più rilevanti delle fonti come citazioni. In molti flussi di lavoro, le citazioni originali sono più preziose del riassunto dell’IA e non conterranno mai allucinazioni. È possibile fare clic per vedere ogni citazione nella sua posizione originale nella fonte madre.
Non limitatevi al testo. NotebookLM ora supporta le immagini in Slides e Docs, in modo da poter porre domande su informazioni visive in foto, grafici, diagrammi e altri elementi visivi. NotebookLM restituisce anche le immagini come citazioni quando contengono informazioni rilevanti.
NotebookLM non è una calcolatrice. NotebookLM riporta i numeri contenuti nelle fonti con la stessa precisione con cui gestisce parole e idee. Ma non sarà efficiente se gli si chiede di eseguire calcoli matematici. In altre parole, va bene chiedere “Qual è stato il budget di marketing del terzo trimestre?”. Ma potrebbe essere più difficile se chiedete: “Quale sarà il budget di marketing del terzo trimestre nel 2027 se aumenta del 25% all’anno?”.
Il prompt della settimana
Continua il nostro esame degli acronimi di tecniche di prompting metodologie di prompting
B-A-B (Before – After – Bridge)
Questa tecnica riassume una costruzione di un prompt in cui si descrive lo stato precedente, si indica quello che si vorrebbe raggiungere e si chiede di indicare le azioni da svolgere per raggiungerlo sulla base di quello attuale.
Ecco qui sotto un esempio:
BEFORE | AFTER | BRIDGE |
Spiega il problema | Descrivi il risultato | chiedi il “ponte” |
Non siamo presenti nelle classifiche SEO | vogliamo arrivare nella top 10 della classifica SEO nella nostra nicchia in 90 giorni | sviluppa un piano dettagliato con tutte le misure che dovremmo adottare per raggiungere il nostro risultato |
Gli iscritti alla newsletter via email ricevono contenuti aggiuntivi con strumenti e tool – massimo 4 a settimana – che possono essere utilizzati e che usano l’AI per ottimizzare il lavoro.
Per ricevere la newsletter via email iscrivetevi su https://the-sunday-prompt.ck.page/f260e8dd80
Happy Prompting! 👋🏻