The Sunday Prompt #3 – 12/3/2023
Tempo di lettura: 8 minuti
Questa settimana un annuncio ha campeggiato su numerosi post, ossia il lancio di GPT4 a breve con funzionalità multimodali. Il sistema, quindi, fonderà insieme vari modelli, consentendo di creare video, testi ed immagini (ma forse anche suoni) in un’unica interfaccia, potendo fornire in output “materiali misti”.
D’altra parte, nel settore legale, ci si sta chiedendo se effettivamente le AI generative possano essere utilizzate con efficacia. La startup più conosciuta del settore è sicuramente DoNotPay, che si definisce un “Automated Consumer Rights” in quanto cerca di fornire soluzioni a quelle controversie “minori” (da noi si chiamano bagatellari) che spesso non trovano spazio per essere portate in Tribunale (anche perchè il più delle volte sarebbe antieconomico).
Il sistema sembrerebbe anche funzionare: dal suo lancio è stato utilizzato per circa 250.000 e, dichiarano i suoi sviluppatori, sembra ne abbia vinti il 64%.
DoNotPay utilizza l’elaborazione del linguaggio naturale per assistere i propri clienti. Il chatbot AI fornisce suggerimenti e consigli tramite il telefono cellulare o il computer su cosa dire e fare per contestare legalmente un disservizio.
Ultimamente DoNotPay si è evoluto per fornire soluzioni più complete che consentano al sistema di far fronte ad un vero e proprio scambio di corrispondenza tra avvocati.
Una delle caratteristiche uniche dell’intelligenza artificiale di DoNotPay è che è addestrata ad attenersi ai fatti piuttosto che manipolare le informazioni per vincere un caso. Il sistema arriva persino a fornire consigli direttamente in tribunale su cosa dire e come rispondere ai giudici assegnati tramite delle cuffie, diventando quasi un assistente personale per avvocati.
Alcune Big Firm hanno cominciato ad avviare progetti per il training del modello GPT3 di OpenAi al fine di utilizzarlo nella propria attività di consulenza ed assistenza verso la clientela (soprattutto nell’ambito delle ricerche dei casi e dell’esame dei documenti).
Un esempio di come potrebbero essere questi sistemi è già online. Infatti su AI Lawyer è stato reso disponibile un MVP che, evidentemente, è basato sulle API di GPT3 ma con un addestramento specifico del modello sul mondo legale.
Regolare la creatività
Passando al “prompt engineering” oggi cerchiamo di approfondire meglio cosa c’è sotto il cofano dell’auto. Come accennato nel precedente numero ChatGPT in realtà non consente di variare i parametri di utilizzo del modello (Instruct GPT) e quindi fornisce delle risposte sulla base di settaggi già definiti (anche se, utilizzano i prompt “come se” abbiamo visto che possiamo dare un tono di voce alle risposte).
Per poter operare direttamente sui parametri è necessario accedere a “Playground” sul sito di OpenAI. Si tratta di un’interfaccia per le API del modello, che ci consente di creare dei prompt e di avere degli output (ma non solo).
A differenza di ChatGPT, Playground ci consente anche di variare alcuni parametri che ritroviamo nella colonna a destra dell’interfaccia.
Tra questi molto particolari sono la “Temperature” ed il “Top P”.
In generale, più bassa è la temperatura, più è probabile che GPT-3 scelga parole con una maggiore probabilità di occorrenza. È particolarmente utile quando vogliamo che GPT-3 completi qualcosa dove c’è solo una risposta mentre se vogliamo generare idee o completare una storia, una temperatura più alta ci porterà più varietà.
Si tratta, in sostanza, del grado di “creatività” (che per un sistema di AI è la “casualità”) delle parole che otterremo dal modello: un numero di temperatura basso implicherà risposte più comuni (probabilmente anche sulla base dell’addestramento che deriva anche dall’interazione con gli utenti); un numero più alto (fino a 1) invece consentirà di generare risposte più creative ed al di fuori di certi schemi.
Il Top-P, invece, opera sull’insieme di parole su cui effettuare il campionamento e la distribuzione della probabilità (quindi anche in questo caso si tratta di ampliare o diminuire il range delle parole possibili).
Si tratta, pertanto, di un’alternativa all’uso di “Temperature” con effetti analoghi, dato che il parametro incide sulla casualità e creatività del testo di output.
OpenAI suggerisce di settare almeno uno dei due parametri ad 1 per poi operare sull’altro parametro.
Ma quale scegliere tra i due, soprattutto se cerchiamo degli output da utilizzare nel mondo legale?
Regolare la creatività per gli output legali
Se provate a sperimentare con diversi prompt e progetti potrete arrivare alla mia conclusione: Top P fornisce un controllo migliore quando vogliamo che il sistema generi testo con accuratezza e correttezza, mentre Temperature funziona in maniera migliore per testi testi originali e creativi (o divertenti).
Ecco un test variando il Top-P sulla domanda “quale è la definizione di contratto?”
Top-P = 0
quale è la definizione di contratto?
Un contratto è un accordo vincolante tra due o più parti che definisce le responsabilità e i diritti di ciascuna parte. Un contratto può essere scritto o verbale e può essere utilizzato per regolare qualsiasi tipo di transazione commerciale, come l’acquisto di beni o servizi, la locazione di una proprietà o l’assunzione di un dipendente.
Top-P = 0.5
quale è la definizione di contratto?
Un contratto è un accordo legale vincolante tra due o più parti, che definisce le loro responsabilità e obblighi reciproci. I contratti sono spesso utilizzati per regolare le relazioni commerciali, stabilire i termini di un accordo o regolare le relazioni tra le parti. I contratti possono essere scritti o verbali e devono essere rispettati da entrambe le parti.
Top-P = 1
quale è la definizione di contratto?
Il contratto è un accordo legale vincolante tra due o più parti che stabilisce i termini e le condizioni di una relazione commerciale. In un contratto, le parti si impegnano a soddisfare certi obblighi, in generale una o più di esse paga o eroga un servizio all’altro in cambio di qualcosa.
Come si può vedere al variare del parametro verso il valore massimo di 1 varia anche la qualità dell’output, che nell’ultima risposta contiene anche termini più generici come “in generale” e “certi obblighi”.
La definizione che invece era stata ottenuta con valore = 0 anche se non esattamente quella contenuta nel codice civile comunque contiene riferimenti più specifici ed un grado di precisione più accurato.
Nel prossimo numero cominceremo a vedere insieme anche altri IDE e tool per GPT3 (e forse, speriamo, GPT4).