Diario personale e intelligenza artificiale

Da tanto tempo tengo un diario personale: la scrittura stessa mi aiuta a riflettere e, rileggendo quello che ho scritto in passato, mi aiuta a dare il giusto peso alle cose.

Avevo iniziato a scriverlo nel 1989 e utilizzavo il programma Framework 2. Era una suite per MS-DOS che combinava elaborazione testi e fogli di calcolo, molto innovativa per l'epoca.

La regola che seguivo era scrivere ogni giorno i miei pensieri e rileggere quelli di una settimana, un mese e un anno fa. Questo mi aiutava a capire se le mie ambizioni, preoccupazioni ed emozioni erano fondate, rivalutandole dopo un po' di tempo. Con il tempo e l'evoluzione tecnologica, sono passato brevemente a Microsoft Works e successivamente a Microsoft Word, ma le regole di scrittura e lettura sono rimaste le stesse.

Ho mantenuto questa abitudine fino al 2005, ma poi ho sentito la necessità di cambiare. Scrivere è sempre stato per me un momento di riflessione, e desideravo farlo lontano dagli strumenti tecnologici. Così, sono passato a utilizzare normali quaderni a quadretti, scrivendo a mano.

Questo mi ha permesso di continuare a scrivere anche quando ero fuori casa, durante vacanze o trasferte di lavoro. Con i quaderni, bastava portarli con me e scrivevo in qualunque luogo.

Quando un quaderno diventava più vecchio di un anno, lo scannerizzavo e lo archiviavo come file PDF.

Nel 2019 ho partecipato a un corso sul lavoro e mi è stato dato un Rocketbook. È un quaderno riutilizzabile che permette di scrivere con una penna cancellabile e di digitalizzare facilmente le note tramite un'app. Le regole di scrittura e rilettura erano rimaste le stesse, così come la comodità di portarlo in viaggio. La rilettura, però, avveniva leggendo i testi archiviati su OneDrive. Inoltre, risparmiavo il tempo di scannerizzare il quaderno dopo un anno, poiché veniva fatto giorno per giorno.

Ho utilizzato questo sistema fino al 1 maggio 2022. Il giorno successivo, il 2 maggio 2022, sono stato ricoverato in ospedale e non sono più tornato a casa. In ospedale non avevo con me il quaderno e, anche se lo avessi avuto, non avrei avuto la serenità per scrivere.

Nei periodi in cui tornavo a casa dall'ospedale ho scritto qualche volta, ma la mia mente non era più lucida. Mi è mancata la lucidità per molto tempo, anche quando le terapie erano finite e ho passato un lungo periodo fuori dall'ospedale.

Ho nuovamente sentito la necessità di scrivere e riflettere più attentamente ad agosto 2023, quando si è presentata la recidiva. Da allora, tutto ciò che riguarda la mia malattia lo scrivo su questo blog.

In parallelo, ho esplorato altre tecnologie diventate più mature con il tempo. Nel 2020 ho acquistato un piccolo registratore vocale con l'intenzione di catturare le mie idee mentre guidavo e non potevo prendere appunti. Dopo poco tempo, ho capito che poteva essere utile anche per registrare riflessioni a voce alta. La stessa cosa potevo farla con l'applicazione registratore vocale sullo smartphone, ma non mentre guidavo. Il problema era che, per seguire le regole che mi ero dato di scrittura e rilettura (in questo caso riascolto), ci voleva troppo tempo. Per esprimermi al meglio avrei registrato ogni giorno alcuni audio di 3-5 minuti, ma diventava troppo dispendioso riascoltare 20-30 minuti di audio ogni giorno. Quindi non sono andato avanti con questo approccio.

Nel 2023 ho acquistato anche uno smartwatch Galaxy Watch 5 Pro. Questo dispositivo ha un registratore vocale che si attiva facilmente con un doppio clic sul pulsante superiore. È davvero immediato da utilizzare e, visto che posso impiegarlo ovunque, è uno strumento che offre grande spontaneità.

Per catturare le mie idee mentre guido, nel frattempo Google Assistant su Android Auto è migliorato parecchio. Ora, quando mi viene in mente qualcosa, dico "Prendi nota". L’assistente risponde "Cosa vuoi scrivere nella nota?" e dico brevemente cosa voglio ricordare. Il riconoscimento vocale è molto accurato e ritrovo la mia nota su Google Keep.

Dopo il trapianto nel 2024, ho continuato a catturare le mie riflessioni su file audio, dando priorità alla spontaneità e pensando che un giorno avrei trovato una soluzione efficiente per il riascolto.

Le soluzioni hanno cominciato a presentarsi con l'arrivo dell'intelligenza artificiale. Ho iniziato a utilizzare TurboScribe per la trascrizione, ma con il piano gratuito posso trascrivere solo tre file al giorno. Il piano a pagamento è troppo costoso per l'uso che ne faccio. Anche la trascrizione stessa è laboriosa, richiedendo di trascinare il file, aspettare la trascrizione e poi scaricarlo per metterlo nella cartella giusta. Questo processo manuale è troppo macchinoso per farlo frequentemente.

Nelle ultime settimane ho messo a punto una soluzione più economica ed efficiente, utilizzando per la trascrizione le API di OpenAI ed il modello Whisper. Tramite uno script Python carico il file audio e ricevo indietro la trascrizione, che però è solamente un flusso piatto di parole difficile da interpretare. Sempre lo stesso script Python carica la trascrizione piatta sul modello GPT-4o-mini e ne ottiene un riassunto. Ho integrato questo script nel menu del tasto destro di Windows, quindi quando voglio trascrivere un audio: tasto destro/Transcribe e mi genera un file di testo con lo stesso nome del file audio ed estensione .txt. Soluzione comoda, rapida ed efficace. Il file di testo con il riassunto è facile e veloce da rileggere.

La trascrizione audio con Whisper costa 0.006 euro al minuto, quindi un costo piuttosto basso. Il riassunto con GPT-4o-mini ha un costo irrisorio. Per ora provo questa soluzione e vedremo se ci saranno degli sviluppi in futuro.

Un altro vantaggio dell’intelligenza artificiale è che, caricando un vecchio file Word del periodo 1989-2005 su ChatGPT, mi genera un riassunto di che cosa è successo in quel periodo. Mi fornisce anche una valutazione della mia personalità e dell’approccio alla vita, permettendomi di rendermi conto della crescita che c’è stata maturando.

I file scritti a mano dal 2005 al 2022 sono invece inutilizzabili per l’intelligenza artificiale al momento, magari un giorno ci saranno ulteriori evoluzioni.

Aggiornamento del 8 giugno 2025

Non sono neanche passati sei mesi dal mio post e il mio auspicio si è già avverato: Notebook LM di Google permette di riconoscere la scrittura manuale.
Ho caricato alcune delle scasioni neanche di buona qualità di quaderni fisici scritti nel 2008 e il riconoscimento della mia pessima scrittura ha funzionato.

L'accuratezza non è il massimo, inferiore alla trascrizione vocale, ma è già un ottimo risultato.
Diciamo che dalle prime prove siamo al 70% di accuratezza, storpia quasi sempre i nomi ma in generale il senso viene conservato.

Da qualche tempo sto usando Notebook LM per caricare le registrazioni audio con le mie riflessioni quotidiane e mi faccio generare un podcast che commenta la mia giornata.
Ieri ho caricato le scansioni di un quaderno di Giugno 2008 e i conduttori virtuali del podcast hanno commentato cosa facevo in quel periodo con una accuratezza straordinaria.

Comments

Popular posts from this blog

Il recupero e la speranza per il futuro - Ottobre 2024

Tra incognite e piccoli traguardi, la strada continua - Dicembre 2024

Il recupero e l'incerta strada verso la normalità - Agosto 2024