01/12/2025
Il primo caso documentato di una campagna di spionaggio informatico su larga scala eseguita in maniera quasi totalmente autonoma da un modello di AI.
25/11/2025
Sono 40 anni che programmo. Un'analisi spietata del perché Gemini e Claude sono solo generatori di barzellette quando si parla di Deep Engineering e hardware.
Pubblicato il 24/11/2025
Esploriamo i moniti di Geoffrey Hinton dopo il Premio Nobel e la spinta globale per le "Linee Rosse" vincolanti sull'AI.
Pubblicato il 27/10/2025
Power Sampling estrae il ragionamento dai modelli di base affilando la distribuzione in inferenza, spesso alla pari o meglio dell'RL su MATH500, HumanEval e GPQA.
Pubblicato il 16/10/2025
Framework open-source italiano per agenti, sistemi multi-agente e pipeline RAG semplici e osservabili.
Pubblicato il 24/09/2025
SpikingBrain riduce i costi di addestramento ed energia con neuroni spiking e linear attention, aprendo la via a LLM efficienti su hardware non NVIDIA.
Pubblicato il 08/09/2025
Filtro di confidenza interno per migliorare accuratezza e ridurre i token [1].
Pubblicato il 25/08/2025
Un importante passo avanti nell'AI locale con architettura Mixture-of-Experts e supporto multimodale.
Pubblicato il 01/06/2025
Cancella gradualmente i vecchi post e riduci la tua impronta digitale.
Pubblicato il 27/05/2025
Soluzione completa offline con Whisper, diarization e enhancement.
Pubblicato il 24/05/2025
Comprendere vec2vec e l'ipotesi platonica per tradurre embedding tra modelli.
Pubblicato il 23/05/2025
Un framework adattivo che decide quando ragionare in profondità per maggiore efficienza.
Pubblicato il 22/05/2025
Un approccio autonomo che elimina i dataset curati manualmente e potenzia il ragionamento nella codifica e nella matematica.
Pubblicato il 15/05/2025
Un approccio senza token che raggruppa i byte in patch per LLM efficienti e robusti.