Advanced Search
Search Results
36 total results found
Introduzione
Iniziamo con una domanda semplice, cos'è il Machine Learning? Beh... iniziamo dicendo come può essere utilizzata: Deep Learning Cerchiamo innanzitutto di capire cosa è il deep learning e come si relaziona con il machine learning e l'AI. Inferenza ...
Multiclass classification
Nella classificazione multipla, a differenza della classificazione binaria possono essere identificate più di due categorie. Importante è comprendere l'utulizzo delle activation functions. Per la multiclass possiamo utilizzare la ReLU o la Sigmoid. Per esempi...
Computer vision e CNN
In questo capitolo tratteremo la computer vision e le reti convoluzionali. In generale in Pytorch per scaricare le immagini si utilizzata la libreria "torchvision" le cui specifiche sono dettagliate nella pagina di documentazione datasets Inizieremo ad u...
Custom datasets
04. PyTorch Custom Datasets In the last notebook, notebook 03, we looked at how to build computer vision models on an in-built dataset in PyTorch (FashionMNIST). The steps we took are similar across many different problems in machine learning. Find a datase...
Sessione 1
Nell'apprendimento per rinforzo (d'ora in poi verrà indicato con RL) si basa sul processo decisionale di Markov aka MDP attrraverso un task di controllo dove un set di possibili stati e azioni ritornano un reward e una probabilità di passaggio ad uno stato all...
Sessione 2
Metodi Model free Nel capitolo precedente abbiamo svolto un lavoro di pianificazione e non di appredimento per rinforzo in quanto avevamo il modello (ambiente) che ci diceva con quale probabilità svolgeva le azioni. La policy (pi) era in qualche modo nota, qu...
Sessione 1 (Markov Decision Process)
Task di controllo Il Task di Controllo è una sequenza di stati e azioni utili per addestrare l'algoritmo a risolvere un determinato problema. Il task di controllo è compostato da: 1) Stati S(t) - sono dei momenti nel tempo che assumono un certo valore 2) ...
Sessione 2 (Dynamic Programming)
La programmazione dinamica (aka DP) è il primo metodo in grado di risolvere il task di controllo. Lo scopo del DP è tovare la policy ottimale π* per ogni stato V dell'ambiente (che nel nostro caso è discreto) Per determinare quindi la policy ottimale bisogna...
Sessione 3 (Metodo Montecarlo)
Il Metodo Montecarlo (MC) migliora la policy iteragendo con l'ambiente e ottenendo dei ritorni (scontati da gamma) di cui viene calcolata la media. Per la legge dei grandi numeri più osservazioni (e quindi ritorni) otteniamo più ci avviciniamo al valore ottim...
Sessione 4 (Temportal Difference)
54
Uova in purgatorio
4-5 uova salsa di pomodoro (500g) 2 cipolle 1 aglio 1 peperoncino pepe una manciata origano formaggio grana o mozzarella(opzionale) 3 cucchiai di olio extra vergine basilico In una pentola grande soffriggere le cipolle, una testa d'aglio ...
Introduzione alla probabilità
Prima di procedere con lo studio del RL facciamo una breve introsuzione al calcolo probabilitico. (in particolare la probabilità elementare su insiemi finiti) Lezione https://www.youtube.com/watch?v=o9Rc1pCYaHo&list=PLMee1hSjLKdAL16E-7EzqHXsGOgzo8iro&index=...
Sessione 1 (v2)
Premessa In questa seconda versione del corso ho deciso di soffermarmi sui concetti che non avevo colto nella prima versione del corso stesso. Le nozioni del primo corso rimangono valide e sono da utilizzare come integrazione di questa seconda versione. ...
Passata di verdure
verdure fresche a piacimento sale grosso (una manciata) due tazze (quella nera) di acqua un cucchiaio di olio parmiggiano (opzionale a piatto pronto) 1/2 biccchiare di vino rosso nella scodella per la pasta predisporre: 1) preparare un soffritto c...
Dimestificazione delle serie temporali [1]
Tipologia di dati in sequenza Dati in sequenza temporale (TS) significano dati che presentano uno specifico ordine o una sequenza nella quale vengono presentati, es: Lo studio che verte in particolare sulle sequenza temporali che si suddividono in 1) serie T...
Configurazione enviroment [2]
Pytorch for dummy
Originariamente impletato da META ora fa parte della Linux foundation La base di tutto è il tensore, che non è altro che una matrice (o un array) sulla quale PT consente tutta una serie di operazioni, un po' come numpy, es: es: Layer della rete...
friggitrice ad aria
alimento tempo (min) temperatura (gradi) ricetta/note bistecca 16 200 10 minuti per lato direttamente dal frigor senza portarla a temperatura ambiente Oliare polvere d'aglio origano sale paprika pepe nero pre-riscaldare la friggitrice. girare a met...