@nataire , merci pour ton retour !
Je suis développeur full stack spé asp net + angular/vue de base :/ donc niveau python j'ai les notions mais rien de fou ..
Je vais jeter un coup d'oeil sur kaggle mais je pense pas partir sur ca.
Après pour revenir sur l'aspect dataset :
- J'ai facilement une dizaine d'enregistrement par ressource par jour sur plus de semaines ( prix lot 1 / 10 /100 et moyen et sa date d'enregistrement )
- Cette db s'alimente en auto donc mon dataset s'améliorer de jour en jour .
Coté PC ayant un ryzen 7 3800x ca devrait pas poser de pb de je pense et dans le pire des cas j'ai une CG derrière si je vois que ca passe mal sur cpu.
Par exemple je créer ce pipleLine pour le calcul du prix lot de cent :
ps : désolé pour le formattage du code (impossible d'ajouter une balise Spoiler + code)
var pipelinePriceCent = mlContext.Transforms.CopyColumns(outputColumnName: "Label", inputColumnName: nameof(Ressources.PrixCent))
.Append(mlContext.Transforms.Categorical.OneHotEncoding(outputColumnName:"RessourceEncoded" , inputColumnName : nameof(Ressources.Ressource)))
.Append(mlContext.Transforms.Categorical.OneHotEncoding(outputColumnName: "DateEncoded", inputColumnName: nameof(Ressources.Date)))
.Append(mlContext.Transforms.Concatenate("Features","PrixUn","PrixDix", "PrixMoyen", "RessourceEncoded", "DateEncoded"))
.Append(mlContext.Regression.Trainers.FastTree())
.Append(mlContext.Transforms.CopyColumns(outputColumnName: "RessourceEncoded", inputColumnName: "Score"));