Wpis z mikrobloga

@motoinzyniere: niby tak, ale zazwyczaj tam jest np dataset treningowy na 1500 wierszy i do tego kilka ficzerów. Kolejne datasety do klasyfikacji przez model są bardzo podobne do tych, na których był trenowany i działa.
@zibizz1: tak było w poprzednim banku, w którym pracowałem kilka lat temu, że łączyłem się z jakimś titanem przez anaconde. Tutaj nie. Nie ma kompletnie nic. Żadnej infrastruktury. Wszystkie modele przez to są niesamowicie proste i trzeba pisać tonę kodu, który dzieli większe datasety, przesyła porcjami do treningu itd.
@JamesJoyce: jeśli masz tak małe zbiory, że opłaca się je ściągać lokalnie to i laptop jest wystarczający. Zakładam, że bank nawet nie ma etl-a z prawdziwego zdażenia tylko podrzędnych DS, którzy piszą wszystko w notebookach na miliard celli