Wpis z mikrobloga

Skopiuj link

15.08.2020, 13:27:17

czesc. mam bardzo duzo danych w plikach csv. potrzebuje tylko czesc danych z tych plikow. jakim sposobem najbardziej poprawnie bedzie te dane wyłuskać? poczatkowo chcialem wczytac caly csv do tabeli w pandas #python i niepotrzebne wiersze pousuwac ale teraz mysle czy nie bardziej optymalnie bedzie czytanie wiersz po wierszu tych csv i dodawanie do tabeli tylko tych rekordow ktore potrzebuje? a moze jeszcze jakos inaczej? #naukaprogramowania #bazydanych

h.....s

konto usunięte 15.08.2020, 13:29:57

Where warunek?

s.....s

konto usunięte 15.08.2020, 13:34:30

@rosso_corsa: notepad ++?

burczymu_chastefan

15.08.2020, 13:35:57 via Wykop Mobilny (Android)

@rosso_corsa: postaw postgresa, wczytaj, odpytaj o co chcesz i chamsko wypluj przez \o

1989

l.....k

konto usunięte 15.08.2020, 13:43:21 via Wykop Mobilny (Android)

@rosso_corsa: po co pandas wystarczą zwykle operacje na txt. Daj sobie że każda linia to osobna lista i filtruj co tam chcesz.

rosso_corsa

15.08.2020, 13:49:25

@burczymu_chastefan: @sutyrips: @luukasek: 150gb ?

l.....k

konto usunięte 15.08.2020, 13:53:30

@rosso_corsa: uzyj glob by wyluskac na poczatek pliki interesujace Ciebie, daj je do listy, a pozniej otwieraj kazdy plik z listy i dalej łuskaj.

Nemeczekes

15.08.2020, 13:54:23 via Wykop Mobilny (Android)

@rosso_corsa: skoro 150gb to sobie przerób to na parquet. Zajmie dużo mniej. Pandas/Dask sobie z tym poradzi.

n0c0Mpr3h3nD

15.08.2020, 14:01:50 via Wykop Mobilny (Android)

@rosso_corsa: Python, import csv, with open as CSVFile, with open writeFile as wFile, csv reader(csv file),csv writer(wFile), for row in csv reader, if coś writer. Write(row)

rosso_corsa

15.08.2020, 14:11:53

uzyj glob by wyluskac na poczatek pliki interesujace Ciebie, daj je do listy, a pozniej otwieraj kazdy plik z listy i dalej łuskaj.

@luukasek: o to spoko opcja na pewno sie przyda

parquet

@Nemeczekes: tez piewsze slysze musze obczaic najpierw co to jest za bajer

Python, import csv, with open as CSVFile, with open writeFile as wFile, csv reader(csv file),csv writer(wFile), for row in csv reader, if coś writer. Write(row)

n0c0Mpr3h3nD

15.08.2020, 14:16:23 via Wykop Mobilny (Android)

@rosso_corsa: chociaż jak myślę że jak 150gb to może być IO throttle jak będziesz pisał i czytał po linii, może jednak lepiej w pandas otwierać w chunk.
Masz dużo plików o małym rozmiarze czy mało plików o dużym rozmiarze?

rosso_corsa

15.08.2020, 14:17:59

@n0c0Mpr3h3nD: nieduzo jakies 70 plikow

l.....k

konto usunięte 15.08.2020, 14:19:33

glob

@rosso_corsa:
masz tu przyklad:
import glob
allPDF = []
def pliki():

for file in glob.glob("*dd*.csv"):
allPDF.append(file)
pliki()
kazdy plik csv co ma w nazwie dd i jest csv zostanie dodany do listy allPDF. mozesz sobie dowolnie modyfikowac

rosso_corsa

15.08.2020, 14:21:06

@luukasek: no juz odpalilem w ten sposob i śmiga, dzieki

from glob import glob
listaPlikow = glob('D:\bdrozpakowana\*.csv')
print(listaPlikow)

n0c0Mpr3h3nD

15.08.2020, 14:24:00 via Wykop Mobilny (Android)

@rosso_corsa: @luukasek:
Co wy robicie (⇀‸↼‶)

l.....k

konto usunięte 15.08.2020, 14:24:20

@rosso_corsa: no i git i teraz dalej for w loopie i otwieraniem plikow i sprawdzanie co wewnatrz

rosso_corsa

15.08.2020, 14:24:39

@n0c0Mpr3h3nD: liste plikow hehe

l.....k

konto usunięte 15.08.2020, 14:25:06

@n0c0Mpr3h3nD: dziala? dziala. jakos nie podales innego/ lepszego sposobu.

konto usunięte
Ilythiiri

rosso_corsa

15.08.2020, 14:28:00

@n0c0Mpr3h3nD: @luukasek: dałem 10 plikow do listy i probowalem wczytac w ten sposob ale po paru sekundach zajęło mi 32gb ram i skreszowało spydera i mozille, chyba do ramu wszystko ładował

dataframes = [pd.read_csv(f) for f in listaPlikow]

n0c0Mpr3h3nD

15.08.2020, 14:31:40 via Wykop Mobilny (Android)

@rosso_corsa: rozumiem że potrzebujesz gotowego kodu a nie podpowiedzi?

rosso_corsa

15.08.2020, 14:32:54

@n0c0Mpr3h3nD: nie, googluje tamto co napisales tylko nie wiem co sie dzieje co to robi

Aktywne Wpisy

Knamga

Knamga +411

6 godz. temu

Czy nasz gatunek przetrwa?? #spermiarzalert #bekazpodludzi

ziuaxa

ziuaxa +246

4 godz. i 53 min temu

Zazwyczaj wrocławska policja swoją niekompetencją, opieszałością, agresją albo ignorancją i kretynizmem po prostu niszczy życie uczciwym obywatelom. Tym razem stało się inaczej i przez brak mózgu wyszło jak wyszło.

Typ od prawie roku był poszukiwany listem gończym, a na stałe przebywał w miejscu zameldowania. XD XD

"Transportujący go policjanci — Daniel Ł. i Łukasz K. to niezwykle doświadczeni funkcjonariusze. Pierwszy w służbie jest od ćwierć wieku, drugi od 19 lat"

Piątkowa

ziuaxa - Zazwyczaj wrocławska policja swoją niekompetencją, opieszałością, agresją al... — **źródło:** temp_file8770210949034126534

Aktywne Wpisy

Aktywne Znaleziska

Teoria Muzyki dla Zwykłych Śmiertelników

Węgry blokują wypłatę środków dla Polski z UE. Chodzi o dostarczanie broni...

Podejrzany o postrzelenie policjantów został ujęty

Kilkadziesiąt tysięcy osób dostanie wezwanie do wojska. Jest nowe rozporządzenie

Zawiera treści 18+

Popularne tagi