Wpis z mikrobloga

Skopiuj link

25.05.2016, 12:08:54

Siemanko mirki,
Jako jeden z punktów mojej magisterki mam do wykonania całkiem prosty program, który będzie pobierał pliki .csv (z dużą ilością danych), a następnie wykona operacje porównania danych ze sobą i wypluje plik .csv, który będzie spełniał funkcję raportu. Mam 2 koncepcje i nie wiem, która będzie szybciej wykonywać operacje na danych zawartych w plikach csv. Dodam, że narzucono mi C# wraz z MySQL lub sam C#.
Czy lepiej utworzyć bazę danych z plików .csv w MySQL i połączyć ją z C#, a następnie napisać kod, który będzie wykonywał porównania. Czy też bezpośrednio parsować pliki csv do C#(bez użycia MySQL) i dopiero wtedy wykonywać na nich operacje?
Dodam, że nie studiuję Informatyki ani Automy, także skill w programowaniu jest raczej marny.
#programowanie #csharp #mysql #magisterka #csv

wnocy

25.05.2016, 12:10:54

@kontaktron: co to jest duża ilość danych? Ile rekordów będzie w takim pliku?

kontaktron

25.05.2016, 12:16:33

@wnocy: Około 20000 rekordów w jednym pliku.

wnocy

25.05.2016, 12:20:05

@kontaktron: no to ja bym się w bazę raczej nie bawił, tylko wczytał to w postaci listy struktur, obliczył i wypluł do innego pliku. Chyba, że obliczenia wymagają przeszukiwania tej listy tak, że mechanizmy bazodanowe przyspieszyłyby/ułatwiłyby całe zadanie.

kontaktron

25.05.2016, 12:27:42

@wnocy: Polegałoby to na tym, iż najpierw porównywane są ze sobą 2 pliki csv, a konkretnie sprawdzane jest czy dane zawarte w 4 kolumnach, zawierają się w kolejnym z plików csv, jeśli tak to operacja się kończy, jeśli nie to dochodzi do porównania z kolejnym plikiem .csv. Nie wiem czy wystarczająco jasno się wyraziłem, jeśli nie to daj znać ;)

q.....d

konto usunięte 25.05.2016, 12:28:53

@kontaktron: trochę niejasno

wnocy

25.05.2016, 12:29:22

@kontaktron: czyli dane z czterech kolumn muszą być takie same w obu plikach, dla wszystkich rekordów?
Może weź jakiś przykład, tak na jabłuszkach.

q.....d

konto usunięte 25.05.2016, 12:32:09

@kontaktron: a przy tak małej ilości danych to ci żadne bazy nie są potrzebne

elirath

kontaktron

25.05.2016, 13:05:30

Komentarz usunięty przez autora

kontaktron

25.05.2016, 13:07:46

@qweasdqweasd: Postaram się jak najjaśniej potrafię i z większą dokładnością wytłumaczyć:
Mam 3 pliki .csv, nazwijmy je CSV1, CSV 2, CSV 3,
W tych 3 plikach znajdują się kolumny o nazwach X1, Y1, Z1, K1 dla CSV1, analogicznie dla kolejnych 2 plików
Każda z kolumn zawiera około 20000 wierszy.
Dla pliku CSV1 wykonywana jest operacja, która ma na celu sprawdzenie czy argumenty dla kolumn X1, Y1, Z1, K1 , występują w

kontaktron - @qweasdqweasd: Postaram się jak najjaśniej potrafię i z większą dokładno... — **źródło:** comment_2vzWHpbdTf7KbvqmUk9OzkWa0woZojfp.jpg

wnocy

25.05.2016, 13:17:38

@kontaktron: rozumiem. W takiej sytuacji nie ma sensu angażować do tego bazy danych. Wczytaj sobie wszystkie pliki do list. Następnie iteruj po danych z tego CSV1 i dla każdego wiersza wywołuj sobie funkcję, która zwraca informację, czy rekord został odnaleziony czy nie.

kontaktron

25.05.2016, 13:19:57

@wnocy: Dziękuję za informacje ;)

wnocy

25.05.2016, 13:21:47

@kontaktron: oczywiście funkcję sprawdzającą rozbij sobie na kolejne mniejsze. Jedna odpowiedzialna za sprawdzanie w jednej konkretnej liście. Druga odpowiedzialna za wywoływanie tej poprzedniej dla odpowiedniej listy, itd. ;]

q.....d

konto usunięte 25.05.2016, 16:21:51

@kontaktron: ja bym to widział tak:
1. tworzysz sobie klasę z takimi polami jakie masz kolumny w tym csv
2. overridujesz hashcode i equals
3. wczytujesz sobie wszystkie pliki do HashSetów
4. sprawdasz sobie normalnie po kolei te sety czy sobie zawierają i wypisujesz do raportu
5. gg easy

plushy

25.05.2016, 16:59:16

@kontaktron: Baza danych do tego nie potrzeba, to jedna linijka w awk lub kilka za pomocą innych toolsów.

Aktywne Wpisy

BezDobry

BezDobry +100

1 godz. i 46 min temu

- będzie można montować zużyte wiatraki,
- oczywiście pod domami,
- no i w obszarach chronionych,
- a jak ktoś wymarzy sobie montaż na terenach rolnych to można je błyskawicznie zamienić w tereny inwestycyjne,
- no i Simensa się uratuje,
- ale przynajmniej odblokowali na ten cel kredyty z KPO.....

Ale Seba pa jaki śmieszny ten Hołownia i jak orze pisowców

#bekazlibka #bekazlewactwa #ekologia #wiatraki #takaprawda #bekazpodludzi

BezDobry - - będzie można montować zużyte wiatraki,
- oczywiście pod domami,
- no i w... — **źródło:** temp_file5961500572041881118

agiller

agiller +50

1 godz. i 21 min temu

Mam nadzieję że jeśli znów ktoś napisze "Zimo #!$%@?" to ta szczotka magicznie teleportuje mu się do tyłka.
#bekaztransa #zima #oswiadczenie #pracbaza #heheszki

agiller - Mam nadzieję że jeśli znów ktoś napisze "Zimo #!$%@?" to ta szczotka magicz... — **źródło:** 20231204_015735

Aktywne Wpisy

Aktywne Znaleziska

Przełomowe odkrycie. Lek na stwardnienie rozsiane po testach na ludziach

Pocisk FGM-148 Javelin od środka

IMPERIUM Z KURZU lektor

Chiny kontynuują węglowe szaleństwo pomimo celów klimatycznych

Gdzie znajdujemy się dzisiaj z budową CPK?

Popularne tagi