#hadoop

20.11.2022, 20:42:30

0

Cześć,

Czy ktoś z was miał okazję pracować z technologią hadoop w kontekście zadań związanych z tematyką Machine Learning ? jeśli tak to jak wyglądał proces tworzenia modeli, obróbki danych od początku rozpoczęcia ciągu technicznego ?

Jak rozumiem Hadoop to jest jakby to powiedzieć ogromny magazyn na przechowywanie dosłownie różnych danych z różnych systemów dane te mogą być ustrukturyzowane, nieustrukturyzowane itp. wchodzą oni to jak dobrze rozumiem przestrzeni HDFS na surowo, i

Hadzik

20.11.2022, 21:08:57

0

@printHelloWorld: zależy jaki ML, do niektórych klasycznych modeli Spark + Spark MLlib jest wystarczający

printHelloWorld

17.12.2022, 18:46:54

0

@Hadzik: Cześć, sorki za odpisanie dopiero teraz, zależy na tworzeniu modelu prognozujących pewne sytuację. Czy masz może jakiś fajny diagram opisujący ML w kontekście Hadoop ?

lizak21

18.03.2022, 08:06:28

0

#bigdata #informatyka #hadoop

Witam, szukam szkolenia z Administracji Hadoopa (nie z Cloudery), cena jak by nie gra roli, najlepiej jak w było to szkolenie stacjonarne w Warszawie
Ktoś był i poleca ?

PiotrokeJ

10.11.2021, 09:34:03

0

Cześć, dostałem mały projekt w pracy w pysparku. Mała transformacja danych i wrzucenie wyników do nowej tabeli. W punktach opiszę co trzeba zrobić:
1. 4 uniony
2. Pobrać tabelę z mappingiem
3. Zrobić joina (te 4 uniony i mapping)
5. Przerobić 2 kolumny na podstawie wartości, i dodać dwie puste kolumny
4. Wykonać prostą agregacje danych -> groupby po 5 kolumnach.
6. Wrzucić wyniki do nowej tabeli

Tabela z unionami ma łącznie

o.....6

konto usunięte 10.11.2021, 09:36:45

2

@PiotrokeJ: 7k rekordów w sparku? Jebnij im to w sql, pandas albo excelu.

inny_89

26.11.2021, 11:51:32

1

Apache Ambari

@PiotrokeJ: To już jest kwestia samego zarządzania (wybacz ale nie mam pojęcia jak to inaczej ubrać w słowa) translacją samego SQL na MapReduce na Hadoopie.

W tym przypadku Hadoop trochę inaczej ogarnia takie zapytanie niż spark. Dlatego jak odpalasz coś bezpośrednio na hadoopie to możesz dostać wyniki (błędne lub dobre), a w sparku już nie.

W bardzo prostych słowach i bardzo ogólnie (pomijając wszelkie niuanse) wytłumaczono to tutaj:
https://searchdatamanagement.techtarget.com/definition/SQL-on-Hadoop

qbek

22.01.2021, 10:46:25

2

czy ktoś może polecić serwisy, za które faktycznie warto zapłacić, z zaawansowanymi kursami #programowanie w #python lub budową aplikacji na #aws / #azure / #gcp które mają własne labki/sandboxa do odpalania zadań podczas nauki? cloud native apps jako priorytet, materiały o #bigdata #hadoop lub #machinelearning jako dodatkowy bonus ( ͡° ͜ʖ ͡°)
jak dotąd testowałem linuxacademy.com (aka. acloudguru), szukam czegoś nowego

#naukaprogramowania #cloud

qbek

22.01.2021, 13:41:59

0

@mmichal: plusem udemy jest to, że później masz bezterminowo dostęp, a tu tylko jak płacisz, trzeba się streszczać z robienie kursów, wydając te 2k to trzeba by trzaskać ze 4 kursy miesięcznie żeby się "opłacało" ( ͡° ͜ʖ ͡°)

mmichal

22.01.2021, 13:52:27

0

@qbek: ja tak zrobiłem, nie wiedziałem ze jest inaczej nawet :) dałem 46zl za kurs i elo

sztefen_muller

20.01.2021, 10:30:22

22

Map & Reduce dla opornych (⌐ ͡■ ͜ʖ ͡■)
#programowanie #hadoop #humorinformatykow #byloaledobre

sztefen_muller - Map & Reduce dla opornych (⌐ ͡■ ͜ʖ ͡■)
#programowanie #hadoop #humo... — **źródło:** comment_1611138591YvuMrLQDI03iVwoJolbAQf.jpg
Pobierz

rosso_corsa

20.01.2021, 10:46:21

21

@sztefen_muller: podczas mapowania cebula zmieniła kolor

Infamiee

20.01.2021, 12:18:36 via Wykop Mobilny (Android)

10

@rosso_corsa: to nie bug to feature ( ͡° ͜ʖ ͡°)

lizak21

26.11.2020, 22:28:41

0

#bigdata #hadoop #linux
Witam może ktoś z was był szukam jakiegoś szkolenia z Cloudery aby się odbyło do końca tego roku. Czy ktoś może był g w tym roku na takim szkoleniu i poleca lub wie gdzie takie szkolenia się odbywają. Compedium nie ma terminów. Ew. jakie inne szkolenie warto zrobić aby wejść w rozwiązania hadoop jako administrator.

p.....k

konto usunięte 09.11.2020, 17:47:04

0

Bardzo podoba mi się #hadoop
Jak z #pracbaza w tym?

Kura_Wasylisa

09.11.2020, 18:12:08 via Android

1

@programista4k stawiam że zdecydowana większość utrzymuje go dla hdfsa
Przy okazji yarn ze sparkiem
I hive/impapa

Tam gdzie się da to ida w cloud, więc hadup najprędzej w banku

Kura_Wasylisa

10.11.2020, 09:14:53 via Android

0

@programista4k ta tematyka

K.....0

konto usunięte 02.05.2020, 16:38:52

2

Hej mirki, zainteresowałem się bazami danych i ich analizą. Jestem totalnie zielony, nie umiem też into #programowanie ani #informatyka

Chciałbym poznać zagadnienie analizy danych pod kątem youtuba, czy innych social mediów. Chciałbym wykorzystać tę wiedzę przy prowadzeniu kanału na YT, bądź fanpage na facebooku. Nie wiem sam, jakie są możliwości zbierania danych, ani co można z nich wyczytać. Ciekawi mnie to po prostu.

Szukałem poradników na youtubie, ale są dla mnie za

izzy4busy

06.01.2020, 10:50:29

2

#hadoop #informatyka #it #spark #logi #bigdata #analizadanych #logs
Poszukuję mireczki jakiegoś otwartego źródła, na którym mógłbym znaleźć duży zbiór logów z platformy Hadoop. Czy znacie może coś godnego polecenia ?

nieinformatyk

03.08.2019, 08:40:49

3

#programowanie #nosql #hadoop

Dlaczego warto znać nierelacyjne bazy danych?

Cześć:)
Nagrałem właśnie materiał o nierelacyjnych bazach danych. W nagraniu poznasz odpowiedzi na m.in:
Co to takiego jest baza nosql?
Czy warto się jej uczyć?
Jakie są rodzaje nierelacyjnych baz danych?

W 15-minutowym materiale znajduje się oczywiście dużo więcej wiedzy:) Zainteresowanych zapraszam do oglądania tutaj: https://www.youtube.com/watch?v=78EOiGTTtQI&list=PL8g9gILZp1OI9h68Pv7xxsgvdb1Vm3XkE&index=22

nieinformatyk - #programowanie #nosql #hadoop

Dlaczego warto znać nierelacyjne baz...

haka65

07.04.2019, 18:53:23

4

Elo Mirki,
pracuje ktoś jako big data engineer? Łatwo się przekwalifikować z Data Scientista? Mam doświadczenie głównie w developmencie w Sparku, ale raczej Python, ok. 2 lata. W jakich językach piszecie? Dominuje Scala czy raczej Java? Jak wyglądają codzienne zadania?
#hadoop #bigdata #datascience #programowanie

Krever

08.04.2019, 08:11:42

1

Jak wyglądają codzienne zadania?

Zrozum biznes, napisz kod tak aby dało się go utrzymać (zrozumieć, zmienić, rozwinąć). Czyli tak jak kazdy inny software engineer tylko z innymi technologiami.

W jakich językach piszecie?

Scala

Dominuje Scala czy raczej Java?

Ciężko powiedzieć, widuje mniej więcej po równo. Javowców się łatwiej zatrudnia, Scalowe API jest przyjaźniejsze dla developera.

Krever

08.04.2019, 12:35:37

3

@haka65: Nope, jedyne co wiem to że kod data scientistów z którymi pracowałem nie nadawał sie do niczego. Tzn wymagał przepisania od 0 gdy miał iść na produkcję. Ale to raczej nic nie znaczy w tym przypadku.

Generalnie uwazam ze nie ma się czego bać, dużo jest developerów samouków więc i DS jako DE da rade.

Jobviously

22.02.2019, 08:14:16

0

/ Big Data DevOps Administrator (middle, senior)

Kto: GetInData
Widełki: 10 000 - 16 000 PLN netto + szereg benefitów
Lokalizacja: Warszawa, Puławska 39
✍️Umowa: B2B
Kogo szukają?

Kogoś kto lubi wdrażać, zarządzać i rozbudowywać platformy Big Data składające z technologii open-source m.in. Hadoop (HDP, CDH), Kafka, Nifi, Flink, Spark, Hive. Najlepiej w zautomatyzowany sposób np. przy użyciu Ansible oraz zgodnie najwyższymi standardami związanymi z bezpieczeństwem, bezawaryjnością oraz wysoką wydajnością.

Mile widziane

skydancer

22.02.2019, 08:28:46 via Wykop Mobilny (Android)

2

@Jobviously: ciekawa oferta, ale 16k dla seniora w takiej technologii to moim zdaniem za mało. HDP, Kafka i Nifi wymagają naprawdę ogromnej wiedzy i doświadczenia.

infamia

06.02.2019, 17:17:44

2

#naukaprogramowania #java #spark #hadoop #deeplearning #ksiazki
1: Hadoop : kompletny przewodnik : analiza i przechowywanie danych / Tom White ; [tłumaczenie Tomasz Walczak].
2: Zwinna analiza danych : Apache Hadoop dla każdego / Russell Jurney ; [tłumaczenie: Przemysław Szeremiota].
3: Spark : zaawansowana analiza danych / Sandy Ryza, Uri Laserson, Sean Owen, Josh Wills ; [tłumaczenie: Andrzej Watrak].
4: Poznajemy Sparka / Holden Karau, Andy Konwinski, Patrick Wendell, Matei Zaharia ; [przekład

Kura_Wasylisa

06.02.2019, 18:04:18 via Android

1

@infamia 1. Wymaga troche obeznania + kody w javie.
3. Troche o wszystkim i o niczym + kod w scali
4. Poziom dla poczatkujacych i trochw outdated

Kura_Wasylisa

06.02.2019, 19:33:02 via Android

1

@newPassword
https://www.udemy.com/the-ultimate-hands-on-hadoop-tame-your-big-data/

https://www.udemy.com/apache-spark-with-scala-hands-on-with-big-data/?ranMID=39197&ranEAID=vedj0cWlu2Y&ranSiteID=vedj0cWlu2Y-3Qlu1Z0kvMoqVrXGpY4xug&LSNPUBID=vedj0cWlu2Y

+ dokumentacja + do sparka ksiazka Laskowskiego + scala / python / java

alterdata_io

06.12.2018, 11:14:24

333

Witajcie Mirki i Mirabelki

Pracujemy w branży IT i zajmujemy się #bigdata, analizując / przetwarzając duże bazy danych i wyciągając z nich wnioski, co nie jest takie łatwe jak się może wydawać :)
Na co dzień w każdej firmie istnieje jakaś baza danych która po prostu "puchnie" zwiększając swoje rozmiary przekraczające czasem kompetencje GoogleSheeta, czy mySQLa. Wtedy wkraczamy my!

Jako, że jesteśmy tutaj nowi i jest taki zwyczaj to chcielibyśmy zrobić

brovar

06.12.2018, 11:30:47

14

@alterdata_io: Napisaliście kiedy, ale napiszcie jeszcze GDZIE się ów Webcast odbywa ;)

caribbean

06.12.2018, 11:45:02

14

@alterdata_io: I napiszcie CO trzeba zrobić, żeby się załapać na rozdajo? Zaplusować, napisać komentarz? Jak coś tu właśnie napisałem więc.. (✌ ﾟ ∀ ﾟ)☞

MBU_

03.08.2018, 11:50:15

1

Hej Python Developerzy :) Gdyby ktoś chciał mocniej wejść w devopsowanie ale jednocześnie nie chce zostawić programowania, to proponuję rolę łączoną (50/50). Wspieram w rekrutacji na tę rolę bardzo fajną firmę produktową w Warszawie, w duchu startupowym :) Więcej info na prv: mbudzynska@ithunt.pl

#devops #aws #kubernetes #docker #ansible #python #hadoop #bigdata #machinelearning #ai #warszawa #saas

figiel

03.08.2018, 09:35:19

24

#raspberrypi #arm #linux #hadoop #bigdata
Nareszcie, po długim okresie zbierania podzespołów, udało mi się uruchomić mój pierwszy cluster raspberry pi. W założeniu sprzęt ma służyć głównie do nauki i testowania różnych aplikacji powiązanych z Big Data. Dodatkowo w przyszłości planuję pobawić się Dockerem. Po kilku dniach walki z konfiguracją, stwierdzam, że był to bardzo dobry pomysł, nauczyłem się wielu nowych rzeczy i zapewne wielu się jeszcze nauczę. Polecam wszystkim, których zawsze interesowało

figiel - #raspberrypi #arm #linux #hadoop #bigdata
Nareszcie, po długim okresie zbie... — **źródło:** comment_KkWaqOtJSjfbpz4A615Fm4TExax2kfyG.jpg
Pobierz

wykopek_n

03.08.2018, 09:37:20

2

@figiel: Ja mam taką zabawę codziennie w pracy, kilka razy się już nawet pomyliłem :P

figiel

04.08.2018, 17:53:02 via Wykop Mobilny (Android)

1

@mihix: piękny kawalerze jestes w blędzie, wersja oryginalna

piterRRR

05.04.2018, 23:04:16

1

#programowanie
#hadoop

mirki mam na vm postawionego linuxa ze sparkiem i hadoopem problem jest taki że nie mogę wysyłać plików przez hdfs web ui z poziomu windowsa, mogę wejść do web ui, dodac katalog ale pliku nie chce wysłać ;/ natomiast na linuxie mogę wrzucać pliki przez web ui. Co może być nie tak??? jak wrzucę plik na linuxie to jest git i mogę korzystać z niego przez hdfs://

piterRRR - #programowanie
#hadoop

mirki mam na vm postawionego linuxa ze sparkie... — **źródło:** comment_lUCXMX38FieYo6TCix0czaNMPQTSTgp4.jpg
Pobierz

bart-bednarek

05.04.2018, 23:06:49

1

@piterRRR: ahttps://www.youtube.com/watch?v=2yk5Gsqr7bM tu masz tutorial

Wyrewolwerowanyrewolwer

10.06.2017, 19:20:45

4

Poszukuję tutoriali/ebooków wprowadzających i wyjaśniających Hadoopa i Elastic Search (tak z ciekawości, chcę po prostu to poznać).

Ktoś/coś?

#programowanie #java #it #hadoop #elasticsearch

Smevios

10.06.2017, 19:53:38

0

wołajcie

Kresse

10.06.2017, 20:00:54

1

@Wyrewolwerowanyrewolwer: http://shop.oreilly.com/product/0636920033448.do bylo calkiem niezle. Maja jeszcze kilka innych ksiazek o konkretnych narzedziach (HBase, Zookeeper etc).

birus

17.03.2017, 13:42:01

2

#programowanie #hadoop jest cos takiego jak hadoop w przykladach dla poczatkujacych? widzialem ze jest wirtualka, ale to nie jest do konca to o co mi chodzi.

birus

17.03.2017, 13:46:35

0

@fegwegw: kazdy jest kiedys poczatkujacy, z hadoopa tez, jak z kazdej technologii

fegwegw

17.03.2017, 13:47:40

1

@birus: http://hadoop.apache.org/docs/current/

No to jedziesz.

k.....k

konto usunięte 15.03.2017, 13:35:50 via Android

1

Za pomocą MapReduce'a chce przekształcić plik csv (by dało to co pandas.unstack(), zmiana formatu tabeli z "szerokiego" na "wąską i długą"), napisałem prosty mapper i reducer, działa, tylko że wiersze w wyniku są oddzielone pustymi liniami.
Jak można to tak zredukować, żeby otrzymać plik a'la csv, bez pustych linii?

#hadoop #python #programowanie #datascience

meohaw

15.03.2017, 13:47:29

5

@krolikbartek: biorąc pod uwagę ile kodu pokazałeś to mogę ci tylko doradzić abyś przestał zapisywać puste linie do pliku ( ͡° ͜ʖ ͡°)

meohaw

15.03.2017, 14:04:00

2

@krolikbartek: https://ideone.com/fL88AF
wejście zawiera nowe linie, więc jak nie chcesz ich na wyjściu to musisz je usunąć, na przykład z pomocą line.strip()