#datascience - strona 5

13.10.2023, 08:29:11

0

#sztucznainteligencja #datascience #ai #chatgpt

Wiadomo coś nt. BloombergGPT? Jakiś czas temu było głośno o tym projekcie, jest artykuł na arxivie i Medium, ale nie mogę znaleźć modelu do pobrania/

https://medium.com/codex/bloomberggpt-the-first-large-language-model-for-finance-61cc92075075

piwomojepaliwo

15.10.2023, 19:48:05 via Wykop

1

@JamesJoyce: polecam w medium wykupić subskrypcję, mega materiały.

JamesJoyce

10.10.2023, 19:27:33

0

#programista15k #datascience #artificialintelligence #sztucznainteligencja

Ciekawe w jaki sposób Microsoft będzie redukował koszty, do momentu rozwoju AI, które będzie generowało większe przychody. Zarabiają na innych rzeczach, więc nie jest to pewnie jakiś wielki problem, ale jeśli rentowność nie zacznie rosnąć, może się nim stać. Ciekawe czy pójdą np. w reklamy, albo transfer kosztów obliczeniowych na klienta. Nie wiem jak to ostatnie mogłoby wyglądać.

JamesJoyce - #programista15k #datascience #artificialintelligence #sztucznainteligenc... — **źródło:** copilot
Pobierz

zibizz1

10.10.2023, 19:43:36 via Android

5

@JamesJoyce narazie jest proces uzależnia użytkowników. Jak już nie będą mogli sobie pozwolić na dokładanie do interesu to ustala takie ceny żeby to się spinalo. Ci których nie będzie stać zrezygnują, ale do tego czasu złowią sporo osób których będzie stać.

JamesJoyce

11.10.2023, 08:12:42 via Wykop

1

@ZyfiDynock: od kilku lat procesory graficzne są tworzone pod AI. Problem polega na tym, że jest ich za mało i są niewystarczająco wydajne. Generalnie zgadzam się, że przyszłość przyniesie lepsze GPU, ale wciąż, będą one bardzo drogie. Zwykła 4090 kosztuje ~10k, a gdzie 4090 do poważnych zastosowań na poziomie llmów.

Ja korzystam z ChatuGPT w plusie i jestem zadowolony. Ale to dlatego, że przyjmuję na klatę jego ograniczenia i nie oczekuję

JamesJoyce

10.10.2023, 17:53:04

0

#programista15k #datascience #artificialintelligence #sztucznainteligencja

Oglądaliście Altmana u Rogana? Warto? Widziałem kilka urywków i brzmi jak typowy Rogan "have yoou ever tried dmt" i typowy techbro Altman, za rok agi, a za 2 Superinteligencja.

peoplearestrange

10.10.2023, 18:17:52 via Wykop

1

@JamesJoyce: nie

peoplearestrange

20.10.2023, 10:32:13 via Wykop

0

@JamesJoyce: a co to za typki o ktorych w ogole piszesz

JamesJoyce

06.10.2023, 12:52:47

1

#programista15k #datascience #artificialintelligence #sztucznainteligencja #python

Hej mirki,
szukam ciekawego papera dotyczącego trenowania wielolabelowych modeli z nierównomiernie rozłożonym datasetem.
Danych jest niewiele. Z moich badań wyszło, że najlepiej radzi sobie linear SVC na tfidf (accuracy 92), ale zastanawiam się, czy jest coś lepszego.

Przykładowo, kiedyś, przy niewielkiej liczbie klas pisałem 1vs all na wszystkich klasach i działało to fajnie. Wtedy jednak robiłem to na jakimś
transformerze, a teraz mam do dyspozycji jedynie bardzo

Bejro

06.10.2023, 16:12:28 via iOS

1

@JamesJoyce podaj przykłady próbek z datasetu. Jeśli danych jest mało to może metalearning uda się jakoś zastosować

Bejro

06.10.2023, 16:48:27 via iOS

1

@JamesJoyce Ok, ale to nie jest szczególnie niezbalansowany dataset. A czemu nie możesz użyć innych modeli? Brzmi to na problem na 10 minut i niczego nie trzeba uczyć. Wygeneruj BERT embeddings dla całego zbioru, generujesz to samo dla nowego inputu, knn i gotowe pora na CSa, czy ma to chodzić na Arduino?

woodywoodpecker

06.10.2023, 11:03:15

0

W mojej firmie zostałem przypisany do nowego projektu o nazwie "Datalake". Ogólnie rzecz biorąc, nikt jeszcze nie wie, czym dokładnie będzie ten projekt, i niewiele osób ma doświadczenie w tym obszarze. Ja zostałem do niego przypisany ze względu na moje umiejętności techniczne, zwłaszcza w zakresie tworzenia makr.

W ramach tego projektu wstępnie takie tematy zostały mi podane: Azure Data Factory, Azure Data Bricks, ADLS Gen2 i PowerBI. Czy ktoś mógłby mi pomóc

cohontes

06.10.2023, 11:17:32 via Wykop

5

@woodywoodpecker: fajnie, niektórzy daliby się pokroić za taki stack. ( ͡° ͜ʖ ͡°) https://wiadrodanych.pl/page/7/ polecam jechać od pierwszych artykułów.

JebawczanRysionu

06.10.2023, 11:23:18 via Wykop

4

@woodywoodpecker: Datalake po polsku bagno danych B) Generalnie będziesz z nieustrukturyzowanych danych tworzył bardziej ustrukturyzowane twory z których będziesz tworzyć ładne tabelki i wykresy lub gdzieś je magazynował w jakimś mongodb albo sql. Sory jeśli mówię oczywistości

MarteenVaanThomm

03.10.2023, 18:15:03

0

Hej,

co myślicie o konferencjach typu Data Science Summit?

Na poważnie zmierzam ku szeroko rozumianej branży Data Science ("miękkie przebranżowienie" nazwijmy to) i myślę, że to byłoby spoko wydarzenie dla mnie, mimo że stawiam dopiero pierwsze kroki w kodzeniu pajtongiem algorytmów i robieniu certów ażura.
Nie oczekuję, że ktoś mnie zaprosi do procesu rekrutacyjnego po jakimś networkingu czy warsztatach, ale fajnie by było pogadać z kimś z branży na żywo.

Trzeba być

MarteenVaanThomm - Hej,

co myślicie o konferencjach typu Data Science Summit?

Na po... — **źródło:** es04afU
Pobierz

genco1

03.10.2023, 19:10:43 via Wykop

1

@MarteenVaanThomm: Według mnie takie konfy to są dobre dla ludzi z branży, którzy chcą poszerzać swoje horyzonty i takie wystąpienia tworzą fajna zajawkę na jakiś temat z którym nie miało się wcześniej do czynienia, albo zobaczyć jak jakaś firma podeszłą do konkretnego przypadku. No nie wiem czy na początek merytorycznie coś wyciągniesz już lepiej jak sobie pooglądasz na yt podobne wystąpienia o podstawach DS, dobrych praktykach czy jakiejś prezentacji konkretnego narzędzia,

peoplearestrange

03.10.2023, 19:13:45 via Wykop

2

Trzeba być turbo przekozakiem żeby wyciągnąć jakąś realną wartość dodaną z takiej konfy?

@MarteenVaanThomm: trzeba być DYNAMICZNY

JamesJoyce

03.10.2023, 11:35:17

2

Trenuję modele uczenia maszynowego na procesorze w laptopie wartym 3k, dla wielkiego międzynarodowego banku. Kiedy biznes wreszcie zrozumie, że jak chcą jakość, to muszą płacić za infrastrukturę? Z drugiej strony, mam możliwość podbicia swoich umiejętności w podstawach ml. Sam siebie oszukuję

#datascience #programista15k #sztucznainteligencja #programowanie

JamesJoyce

04.10.2023, 08:08:07 via Wykop

1

@D00msday: nie, bo security. Colab też nie. Ba, nawet binarki zapisanych modelów bywają blokowane przez sec, bo przez nie można malware przemycić (｡◕‿‿◕｡)

JamesJoyce

04.10.2023, 08:08:42 via Wykop

1

@#!$%@?: jest dokładnie tak. Czekanie aż np. nowa wersja pandasa zostanie zaklepana przez sec trwa kilka miesięcy xd

D00msday

25.09.2023, 16:59:37

6

Kurła, za każdym razem rozwalają mnie te 'profesjonalne prognozy' dotyczące dzietności autorstwa GUS-u. A najlepsze, że polscy eksperci biorąc takie coś na poważnie XD
Wystarczyłoby wziąć dowolnego 'Data Scientist-a' mającego jakiekolwiek pojęcie o demografii z jakiegoś korpo i przygotowałby w krótkim czasie 100x lepszą, rzetelniejszą i bardziej profesjonalną prognozę dzietności od tego czegoś. "Eksperci z GUS-u" narysowali odręcznie 3 kreski, podpisali je "wariant niski" / "wariant średni" / "wariant wysoki" i zadowoleni

D00msday - Kurła, za każdym razem rozwalają mnie te 'profesjonalne prognozy' dotycząc... — **źródło:** tfr_prog_1
Pobierz

turkrabach

25.09.2023, 17:04:52 via Wykop

1

@D00msday: Ja na wszelki wypadek trzymam parę w beczce, żeby wyjąć jak będzie spadać.
Podobno kiszone nie traci na wartości

hansschrodinger

25.09.2023, 17:53:49 via Wykop

2

@D00msday: a rzeczywistość zaskoczy wszystkich i będzie druga Korea ( ͡° ͜ʖ ͡°)

interpenetrate

24.09.2023, 09:28:07

0

Mireczki, jaką pracę można by połączyć z grafiką komputerową (ogólnie wizualiami), żeby pracowała też druga półkula mózgowa odpowiedzialna za obliczenia, myślenie, przewidywanie - ogólnie żeby nie mieć tylko dotyczenia z rozwojem w zakresie kreatywnym, bo czuję że zgłupiałem chyba trochę xd..
Chciałbym też móc wysilać umysł trochę, nawet jeśli trzeba to mogę pomyśleć o przebranżowieniu. Jestem trochę zagubiony na rynku pracy.
Proponowane było mi jako rozwiązanie data visualization bo mam studia z

loczyn

24.09.2023, 19:08:47 via Wykop

0

@interpenetrate:

peoplearestrange

24.09.2023, 21:07:42 via Wykop

0

@interpenetrate: no generalnie to nazwy stanowisk w korpo są bardzo płynne w jednej to bedzie jakis report developer w innej data analyst w trzeciej vizualization developer etc.. czytaj opisy i wysyłaj cv

JamesJoyce

21.09.2023, 14:38:04

0

#programowanie #programista15k #datascience #sztucznainteligencja

Copilot od 26 września będzie częścią wszystkich ich usług, w tym Office 365 i Edge. Ciekawe czy będzie to ten sam Copilot, co dotychczas, czy jakaś wydestylowana wersja. Tak czy inaczej to spore ogłoszenie. Zastanawiam się czym podyktowane. Czy tylko chęcią ekspansji na rynku, czy np. niską jakością kodu generowanego przez llmy, w porównaniu do hype jaki tworzyły. Zobaczymy

https://www.theverge.com/2023/9/21/23883798/microsoft-copilot-unified-windows-11-apps-launch-date

MarteenVaanThomm

21.09.2023, 16:10:08 via Wykop

0

@JamesJoyce: W P BI też będzie w standardzie?

JamesJoyce

21.09.2023, 16:24:01 via Wykop

0

@MarteenVaanThomm: PBI jest częścią Office 365, więc kto wie

OmeGa1

19.09.2023, 17:03:17

3

#iwonawieczorek #datascience

zadanie dla CSI wykop: korzystając ze statystyki zaginięć w Polsce i szacunków handlu ludźmi (dane w linku znaleziska poniżej), jakie jest prawdopodobieństwo, że Iwona została porwana?

https://wykop.pl/link/7216979/do-burdeli-w-ue-usa-i-na-bliskim-wschodzie-zostalo-sprzedanych-400-tys-ukrainek

około 90% z zaginionych odnajduje się w ciągu 3 miesięcy, a niektóre statystyki w Internecie podają, że nawet 98% osób zostaje odnalezionych (pytanie po jakim czasie). Czyli z 13-20 tys. zaginionych rocznie w Polsce połowa to kobiety - dzieląc na dwa, daje to

OmeGa1 - #iwonawieczorek #datascience

zadanie dla CSI wykop: korzystając ze statyst... — **źródło:** Zrzut ekranu 2023-09-19 183413
Pobierz

peoplearestrange

19.09.2023, 17:11:27 via Wykop

1

@OmeGa1: no juz, bedziemy ci prace domowa robic xD

OmeGa1

20.09.2023, 13:12:00 via Wykop

0

@Don_Kamizi: no spoko, z tym że takie rzeczy się kwantyfikuje, czy prawdopodobieńśtwo wynosi 10% czy 50% lub 80% żeby nadać kierunek śledztwu, czy trzepać znajomych i rodzinę na okrągło (jak dotychczas) czy raczej poprowadzić śledztwo w inną stronę.

Jesteśmy bardziej skłonni podejrzewać znajomych, a dzięki nowoczesnej statystyce dowiadujemy się że jest też całkiem spore prawdopodobieńśtwo że została porwana, większe niż się wydaje.

W USA robi się analizy "data science" od 20

OddajButa123

18.09.2023, 09:59:35

2

Istnieje obecnie jakakolwiek gorsza branża w IT od #datascience lub #businessintelligence ?

W pierwszym przypadku wymagają doktoratu i oferuja pensje jak dla juniora z pol roku doswiadczenia w linuxie, a w drugim jest chyba wiecej naganiaczy sprzedajacych gowno kursy od realnych ofert xD Na zachodzie rynek data tez wyglada tak #!$%@??

#programowanie

Volantie

18.09.2023, 10:18:28 via Android

2

@OddajButa123 na froncie bylo glosno kilka miesiecy temu jak aplikowalo ok 1200 ludzi na stanowisko, backend java, niby oferty sie pojawiaja ale potrafi byc nawet 700-800 cv

norbertkulski

18.09.2023, 10:29:34 via Wykop

2

Ale w czym konkretnie jest problem? Starasz się na wejście w branżę czy narzekasz, że masz wagon CVków do przejrzenia? ;)
Ostatnio rekrutowałem do zespołu juniora i faktycznie zgłosiło się sporo kandydatów, część już mogła pochwalić się całkiem solidnymi podstawami - więc teraz wybieramy na podstawie ich oczekiwań finansowych i właśnie doświadczenia.

MarteenVaanThomm

15.09.2023, 17:37:27

1

Robię model profitowości kontraktów handlowych w #pracbaza i chciałbym podpiąć pod niego prosty model machine learning, który na podstawie wstępnej propozycji handlowca proponowałby zoptymalizowane parametry takiego kontraktu, tak aby dążyć do maksymalnej profitowości.

Coś w stylu, że tutaj damy trochę większy rabat, tutaj dla nas ciut większa prowizja, klient prawie nie zauważy, a dla nas to będzie znacząca różnica w profitowości takiego kontraktu.

1. Ile czasu realnie coś takiego mogłoby zająć? Cośtam

MarteenVaanThomm - Robię model profitowości kontraktów handlowych w #pracbaza i chcia... — **źródło:** image
Pobierz

Bejro

15.09.2023, 22:40:45 via Wykop

1

@MarteenVaanThomm: jak masz dużo danych i ich model nie jest raczej skomplikowany to sieci neuronowe mogą łatwo być overkillem - model użyj jaki chcesz, ale nie przesadzaj z jego wielkością. Nie wiem też co dokładnie chcesz osiągnąć i dlaczego nie można tego po prostu policzyć. Jeśli masz zbiór zatwierdzonych "optymalnych" kontraktów i chcesz włożyć nowy nieoptymalny kontrakt aby go poprawić to możesz tu zastosować maszynę Boltzmanna. Ewentualnie zastosować redukcję wymiarowości, wyznaczyć

MarteenVaanThomm

16.09.2023, 09:35:27 via Wykop

1

@Bejro: dzięki bardzo, sporo ciekawych rzeczy piszesz.

Jeśli chodzi o równanie do średniej to tutaj nie zda to egzaminu. Dlatego, że jeśli mamy parametr X (jakaś opłata_2 powiedzmy) dla klienta równa 100, a w modelu referencyjnym, tym najbardziej profitowym ten parametr dąży do 20, to równanie 100 do 20, czy nawet 50 nie ma sensu, bo klient na to nie pójdzie. Nie chcemy tutaj przerabiać każdej propozycji kontraktu pod jeden słuszny

konradduzek

12.09.2023, 08:22:42

1

Mam na sprzedaz ponizsze ksiazki z #python oraz #datascience
- Data science od podstaw. Analiza danych w Pythonie Wydanie II (autor Joel Grus)
- Object-Oriented Python Master OOP by Building Games and GUIs (autor Irv Kalb)
- Python Wprowadzenie Wydanie V (autor Mark Lutz)
- Uczenie maszynowe w pythonie Leksykon kieszonkowy (autor Matt Harrison)
oraz Uczenie maszynowe z uzyciem Scikit-Learn i TensorFlow Wydanie II (autor Aurelien Geron)

Wszystkie ksiazki maja normalne slady

peoplearestrange

12.09.2023, 10:36:13 via Wykop

1

@konradduzek: slaba reklama ( ͡° ͜ʖ ͡°)

discoBambo

12.09.2023, 13:57:48 via Wykop

1

@konradduzek: czy w cene wliczony jest VAT? można an fakturkę? ( ͡° ͜ʖ ͡°)

JamesJoyce

08.09.2023, 13:26:39

4

Czy to ten słynny koniec rynku? Dobrze, że wystarczy otwarty przewód doktorski i nie trzeba doktoratu ( ͡° ͜ʖ ͡°)

#programista15k #datascience #sztucznainteligencja

JamesJoyce - Czy to ten słynny koniec rynku? Dobrze, że wystarczy otwarty przewód dok... — **źródło:** cuda
Pobierz

cordianss

08.09.2023, 13:35:26 via Wykop

4

@JamesJoyce: I stawka juniorska xD

NoName4891

08.09.2023, 13:44:50 via Wykop

16

@JamesJoyce: doktoranci z IT to najczęściej frajerzy nieznający rynku komercyjnego, także łatwo im przekazać, że taka oferta może być atrakcyjna.

pablos255

04.09.2023, 19:59:04

0

#studbaza #studia #pytanie #analizadanych #sql #datascience #analizadanych

Cześć, wybieram się na studia II stopnia związanych z pracą na danych (jestem po finansach i rachunkowości) Myślałem nad ekonometria bądź analiza danych, czy Waszym zdaniem jest to dobry wybór pod względem atrakcyjności na rynku pracy ? Aktualnie pracuje w banku na stanowisku raportowania.
Jaka ewentualnie polecacie uczelnie w Wawie pod kątem powyższej specjalizacji?

cohontes

04.09.2023, 20:06:16 via Wykop

2

@pablos255: ekonometria to praktycznie obecne "data science", które już nie jest takie sexy ze względu na to, że naprodukowało pełno osób, dla których nie ma pracy bo okazuje się, że nie ze wszystkiego da się zrobić model.

Lepiej odpowiedz sobie co cie interesuje na tych studiach, czy cos gieldowego, czy rzezy zwiazane z analiza, czy rynki kapitalowe itd. Bo sama atrakcyjnosc rynku pracy nic nie znaczy bo wszedzie mozna miec dobra

pablos255

05.09.2023, 14:27:18 via Wykop

0

@cohontes: wcale się nie dziwię, no nic muszę pomyśleć jak tak, dzięki ;)

mirko_anonim

31.08.2023, 09:19:12

1

✨️ Obserwuj #mirkoanonim
Dzień dobry, mam kilka pytań o proszę was o pomoc/opinię.
1. Pracuję obecnie jako analityk danych. Więcej tutaj Pythona, Pandasa, scikit-learn, AWS, SQL niż jakichś PowerBI - czyli bardziej data science. Jest to moja pierwsza praca, niedługo będę miał 6 miesięcy doświadczenia. Niedługo również kończy mi się umowa, którą najprawdopodobniej zarówno firma jak i ja będziemy chcieli przedłużyć. Obecnie zarabiam minimalną - zastanawiam się jaka jest realna kwota, jaką

Romska_Palo_Ul_Laputa

31.08.2023, 09:51:23 via Wykop

5

@mirko_anonim: niemiecki to największy scam ever. Zaczyna się już w podstawówce gadaniem, jakie to istotne dla przyszłych pracodawców. W praktyce, zwłaszcza w IT, nikt o to nie daje #!$%@?. Jeśli nie planujesz kariery germanisty albo wyprowadzki do krajów DACH to tylko strata czasu. Koleś, co wtopił tak z 8-10 lat nauki, doszedł do wprawy B1-B2 i do niczego mu się to w życiu nie przydało here. Nawet w niemieckich firmach, do

brakslow

31.08.2023, 18:28:55 via Wykop

0

@mirko_anonim: ja bym powiedział, że minimum 50pln/h. Od podobnej kwoty zaczynałem kilka lat temu. Nie mając studiów i doświadczenia. Przechodziłem z innej branży. Jak robili rekrutacje u mnie w firmie, to stawki dla ludzi z doświadczeniem zaczynały się w okolicy 10k, przy umowie o pracę. Poniżej nikt nie chciał przyjąć oferty.
Ogólnie najlepiej złożyć wypowiedzenie. To zawsze dużo zmienia i pieniądze na podwyżkę sie znajdują. Chyba że macie krucho z pracą.

JamesJoyce

28.08.2023, 19:15:18

2

OpenAI ogłosiło "firmową" wersję ChatuGPT. Ma ona zapewniać większe bezpieczeństwo, niezawodność czy czy prędkość.
Wydaje mi się, że od dawno wiadomo było, że OpenAI pójdzie w tę stronę, tzn. będzie sprzedawać lepsze rozwiązanie firmom.
Może się też okazać, że darmowa wersja będzie coraz bardziej ograniczana z czasem.

Kolejny krok do pozbycia się #programista15k ( ͡° ͜ʖ ͡°)

https://openai.com/blog/introducing-chatgpt-enterprise

#programista15k #sztucznainteligencja #chatgpt #si #datascience

Volantie

28.08.2023, 20:41:39 via Android

0

@JamesJoyce a to nie jest tak, ze jak wprowadza regulacje to i tak beda musialy ten produkt przyciac do przepisow, ktore beda?

JamesJoyce

28.08.2023, 20:51:31 via iOS

1

@Volantie No właśnie nie wiem jak to będzie wyglądało. Może być tak że jak firmy zobaczą ile można zrobić, będą bardziej chętne na ustępstwa.

piotrlionel

25.08.2023, 20:23:52

0

Mirabelki/Mirki polecają jakiś bardziej złożony kurs Pysparka /apache sparka z pythonem. Środowisko to databricksy osadzone na Azure. Niby człowiek pisze ale z googlem i bym przejrzał fajne materiały żeby uporządkować wiedzę i ciut lepiej pisać kod ;). Niby działa ale wstyd PRy wystawiać.
#programowanie #bigdata #datascience #programista15k

rusin

25.08.2023, 22:05:01 via Wykop

1

Z bardziej złożonymi jest problem - jest zatrzęsienie kursów "Hello World"-owych, ale to wiedza, którą pewnie już masz.
U mnie w robocie robili https://www.databricks.com/learn/training/catalog/apache-spark-programming ale to też raczej podstawowa wiedza. Gdybyś coś bardziej sensownego znalazł, to daj znać (kursy na udemy z tego tematu są kiepskiej jakości).