Wpis z mikrobloga

Skopiuj link

17.02.2021, 18:53:03

#qa
#testowanieoprogramowania

Mirki, mam dziwny case do automatyzacji w pracy.

Mianowicie mam zebrać wszystkie paragrafy z cytowanych wypowiedzi na webapce i potem to wyeksportować do jsona.

Use case jest taki, że mamy w produkcie opinie użytkowników i chcemy walidowac te wypowiedzi z naszym CMS.

Jak w strukturze DOM
Imię "cytat"

Które są pod class="nazwaklasy"

Wyciągnąć wszystkie wartości, które mają cudzysłów?

Używamy js i Cypressa jako framework, próbuje to zrobić przez cy.get().contains ("").then

I potem czytać wartość ale nie działa

el_doopa

17.02.2021, 19:42:34

@milvanb: nie możesz pobrać wszystkich paragrafów a później przefiltrować kolekcje tak aby brać tylko te które zawierają cudzysłów?

milvanb

17.02.2021, 20:05:10

@el_doopa: No wlasnie jak cos takiego zrobic? Znalazlem jakas strone, na ktorej widzę podobieństwo w strukturze: https://agoldoffish.wordpress.com/criminal-minds-opening-and-closing-quotes/

do zmiennej quote podstawilem document.getElementByTag('p') i w sumie teraz musialbym to w jakas petle wziac i wyconsolowac wartości?

milvanb

17.02.2021, 20:14:10

Teraz udało mi się to wrzucić w pętlę

let allParagraphs = document.getElementByTagName('p')

for (let i = 0; i < allParagraphs.length; i++) { console.log(allParagraphs[1]) }

To zwraca mi wszystkie

Teraz muszę dodać jakiś trim, który będzie rozpoznawał " " jako coś co mnie interesuje. Tutaj musze to jakoś regexem zrobić?

henk

18.02.2021, 09:52:04 via Wykop Mobilny (Android)

@milvanb: cypress nie pozwala na użycie xpatha? Chyba pozwala...

milvanb

18.02.2021, 09:55:28

@henk: wlasnie nie chce na sztywno tego robic.

Chcialbym cos takiego:

znalezc wszystkie elementy , potem to przeksztalcic w tekst i iterowac po kazdym w ktorym znajde wyrazenie regex z tym cudzyslowem

No i generalnie nie wiem jak to napisac, bo mam document.querySelectorAll('p')

henk

18.02.2021, 10:35:43 via Wykop Mobilny (Android)

@milvanb: co to znaczy na sztywno? co to za różnica, czy weźmiesz wszystkie paragrafy xpathem, czy CSS selektorem? Żadna. Za tą xpath od razu pozwala ci znaleźć tylko te nody z cudzyslowiem //p[contains(text(), '"')]

No i w ogóle to bez sensu brać wszystkie paragrafy, skoro interesują cię tylko te, które mają jakąś klasę, czy tam jakiś ich rodzic ma konkretną klasę.

milvanb

18.02.2021, 10:55:07

@henk: w sumie z tej strony na to nie patrzyłem. Chodziło mi o to, że możnaby zrobić coś takiego, że iterujemy po domie w poszukiwaniu wszystkich "", bez tego zagnieżdżania w . I wtedy niezależnie jak dev by napisał atrybuty, wtedy bankowo będzie działało

RVP20

milvanb

18.02.2021, 11:43:09

@henk: hm, nadal nie wiem co zrobic, bo rzeczywiscie xpath tutaj wylapuje tylko te paragrafy, ktore maja cudzyslow. I co dalej :(

henk

18.02.2021, 12:04:15

@milvanb: no przelatujesz po kolekcji tych webelementów i wywołujesz na nich element.getText().match('".+"')[0] czy tam innerText zamiast getText() bo nie wiem co tam w cypresie jest do zbierania tekstu z webelementu.

A jak element jest bardziej skomplikowany, że innerText nie zwraca tego co chcesz, to zawsze możesz użyć .childNodes[i].nodeValue

milvanb

18.02.2021, 15:12:39

@henk: a kurde, chyba za glupi na to jestem :D

Przegrywek123

18.02.2021, 16:19:15

@el_doopa: weź tak -
- pobierz kolekcję wszystkich elementów z klasą "class="nazwaklasy""
- przefiltruj ją pod kątem spełniania warunku element posiada dziecko lub sam posiada ciąg znaków który #!$%@? coś na takim regexpie "([^"]*)"

to będzie:

const matchedParagraphs =
[...document.getElementsByClassName("toggle")]
.filter(par => par.outerText.match(new RegExp('"([^"]*)"')) })

milvanb

18.02.2021, 17:31:17

@Przegrywek123: hm, mam cos podobnego, ale nadal nie nie działa :(

el_doopa

18.02.2021, 18:46:39

@Przegrywek123: ale po co mnie wołasz a nie OPa?

Przegrywek123

19.02.2021, 06:12:35

@el_doopa: a bo mi się pomyliło, przepraszam :<

Aktywne Wpisy

rozowypasiak

rozowypasiak +129

5 godz. i 32 min temu

Oddajcie mi stary dobry wykop! Coście z tym portalem uczynili ( ͡° ʖ̯ ͡°)

Główna to jakiś dramat - fake newsy i clickbaitowe tytuły jak z portalu na O, a podobno kiedyś byli tu świadomi użytkownicy, którzy nie dają sobie wciskać kitu ( ͡~ ͜ʖ ͡°) #pdk

Mirko świeci pustkami, a jak już ktoś coś ośmieli się coś dodać, to spora część komentarzy jest