CIO Tech Eksperten IT-JOB IT-Kurser Events Podcast Søg

Log ind eller opret profil

Du kan også logge ind via nedenstående tjenester

mergelspir Seniormester

08. maj 2025 - 16:32 Der er 11 kommentarer

Seleniumspørgsmål vedr. getText()

HTML-kode:
<div class="ccc">
<ul>
<li>a b c d</li>
<li>a b c d</li>
<li>a b c d</li>
</ul>
</div>

Java-Selenium kode:
WebElement ccc= driver.findElement(By.cssSelector("div.ccc"));
List<WebElement> ulList = ccc.findElements(By.tagName("li"));
for(int j = 0; j < ulList.size(); j++) {
String txt = ulList.get(j).getText();
System.out.println(ulList.get(j).getText();
}

Uddata:
a b c d
a b c d
a b c d

Forventet uddata:
a b c d
a b c d
a b c d

Spørgsmål 1:
Resultatet er "Uddata". Men som jeg har forstået getText(), så burde den returnere alt mellem <li> og </li>, dvs "Forventet uddata".
Er det muligt at få "Forventet uddata"?

Spørgsmål 2:
Det, jeg egentlig er interesseret i, er at få adskilt det, der står mellem og , og det der stå udenfor .
Hvordan gør jeg det?

Jeg håber, at spørgsmålet er i den korrekte kategori.
På forhånd tak.

Synes godt om

arne_v Ekspert

08. maj 2025 - 16:51 #1

Dokumentationen:

https://www.selenium.dev/selenium/docs/api/java/org/openqa/selenium/WebElement.html#getText()

siger "Get the visible (i.e. not hidden by CSS) text of this element, including sub-elements".

Det kan vel godt betyde tekst uden tags.

Synes godt om

arne_v Ekspert

08. maj 2025 - 16:53 #2

Du må kunne finde strong indholdet via:

ulList.get(j).getElement(???)

eller:

ulList.get(j).getElements(???)

Jeg ved ikke helt hvad ??? skal være da jeg ikek kender Selenium.

Synes godt om

arne_v Ekspert

08. maj 2025 - 19:07 #3

Lidt hurtig eksperimenteren kom op med:

som finder strong delen.

Desværre kan jeg ikke bruge teknikken til at hapse ikke-strong delen med da Selenium findElement(s) kun vil finde elementer ikke text.

Synes godt om

arne_v Ekspert

08. maj 2025 - 19:08 #4

Men jeg er ikke den eneste:

https://stackoverflow.com/questions/39741076/how-to-use-selenium-get-text-from-an-element-not-including-its-sub-elements

Synes godt om

arne_v Ekspert

08. maj 2025 - 19:09 #5

Kan du evt. som workaround tage getText() og så fjerne alt der kommer fra sub elementerne (der jo kan findes)?

Synes godt om

mergelspir Seniormester

08. maj 2025 - 19:50 #6

Ad #3:

Jeg finder "strong" på denne måde:
for(int j = 0; j < ulList.size(); j++) {
String txt = ulList.get(j).getText();
String strong = (ulList.get(j).findElement(By.tagName("strong"))).getText();
System.out.println("strong:"+strong+", txt:"+txt);
}

Ad #5:

Ja, det er den workaround, jeg arbejder med i øjeblikket, men jeg havde forventet, at Selenium var lidt mere fleksibel.

Jeg er iøvrigt behørigt imponeret over, at du har fundet en løsning så hurtigt. Indlærlingskurven er noget stejlere på Selenium, end de fleste andre testværktøjer.

Synes godt om

arne_v Ekspert

08. maj 2025 - 20:45 #7

Jeg fik lige en ide.

XPath kan godt finde direkte tekst. Det er et selenium type check som driller.

Men man kan jo skifte til ren XML parsing!

public static String grabNonElementText(String xmlstr) throws ParserConfigurationException, SAXException, IOException, XPathExpressionException {
DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
DocumentBuilder db = dbf.newDocumentBuilder();
Document doc = db.parse(new InputSource(new StringReader("<fake>" + xmlstr + "</fake>")));
XPath xpath = XPathFactory.newInstance().newXPath();
return (String)xpath.evaluate("text()", doc.getDocumentElement(), XPathConstants.STRING);
}
...
WebElement ccc= driver.findElement(By.cssSelector("div.ccc"));
for(WebElement li : ccc.findElements(By.tagName("li"))) {
String txt = li.getText();
System.out.printf("txt = %s\n", txt);
for(WebElement elm : li.findElements(By.xpath(".//*"))) {
System.out.printf("%s -> %s\n", elm.getTagName(), elm.getText());
}
String html = li.getDomProperty("innerHTML");
System.out.println(html);
String dirtxt = grabNonElementText(html);
System.out.println(dirtxt);
}

Ja - det er ogs[ et hack, men måske lidt pænere.

Synes godt om

arne_v Ekspert

08. maj 2025 - 21:02 #8

Eller hvis der er flere text segmenter.

public static List<String> grabNonElementTexts(String xmlstr) throws ParserConfigurationException, SAXException, IOException, XPathExpressionException {
DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
DocumentBuilder db = dbf.newDocumentBuilder();
Document doc = db.parse(new InputSource(new StringReader("<fake>" + xmlstr + "</fake>")));
XPath xpath = XPathFactory.newInstance().newXPath();
NodeList n = (NodeList)xpath.evaluate("text()", doc.getDocumentElement(), XPathConstants.NODESET);
List<String> res = new ArrayList<String>();
for(int i = 0; i < n.getLength(); i++) {
res.add(((Text)n.item(i)).getData());
}
return res;
}

Synes godt om

mergelspir Seniormester

08. maj 2025 - 21:27 #9

XML parsing er udelukket.
Det er en del af en omfattende regressionstest, så jeg er bundet til Selenium.

Selenium er iøvrigt udmærket til regresstionstest. Jeg har stærkt på fornemmelsen, at der er en bedre måde at gøre det på, og det generer mig, at jeg ikke kan finde den "rigtige" løsning.

På et tidspunkt, når testen er færdig, så er der sikkert en, der spørger: Hvorfor gjorde du ikke bare..., og så siger jeg Nååh ja, hvorfor tænkte jeg ikke på det...

Synes godt om

arne_v Ekspert

08. maj 2025 - 22:10 #10

.getDomProperty("innerHTML") som henter den rå HTML mellem <li> og </li> ud er Selenium.

Det er så bare hvordan man parser den rå HTML. XML parser er indbygget i Java og er en robust løsning, men der der er andre måder at lave den parse på.

Synes godt om

arne_v Ekspert

08. maj 2025 - 22:16 #11

Hvad med en helt banal split?

WebElement ccc= driver.findElement(By.cssSelector("div.ccc"));
for(WebElement li : ccc.findElements(By.tagName("li"))) {
String txt = li.getText();
System.out.printf("txt = %s\n", txt);
for(WebElement elm : li.findElements(By.xpath(".//*"))) {
System.out.printf("%s -> %s\n", elm.getTagName(), elm.getText());
}
String html = li.getDomProperty("innerHTML");
System.out.println(html);
for(String dirtxt : html.split("<.+?>.*?</.+?>")) {
if(dirtxt.length() > 0) {
System.out.println(dirtxt);
}
}
}

Synes godt om

Ny bruger Nybegynder

Din løsning...

Tilladte BB-code-tags: [b]fed[/b] [i]kursiv[/i] [u]understreget[/u] Web- og emailadresser omdannes automatisk til links. Der sættes "nofollow" på alle links.

Følg dette spørgsmål

Opret Preview

Programmeringssprog kurser

Kurser inden for grundlæggende programmering

Se alle Programmeringssprog kurser

Flere spørgsmål fra Java kategorien

Titel	Indlæg	Oprettet	Seneste aktivitet
Programmering: Produktmixoptimering Af OBS i Java	34	23/05/202513:55	27/05/202518:32
eclipse Af OBS i Java	0	02/05/202512:51	-
eclipse Af OBS i Java	14	27/04/202521:14	28/04/202521:28
eclipse Af OBS i Java	2	18/04/202517:14	18/04/202519:52
java Af OBS i Java	1	15/04/202511:49	17/04/202503:55

Se alle spørgsmål i kategorien Opret spørgsmål

Log ind eller opret profil

Hov!

For at kunne deltage på Computerworld Eksperten skal du være logget ind.

Det er heldigvis nemt at oprette en bruger: Det tager to minutter og du kan vælge at bruge enten e-mail, Facebook eller Google som login.

Du kan også logge ind via nedenstående tjenester

Alle kategorier på Eksperten

Seneste artiklerRSS

06/06

Test: Små bokse gør dit gamle anlæg trådløst – med ét klik

06/06

Alvorlig sårbarhed hos Cisco: Rammer de store cloud-platforme

06/06

Google advarer om omfattende dataafpresning: Hackere angriber Salesforce-brugere verden over

06/06

Nørgaard: Deres EPJ-system kostede lidt over 10 euro per indbygger. De syv var EU-tilskud og resten kom fra effektiviseringer på hospitalerne

06/06

Fra Grønland til det centrale København: Vi har fundet 12 job, som du kan søge netop nu

06/06

EU lancerer ny digital strategi uden USA: Kritiseres for at være uden substans

06/06

Microsoft afviser at have lukket for ICC’s tjenester: Sagen fortsætter dog med at skabe usikkerhed i Europa

06/06

Dansker var med til at udforme udskældte regler: Kalder nu selv GDPR for "uegnet til opgaven"

06/06

Danske virksomheder tøver, mens kvantecomputing rykker tættere på: "Vi er få år fra gennembruddet"

06/06

Bog: Hvem vogter algoritmerne?

06/06

Danmarks fem dygtigste CIO'er er enige: Det er blevet lettere at hyre de rigtige it-professionelle

Vis flere artikler

IT-JOB

TV2

Specialist til Produktionssupport i TV 2

Region Midtjylland

Bliv en del af et dynamisk IT-landskab og gør en forskel i sundhedssektoren

PensionDanmark

Data Scientist til AI teamet i PensionDanmark

Comby Denmark A/S

Service Delivery Manager til spændende stilling i Grønland

Sikkerhedsstyrelsen

Vil du lede digitale projekter, der gør en forskel for borgere og virksomheder? Bliv IT-projektleder i Sikkerhedsstyrelsen

Vis flere jobs

Seneste spørgsmål Seneste aktivitet

I dag 14:49	synology surveillance Af johnnylassen i Andet sikkerhed
I dag 10:53	Podcast fra DR : "Han havde lovet at skrive" Af Ikke-ekspert i Fri debat
I går 14:59	Microsoft 365 Copilot-appen Af ole falsted i Andet software
I går 14:21	Jeg kan ikke få min SD-kortlæser til at virke eller finde den Af gunnarb i PC
07/0617:29	Sortere og omdøbe bulledserie?? Af brasso i Billedbehandling