Hente headere basert på URL

Hente headere basert på URL

Innleggav ipmil » man 28.06.2010 12:25

Er det noen måte å hente headere fra sider når man har en liste med adresser?

Adressene er bygd opp på formen http://xxx/pages.asp?action=show&pid=3215

Webmaster har ikke struktrert id etter emne så alt er litt rotete.
Ønsker at å lage en liste over headere og deretter sortere.

Brukerens avatar
medlem i 172 måneder
 

Re: Hente headere basert på URL

Innleggav myPhone » man 28.06.2010 13:15

jeg har en del screen scraping prosjekter under beltet, og hvis det kun er <title>*</title> du er ute etter kan du forsøke å bruke regular expressions, eller så kan du bruke simple html dom (kan googles).

Jeg har dessverre ikke asp erfaring (holder meg til php og det der),så kan ikke hjelpe veldig mye direkte, men hvis du kan bruke php kan du benytte deg av disse to metodene..

Du er sikker på at dette ikke er database basert da? Da kan du jo bare kjøre en query der du sorter etter en annen parameter enn id...

Brukerens avatar
medlem i 135 måneder
 

Re: Hente headere basert på URL

Innleggav debianuser » man 28.06.2010 14:57

Har ikke noen spesielle forslag, men angående html parsing og regex ta en titt her.

Brukerens avatar
medlem i 146 måneder
 


Returner til Scripting



Hvem er i Forumene

Registrerte brukere: Google [Bot]