Home | Registrieren | Einloggen | Suchen | Aktuelles


Forum » Auszeichnungssprachen » Text aus HTML-Seite auslesen Antworten
Text aus HTML-Seite auslesen

cooper
Pixelschubser


Beiträge: 14


Hallo - folgendes Problem:
ich möchte gerne Daten aus einer fremden HTML-Seite herausfiltern (keine Angst - nichts illegales). Jede Woche gibt es neue, php-generierte Informationen in meinem IE-Browser, die ich gerne filtern bzw. individuell darstellen möchte. Die interessanten Informationen sind eindeutig im Quellcode zu identifizieren.

Wie und womit mache ich
das am geschicktesten ?

Mein Denkansatz so weit:
a) Seite lokal kopieren
b) Quellcode durchforsten
c) Die interessanten Strings (bspw. "das was
nach 'Film:' steht") filtern und mit
$Variablen belegen.
d) Die $Variablen in einer DB (MySql) ablegen
e) Eine Seite via php generieren mit den
$Variablen bestückt.

Ist das okay so, und wenn ja WIE sieht die Umsetzung in a) bis c) aus? Und wenn NEIN:
ein netter Alternativvorschlag dazu?

Ich habe schon von VBA-Lösungen gehört; finde diese aber unbefriedigend. Hat jemand
vielleicht eine Idee, die mit JavaScript, Java oder php funktionieren könnte?

Zusatz: Hat vielleicht auch einer eine Idee,
wie diese regelmässige Filterung "automatisch" (z.B. jeden Montag um 12h) vielleicht in Verbindung mit einer MySql-DB funktioniert?

Vielen Dank schon mal bis hier hin <IMG SRC="/phpBB/images/smiles/icon_smile.gif">
Liebe Grüsse
Cooper

  Profil   Website   Editieren   Zitieren

schergentoni
Fachidiot


Beiträge: 143


dreh keinen film! das wird eine ganz schöne arbeit...

bis jetzt hättest du also den string "das wird eine ganz schöne arbeit..." weil's nach dem wort "film" stand. das wäre problem 1. problem 2 wäre: nach wie viel buchstaben hörst du auf? also, wie viel text kopierst du in einen string?

man müsste da schon einen ziemlich intelligenten algorithmus haben, der das machst, was du vorhast...



---

  Profil   E-Mail   Website   Editieren   Zitieren

Ehemaliges Mitglied (#4)
Foren-Team


Beiträge: 100


test 3 :smile


  Profil   Editieren   Zitieren

Tomi
Fachidiot


Beiträge: 126


das geht dann, wenn man weiß, was nach dem string kommt. Dann sucht man nach dem anfang und dem ende und alles was dazwischen ist ist dann der string.
Hab ich selber auch schon mit vbscript gemacht. Klappt ganz gut und schnell.

Wer richtig fortschrittlich ist, der packt die infos in eine xml Datei. Da kann er mit den infos machen was er will und muss sie nicht hin und herlesen.
Einfach nach dem tag suchen und schon hat man die info. per Datenbank und php oder was ihr da nehmt eine nette html machen - mit xsl schön verpacken - und fertig! :smile


MFG Tomi



---
'''''''''''''''''''''''''''''''''''''''''
http://www.triedel.de

  Profil   Website   Editieren   Zitieren

Waschbecken
Quasselstrippe


Beiträge: 290


theoretisch kannst du das schon fast knicken... warum holst du dir die datensätze nicht als xml direkt vom anbieter?

ich musste vor kurzem in vbscript datensätze aus ner email rausfiltern und tauglich für den dbimport machen... und das war schon eine arg beschissene arbeit. viel spaß dann bei ner kompletten html-seite :smile

  Profil   Website   Editieren   Zitieren

c3o
Posting-Schinder


Beiträge: 586


Spart euch die Antworten, die Frage wurde vor fast genau einem Monat schon hier beantwortet: http://forum.4websites.de/phpBB/viewtopic.php?topic=238&forum=23&2

  Profil   E-Mail   Website   Editieren   Zitieren

cooper
Pixelschubser


Beiträge: 14


stimmt - der lösungsvorschlag war "goldig". danke dafür.

  Profil   Website   Editieren   Zitieren

gule
Pixelschubser


Beiträge: 3


hi kann es sein das der Linkt

http://forum.4websites.de/phpBB/viewtopic.php?topic=238&forum=23&2


es nicht tut weil ich suche nach einer lösung für das selbe Problem...

In meinem fall soll für eine Clanpage automatisch daten aus einer Tabelle (oder auch die ganze Tabelle die auf einem anderen server liegt) übernommen werden da sich die daten immer ändern


  Profil   Editieren   Zitieren

tobias
Foren-Team


Beiträge: 708



  Profil   Website   Editieren   Zitieren
 

Antworten
Nach oben