Diplomthema: Intelligentes Extrahieren von Kontaktdaten und personenbezogenen Daten aus Webseiten

Als Studienarbeit bzw. Diplomarbeit

1    Aufgaben

Webadressen (URLs) bzw. Domänadressen liegen vor.

Das im Rahmen einer Diplomarbeit zu erstellende Programm soll alle Kontaktdaten und personenbezogenen Daten aus Webseiten extrahieren. Die gewonnenen Daten werden wahlweise in einer Textdatei oder einer Datenbank abgelegt.

Dabei sollen Daten, die z.B. per CSS unsichtbar sind, ausgelassen werden. Es sind alle beliebigen Schreibweisen von Telefonnummern, Namen, Adressen etc. zu berücksichtigen und normiert auszugeben, auch sprachabhängig, z.B. für Deutsch, Englisch und andere Sprachen.

Die Extrahierung und die Bestimmung relevanter Webdressen sind zwei Studienarbeiten, die aber auch von zwei Studenten gemeinsam durchgeführt werden können.

2   Anforderung

  • Studium der Informatik oder eines verwandten Studiengangs
  • Programmier- und Datenbankkenntnisse
  • Eigener Rechner
  • Internetzugang

3   Prinzipielle Meilensteine

  • Vertrautmachen mit dem Diplomthema
  • Internetrecherche zum Diplomthema
  • Lösungsansatz
  • Realisierung
  • Einsetzbarer Prototyp

4    Zusätzliche Informationen

  • Die Tätigkeit kann von zu Hause aus durchgeführt werden.
  • Periodische Besprechungen sind vor Ort erforderlich, ansonsten Telefonkontakt und E-Mail.
  • Monatliche Zwischenberichte.
  • Bitte bewerben Sie sich mit Anschreiben inkl. Motivationsgrund, Lebenslauf, Imma sowie relevanten Zeugnissen.

Bewerben Sie sich für eine Studienarbeit/Diplomarbeit unter


Themen: TYPO3-Web-Design,TYPO3-Optimierung,TYPO3-Homepage gestalten,TYPO3-Internetseiten erstellen,Website-Programmierung, Diplomarbeit, Studeinarbeit, Kontaktdaten extrahieren, personenbezogene Daten aus Webseiten extrahieren, Personaldaten extrahieren, Diplomthema, Informatik, Diplomarbeitsthema, Diplomthemen, Diplomarbeitsthemen, Diplomthemen, Extrahieren von Kontaktdaten.

[ ⇐ Zurück ]   [ ⇑ Nach oben ]   [ Π Drucken ]  

 

 
Diplomarbeit fertig
Was nun?
Manuskript fertig - Was nun?
Besucher:     Letzte Änderung: Saturday, 12.07.2008   Page copy protected against web site content infringement by CopyscapeCrawlTrack: free crawlers and spiders tracking script for webmaster- SEO script -script gratuit de detection des robots pour webmaster